一个华人数学博士,16年前如何押准中国大数据变革?

发布者:系统管理员发布时间:2018-01-14浏览次数:2803

转载自:DT财经  原文作者:胡世龙

如今,我们每个人都在谈论“数据科学”,《哈佛商业评论》杂志甚至将数据科学家定义为“21世纪最性感的职业”。在这个大数据时代,究竟什么是数据科学?数据科学家又究竟是怎样的一群人?他们在创造着什么令人着迷的东西?DT君将在2018年走访50位来自各行各业的顶尖数据科学家,希望能让你们了解这些神奇的人和他们的神秘事儿,为你们一窥数据科学的未来与未知。

1990年的一天,一位即将博士毕业的华人学生站在加州大学伯克利分校的萨瑟塔(Sather Tower)上向远方眺望。这所出过近百位诺奖得主的顶尖学府的标志性建筑于1914年建成,见证了近一个世纪的潮起潮落。而将同样被见证的,还有20年后横跨太平洋的一场大数据变革。

这是个满城尽谈大数据的时代,各种大数据的创业公司多如牛毛。

但如果时间倒转回16年前,情况可就不同了。当时,美国互联网泡沫(Dot-com Bubble)刚刚结束,刘强东的京东还在中关村做着光磁产品代理,马云还在构思一个叫做淘宝的个人网络购物网站。

这时候要是有人说要在中国做一家数据公司,你会怎么看?

有个人就这么做了,而且理由是“我想办的公司要和数学相关,除了数据挖掘想不到什么更合适的”。

说出这话的是那个曾经站在萨瑟塔上的华人学生,他叫宣晓华,一个押对了这场中国大数据变革的人。

(图片说明:加州大学伯克利分校标志性建筑萨瑟塔 | 图片来源:Hui Hui)

他2002年创立的华院数据,16年间,从几人发展到近1000人,并且在公司体系内成功孵化了20多家各垂直领域的大数据创业公司。

在成立的前10年,公司没有融资,却成功度过了大数据的“萌芽期”。这背后,宣晓华是怎样的一个人?华院又是怎样的一家公司?

因为数学,爱上数据

上海中心城区东北角的杨浦五角场地区,一直以来都以高校众多、创新氛围浓厚著称。12月初的一个午后,在离杨浦创新地标创智天地一路之隔的一幢大厦内,DT君见到了刚刚开完会的华院数据创始人宣晓华。他的另一个身份是中国工业和应用数学学会副理事长。

待人谦和、偶尔微笑、略带浙江口音的普通话,是他给DT君的第一印象。而在DT君接触的华院几位员工看来,低调、爱给员工讲数学,则是宣晓华的另外两个“标签”。

宣晓华对数学的喜好,从小就开始了,后来一直延续到大学、硕士。再后来他又赴美国加州大学伯克利分校攻读数学博士。这所名校曾经走出了国际数学大师、微分几何之父、沃尔夫数学奖(数学界的诺贝尔奖)得主陈省身等华人数学家。

一切都顺理成章,宣晓华走得原本是一条外人看来极为学术的路线,但因为在博士期间跟着导师接触了相对偏向应用的计算数学(Computational Mathematics),跟美国工业界有了更多接触,这条路线发生了转变。

当时,计算数学虽然研究的主要是算法相关理论,与各种方程、算法打交道,但却是当时美国工业界的大企业所迫切需要的。这门学科在电路仿真、航天航空、机械设计、金融等环节,都十分重要,在当时算是热门的专业方向。

等到毕业后,宣晓华顺利进入了当时如日中天的惠普公司,从事电路仿真方面的算法研究和大型软件开发。

“当时惠普公司内部也有一些人在做类似数据分析的工作,但相对简单。而我们做的事是怎么样通过计算,帮助工程师更快更好地做产品设计,有点像现在的机器学习中的一种底层的支撑。”宣晓华解释道。

1997年香港回归了祖国,在惠普工作了7年的宣晓华也做出了相同的决定——回国。

谈及原因,宣晓华坦承,90年代中国蓬勃发展的形象已经让他颇有感受。“当时,中国发展很快,我就想回去经历一下,但说实话,在回国前其实并没有什么大的计划。也许工作一段时间后,又回去(美国)了。”

在他看来,也许在惠普工作可以让自己生活地很好,但却少了些价值。“计算数学在美国的应用、电路仿真方面的人才相对较多,是个很成熟的领域。而在中国,这个领域一直很少人愿意做。”

我们应该都听说过百度李彦宏放弃美国的生活、被妻子逼回国创业的故事。

宣晓华的故事则是另外一个版本:他是主动回的国,而且一开始也没想过要创业。

直到在国内企业做了几年技术总监后,2002年,宣晓华才下定决心牵头做些事情。他们在上海创办了华院数据,员工一开始只有几个人,办公室也不大,但宣晓华却始终觉得,数据这件事,有未来。

在创业之前,对于做什么,他其实也有过思考,但想来想去,还是要符合两点:一是要和数学有关,因为自己的专业是数学,这也是自己希望继续从事的;二是要有市场。

当时能同时符合这两点的选择很窄,最直接的就是数据挖掘(Data Mining),既能用到算法,也有一定的市场。

“那时,互联网还不算是一个数据的主要来源,但信息化却是很多企业都有了的。银行、证券业的核心业务系统等,都会产生一些数据。”

(图片说明:宣晓华在一个签约仪式上分享其对数据及人工智能的看法。)

宣晓华当时对中国大数据的未来很有信心。“我觉得数据量级趋势是越来越大,不仅是公司里面,在政府、企业、金融体系里面,数据量越来越多。而这个时候,如果有一家公司能够帮助企业把数据变成价值、增加收入,还能帮助决策,这样的生意应该是可以做的。”

16年前为何无风来?

2002年,国内很少有人有大数据的意识。以现在的眼光看,当时要做一家数据公司肯定很难,但机会往往就在你认为最艰难的地方。

有数据意识的公司少,意味着你更不容易找到你的客户。宣晓华找了两个行业作为切入口,一个是金融,一个是电信。这两个行业当时在国外已经有了相对成熟的数据挖掘经验,而国内的企业也许会有通过数据分析服务于营销、扩大市场份额的需求。

但进一步接触后,宣晓华发现,当时的金融企业如银行等,对数据的分析处理需求并不大,没有这些“好像大家仍然活得很好”。而当时在国外,银行对数据分析处理的意识已经很强烈了。

在服务过少量的金融客户后,华院快速调整了业务方向,将主要突破口转向电信行业,这一次,果然找对了路。

2000年之后,中国电信行业发展很快,这体现在用户数的节节攀升。而其中,中国移动恰巧又是一家“好学”的公司,愿意尝试各种新的方法,最重要的是,这家公司也肯投入资金。这给华院这样做数据分析的初创公司提供了很大的机会。

大的全国性业务难以拿下,那就从省级公司做起,“各个击破”。新疆移动是华院的突破口,基于对方的内部经营分析系统留存的数据,做数据的整合分析,并分析用户的消费行为、使用偏好等,进而给出营销的具体建议。后来这样的合作又扩展到几乎所有的省级移动公司。

具体会给移动运营商提出哪些建议呢?宣晓华略有思索,回忆了两个他觉得可能跟每个手机用户都相关的业务:“比如会基于数据分析,向运营商提供资费套餐的建议,另外还推出了一种叫做“信用评分”的业务——也就是现在大家日常接触到的话费授信额度。”

这样的服务,华院一直做了7、8年。也正是靠着在电信行业的持续耕耘和稳定的业务来源,公司度过了大数据“萌芽期”,不仅稳定了下来,业务规模也越来越大,也开始进入新的业务领域,并且有能力孵化新的公司。

直到2010年,公司才真正意义上涉足第二个领域——电商。一来,当时中国电商开始起步,发展迅速,二来,曾经的移动业务也越来越不足以满足公司发展的需求。

“电商和移动运营商不同,运营商可以一次性付100万让你做一个项目,但电商的付费能力相对较弱,可能只是付几万块钱。”对此华院有着不同的应对战术。“你会发现这些电商商家的学习能力非常强,他们的竞争非常激烈。因此只要我们能推出好的解决方法,只要能对他们的业务有意义,他们就会很乐意去使用。”宣晓华点出了电商商家的特点。

华院推了一些针对中小网商的数据分析产品服务,希望靠“长尾效应”在电商领域打开一片新天地。

不仅仅是电商,按照华院方面的资料,后来公司的业务陆续扩展到了金融、电信、医疗、零售、电商等多领域,到2016年,实施的各种项目总计已超过600个。

( 图片说明:2012年,华院完成A轮融资,红杉资本参与其中)

一般而言,创业公司对外部资金的渴求往往都十分强烈。但在华院数据的发展过程中,有一点值得一提:成立的前10年内,公司没有对外融过资。

直到2012年,才有红杉资本的A轮资金注入。

对此,宣晓华的回答很直接:“公司成立后的前些年也没有人太关注数据这个领域,我们也没有去积极找投资。”

“另一方面...”宣晓华稍有停顿,这也是他态度严谨的一面,“是自己对外部投资也有一些顾虑,拿了别人的钱,对方肯定希望你发展得很快,但我们当时觉得,并没有那么多的行业愿意接受数据相关的产品服务。”

在DT君看来,围绕自己兴趣,不盲从接受外部资本的“指挥”,而是坚持自己的发展方向,这些特质和宣晓华的个性不无关系。

即便是公司规模越做越大、并且有了外部资本的助力,宣晓华对公司的发展仍旧有着坚持,并且做了一些独特的尝试。

2014年,华院数据开始深度孵化垂直领域的大数据公司,除了为创业者提供方向、资金、辅导外,华院顾问和技术团队也参与孵化,与创业者探索商业模式和新技术。

到目前为止,在这套模式下,公司已经成功孵化了华院分析、杭州数云、数尊等近20多家大数据应用公司,涉足互联网金融、医疗、风控征信、智能教育、时尚文化等多个领域。

“这种模式可以说是我们独创的,是一种新的企业管理模式,过去传统的企业内部大多都是事业部的形式,我们打破了这种模式,采用的是成立许多独立的公司,这是一种新的企业生态。”宣晓华曾经接受媒体采访时如此说道。

下一步:数据+智能

在交谈中,宣晓华毫不掩饰自己的数学情结。在他看来,数学本身是一个非常基础的学科,也是更深层次的应用的基础。包括人工智能等,都离不开基础的算法理论支撑。

(图片说明:宣晓华在中英开放数据与大数据论坛上演讲)

他这样想,也这么做了。

他跟自己博士时的导师史蒂文·斯梅尔(Stephen Smale,1996年美国国家科学奖、数学菲尔兹奖和沃尔夫奖得主)合作,发起成立了斯梅尔数学和计算研究院(Smale Institute of Mathematics and Computation)。

研究院研究的是偏基础理论的课题,但也是相对长远的。“虽然是基础的研究,不一定有经济上的效益,但也许未来有一天,就可能在特定领域孵化出新的业务。”他补充道:“做这件事更多还是自己的兴趣,我也希望我自己的员工能够在做技术开发的同时,也能接触一些更长远的研究。”

(图片说明:宣晓华(左)与导师史蒂文·斯梅尔(中),后者是1966年菲尔兹奖及2007年沃尔夫奖得主。)

一方面是加强基础的研究,另一方面则是在最前沿的领域谋求突破。

宣晓华表示,“数据+智能”会是公司未来最重要的方向。目前,公司已开始着力研发一些相对前沿的产品,比如分维(Fra+)智能画像引擎,通过小数据输入,跨学科模型智能分析,刻画立体的人,这已在金融、保险、营销广告、HR等领域实现应用。

另外,公司还开发了一款叫做华院智影的产品。这是一套基于人工智能的医学影像辅助诊断系统,目前已和上海的一些知名医院如上海胸科医院、仁济医院等有了合作,希望能帮助医生提升决策效率。

在宣晓华看来,如果人工智能技术真的能做到大规模的应用,那么无疑是颇有意义的一件事。

他也表示,公司还将持续推动孵化生态的发展,孵化出更多垂直行业应用的大数据、人工智能方面的创新公司。

回顾过去16年在大数据挖掘和人工智能领域的经验,宣晓华觉得,大数据是一种思维和方法,要有量化的思维。但是,数据有时候不够成熟,在必要时候还需要加入人的判断。

这不是他第一次提出这样的思考,他进一步解释:“我们不应该老是去关注到底有多少数据,大数据不是目标,怎么样去分析应用,让决策更好、做事更有效率、世界更美好才是目标。换句话说,也就是更加智能。”

版权所有 ©三亚学院信息与智能工程学院
地址:海南省三亚市吉阳区学院路191号   电话:0898-88385452
E-mail: iieoffice@163.com
USY信息与智能工程学院官方微信公众号
USY信息与智能工程学院官方抖音号
关闭