01 简史:互联网风云背后的人工智能生长(第6/8页)

数据大道

有位哲学家说,人类是一种“在路上”的存在。百度积累了海量的地图数据,辅以设计师的智慧和各种精巧算法,可以描绘出人类的各种移动行为,感知人们在路上的生存状态。

百度地图每日位置服务次数最高突破720亿次,每一次都是人类的活动记录。图1-6是北京中关村一天的通勤记录的数据化展示,奔涌的交通热力图和节奏,仿佛这座城市的生命脉搏。

图1-6 北京中关村一天的通勤记录

注:使用手机百度或智能革命App扫描图片可见AR效果。

地图之眼具有大视野,通过图1-7,可以感受到中国中部、西部地区的发展态势——西安、郑州、武汉、合肥与北京、上海、深圳等一线城市的联系越来越紧密。

图1-7 城市间交通热力排行图

我们这一代人都听过童安格的歌:“为了生活,人们四处奔波,却在命运中交错。”我希望在人工智能的帮助下,人类的轨迹不只是交错,还有交集,汇流成河,生生不息。

百度大数据实验室一位年轻的科学家是学生物学出身,之前在普林斯顿研究鱼群的运动规律,一看到百度迁徙图就决定回国了。他说,原来人的数据也可以像鱼群这样研究,而且更方便,所以他决定来百度工作。2016年,他和同事一起利用百度地图上的搜索数据变化状况,准确预测了iPhone(苹果手机)销售量的下降。通过数据,大数据实验室为各种城市生活、企业运营提供智能感知。

2014年交通运输部提出:要深化改革,务实创新,加快发展“四个交通”,加快建设市场导向、企业主体、产学研结合的行业技术创新体系,促进科技成果转化为交通运输生产力。着力建立多渠道、多方式的交通运输出行信息服务体系,初步建成综合交通出行信息服务平台,向社会即时发布出行信息,解决出行信息不畅等问题。

在此背景下,百度提出了“中国智慧交通云服务平台合作计划”,与交通运输部公路科学研究院、国家智能交通系统工程技术研究中心共同打造合作平台,依托交通运输部重点科技项目“基于云平台的开放式公共出行信息服务研究与示范”,激活现有数据,建立部省数据信息资源共享交换机制,促进政企间出行服务信息共享应用,并对全社会开放。

智能地图可以根据用户移动快慢测量道路的拥堵程度,还可以智能规避单双号限行路线。结合虚拟现实技术,可以让人身临其境般寻找路线。以交通大数据为基础,加上算法辅助,响应交通管理部门的需求,智能地图系统已经能为城市交通缓解提供解决方案,大大减少了交管部门的压力。

智能地图对地理数据的收集使得很多智能项目得以展开。达到厘米级精度水平的高清地图技术已经运用到无人车开发中。2016年世界互联网大会上,百度无人车在乌镇进行了公开测试和试运营。体验全程3.16公里,共经过3个红绿灯以及一次掉头,不仅面临人车混行、电瓶车穿行等多种复杂路况,还需应对中雨、薄雾、雾霾等多种天气状况。这个结果丝毫不落后于硅谷同行在北美进行路测的进度。这是无人车的一小步,但必将成就人工智能的一大步。

人工智能不是从天上掉下来的,正是从几十年来计算机网络技术和数据处理技术的进步以及人类的数据生活之中水到渠成的。百度搜索和百度地图的智能化发展就是这个过程的一个缩影。

人工智能既不是神话也不是笑话

如今各种大众媒体上关于机器人的新闻很多,凑热闹的也很多。比如前阵子有新闻报道,一个展会上有一台机器人伤人。其实那只是一个教育辅助机器人,掉下台砸到人而已。还有某个墓园买机器人给守墓保安壮胆的新闻,那个机器人充其量是个玩具而已,恶搞成分更多。如果我们以科普的心态看待历史,就会发现人工智能既不是神话也不是笑话,而是从人类的劳动创造中实实在在生长出来的。我们不需要恐惧也不需要顶礼膜拜。

人工智能领域的科学家对技术的描述常常是直白而谦虚的。谷歌前工程师吴军说过,他在2003年的时候和同伴一起把谷歌的关键词搜索准确率大大提升,解决的一个主要问题就是,对于同义词或者近义词究竟该选取哪一种意思去搜索才能满足用户的需求。对于用户来说,如果搜索给出的结果不准确,用户就会换个近义词继续搜索,或者选择搜索结果中排名并不靠前的结果。这时用户其实亲自做了一个关键词搭配工作,系统会记录下用户给出的关键词搭配关系,现在要做的是更快、更优地反馈结果。他说:“至于我们是怎么做到的,说起来可能会显得很没有技术含量,我们事先把多年来用户搜索过的关键词搭配都整理出来,然后在2003年美国独立日的长周末期间,有四天的假期,我们停掉了公司当时五个最大的数据中心中的一个,利用四天时间对每一个关键词的搭配做了特殊处理。这实际上就是一种穷举法。”[3]也就是把用户经常选择的词语组合关系固化下来,下一次用户再做类似搜索,系统就能更快、更准地给出结果。

其实机器翻译等领域的技术逻辑,跟上述搜索中应用的有策略的穷举法有异曲同工之妙。据《纽约时报》报道,2016年6月的一个星期三,在谷歌翻译部门的会议上,人们对百度发表在机器翻译领域核心期刊上的一篇文章议论纷纷。迈克·舒斯特(Mike Schuster)的一句话让会议室恢复了秩序,“是的,百度出了一篇新论文。感觉就像有人看透了我们做的东西——论文有类似的结构,类似的结果。”百度公司的BLEU分数(一种衡量机器翻译和纯人工翻译之间准确度的分数)基本吻合谷歌在2月和3月内部测试中取得的成绩。Quoc V. Le (夸克·维·乐)并未感到不快。他的结论是,这是一个表明谷歌处于正确轨道上的迹象。“这个系统与我们的系统非常相似。”他安静地说。

Quoc V. Le是吴恩达的博士研究生,他可能并不知道,这篇论文的出炉与吴恩达并无关系,而是自然语言部门独立完成的。《纽约时报》对中国企业的报道当然是一扫而过。但吴恩达认为,国内部分媒体也需要改变习惯,不能总是下意识地认为什么技术都是外国更强,热衷于把后知后觉者当作突破者来报道,实际上人工智能领域很多领先创造都是中国人先做到的。