(本篇全部图片来自 Google I/O Keynote 2017 视频截图)
两天前,今年的 Google I/O Keynote 在美国加州山景城的海岸线露天大剧场举行。这是一年一度全球开发者的节日。大约有 7000 名观众在现场共襄盛举。每年在大会正式开始前,现场都会播放多媒体内容以娱乐提前入场的观众。前年是投影在三面墙壁上的复古乒乓游戏,去年是两位艺术家为大家演奏大地筝,今年则是大屏幕上虚拟泡泡和现场的实体泡泡一起飞舞。全球各地的观众也可以参与线上的泡泡游戏,大屏幕上循环滚动各地观众在游戏中生成的泡泡数目。山景城当时有 6000 多泡泡,记得伦敦有 300 多。当时香港已过午夜,仍然有 123 个活泼的泡泡参与这场盛会:
今年的开场音乐继承了去年节奏舒缓,旋律柔和连续,编曲空灵的风格,带给人们舒适惬意的感觉。山景城阳光强烈。烈日下暴晒两个多小时后,去年有许多与会者抱怨皮肤晒伤。于是今年 Google 为每一位现场观众准备了防晒霜。
大会主题演讲终于开始,行政总裁 Sundar Pichai 率先登台,强调 Google 始终不忘自己的使命是组织整理全世界的信息。为达成这个使命,他们的产品和服务重视规模。他自豪宣布, Google 的云储存服务 Google Drive 活跃用户已达 8 亿多,安卓用户已超过 20 亿。
从移动应用优先 (Mobile First)到人工智能优先(AI First)
紧接着 Pichai 就提出了 Google 的新战略:从移动优先到人工智能优先。
已经深度整合了人工智能的 Google 各项产品和服务包括搜索,地图,图片搜索,广告匹配,电邮自动回复,打字提示,视频节目推荐,图片的明暗自动调整,视频通讯的画质与信道质量的自动匹配,等等等等。
Google 也正致力于使人机互动的方式更自然。除了使用键盘和遥控器,还提供更多别的互动编程接口,比如声控,动作控等等。
得益于 Google 优秀的深度学习算法和海量的训练数据,Google 的语音识别准确率进一步提高,并且在嘈杂的环境下也能力排噪音善解人意。而 Google 的图像识别能力也不遑多让,错误率已经低于人眼识别。
强大的图像内容识别能力在许多场景都能转化为很实用的功能。比如照片的自动降噪,以及其他更高级更复杂的图像后期处理。比如,下面这张照片,摄影师本来站在一张铁丝网后面,铁丝网在照片上显得十分碍眼。Google 的人工智能可以自动识别并消除类似的障碍物。其实,很多图像编辑软件都提供自动降噪的功能,障碍物消除通过人工编辑也是早就可以做到,但是 Google 的人工智能使这一切变得简单易行。
基于强大的图像自动识别和处理能力,Google 向广大开发者提出一个新的动议 Google Lens。去年推出的谷歌助理 Google Assistant 整合了 Google Lens 以后,变得更为聪明能干。给谷歌助理看一张图片,她现在能够即时通报花卉种类,或者告诉你图片上的餐厅的信息,或者认出 Wifi 的连接信息以后自动帮你把手机接入网络。这一切她做得行云流水一气呵成,不需要你作出任何复杂的操作。
高度复杂的人工智能系统通常由两大模块组成:训练模块和推理模块。所谓的训练模块,其任务就是通过算法从海量数据中整理或者归纳出许多变量之间错综复杂的关系,用这些变量及其关系参数建立数学模型。而推理模块则是用训练模块中训练出来的数学模型来对新的数据进行推理或者归类。
通常,训练精准的推测模型需要巨大的算力。Google 为此专门设计制造了张量处理单元(Tensor Processing Unit,TPU)。这种计算单元正对人工智能算法作出硬件上的优化,据说比当今主流的 CPU 或者 GPU 要快 15 到 30 倍。Google 又在他们庞大的数据中心里部署了新的 TPU,以支持算力超级强大的人工智能云。任何个人或者企业可以借助 Google 的人工智能云以实施各种各样的智能应用。
为了更好执行“人工智能先行” 战略,Google 把旗下有关人工智能的资源聚合到一个新的网站
google.ai。这个网站聚焦三个领域:算法研究,开发工具和基础设施,以及应用场景。人工智能的有些算法十分高深,只有极少数的算法科学家有能力设计调试。为了推广这些算法,Google 的科学家们设计出了有能力设计算法的算法,称为 AutoML,在一定程度上降低开发者们设计高性能机器学习算法的难度。
至于开发工具与基础设施,除了上面说道的张量处理单元 TPU,Google 还有在去年推出了一个开源的机器学习平台“张量流”(TensorFlow)。开发者们可以用张量流来方便地编写人工智能程序。大会上介绍了一位来自芝加哥的中学生,借助 TensorFlow 了解机器学习,立志用图像识别技术对抗乳腺癌,帮助病患。我自己有试过 TensorFlow, 非常好用的基于 Python 的编程接口,许多常用模型的调用非常简单,的确是人工智能研究以及应用人员的得力工具。
至于应用场景,今年 Google 聚焦人工智能在医学以及生物学领域的应用:数字病理学,更为精准高效的 DNA 序列侦测,等等。
Pichai 提纲挈领的简介过后,就由 Google 各产品部门的负责人来介绍人工智能在 Google 产品中带来的新特性。今年的 I/O 重点介绍的有以下几个产品: