2016-05-19

无处不在的人工智能: Google IO 2016 Keynote 综述

对我们而言:技术,绝不仅仅是我们创造的设备或产品,因为那并不是终极目标。技术,是一种民主的力量,它所提供的信息,便是力量之源。而Google正是这样一家信息公司,成立至今,始终坚守初衷,从未改变。同时,人们对信息的运用,也不断给我带来惊喜与启迪。

Google CEO Sundar Pichai, 2016 年 4 月



又是一年一度的谷歌开发者大会 Google IO 开幕演讲时间。 今天下班以后,我早早地打开 Youtube 上的 live stream。 离开始还有一个多小时, 那个 live stream 的视频旁边的公共聊天室里就满是各种不同语言的问候。 全球几百万观众像我一样激动地期待这个全球技术圈中旗帜性年会的开幕。 离正式开始还有十多分钟, 现场直播视频就出现了。 与往年 techno 的音乐不同, 今年正式开幕以前的音乐十分柔和悠扬, 如沙滩上轻柔的浪花抚过脚背, 似乎还可以看见蔚蓝色的天际海鸥徜徉。 因期待开幕而紧张兴奋的心也顿时宁静下来。 (本篇全部图片来自网络直播的视频截图)




会场设计, 开幕序曲以及 Google Assistant 



作为技术界的翘楚举办的具有全球影响力的开发者大会, Google IO 历来每年的主会场设计也是别具匠心, 让我们提前游历未来。今年是 Google IO 举办的第十个年头, 这次的会场布置反而返璞归真。 就是在一个露天球场, 舞台上 3 块大型荧幕, 没有更多噱头。 现场大约可以容纳 7000 多名观众。

这次的开幕序曲是由两位艺术家露天表演的大地竖琴 (earth harp)音乐。 他们带来的音乐如流水琮琤沁人心脾, 给整个会场带来一种与天地万物同生共进退的开阔与和谐。







这时三块大屏幕上温柔飘摇的千丝万缕, 既为这飘忽而又细腻深情的音乐带出视觉意象, 又似乎象征着后来整个演讲中始终贯穿, 无所不在的一个中心主题: 高级人工智能全面渗透人们生活的时代已经到来。 

开场致辞还是跟前几年一样, 由 Sundar Pichai 担当 —— 他在去年刚刚升任 Google 的 CEO。 他提到, 今年有 100 多个国家的观众在此时此刻通过互联网收看这次盛会。 最大的开发者观众群来自中国, 他向一百多万在网上观看直播的中国开发者致以热情问候。

问候过后,他立刻切入正题, 讲到当今世界, 越来越多的人依赖移动设备提供的信息服务。 人们在移动设备上搜索, 越来越多人渐渐习惯语音搜索或者语音命令, 完成他们的日常任务。 而这一切, 在十年前还是不太可能。 是人工智能技术在近十年里的突飞猛进使计算机语音识别, 语义识别, 图像识别等等成为可能, 将有用信息送到人们身边。

在说到移动设备的高度普及时, 大屏幕上有展示从移动设备上传来的搜索概念。 我看到 Eurovision 2016 了, 截图作个纪念:



Pichai 说, Google 已经开始训练她们的 AI 识别嘈杂环境中的语音语义。 然后又有计算机视觉加语义搜索成果的演示。 用关键字 “拥抱” 搜索你自己放在 Google Photo 上的私人相册, Google 自动帮你找出所有含有拥抱动作的照片。 这种搜索也可以应用于动画视频。 当然还有基于图像识别的实时翻译功能,可以省去手动输入文字, 把手机镜头对牢文字就可以:




将这些人工智能应用高度整合以后, Google 在今年向大家正式推出了谷歌助理 (Google Assistant)的概念。 跟几年前推出的 Google Now 不同, 谷歌助理并不绑定于某一种硬件设备, 而是 Google 向大家提供的一种服务, 她存在于多种不同的智能设备上, 包括手机, 家电, 穿戴设备等等。 她了解这个世界, 也知道你的私人喜好和行程, 总是能够在合适的时间,地点,发出贴心的提醒或者作出适当的安排。 人工智能将会以谷歌助理的形式在当今的日常生活中与我们同呼吸共存在。

Pichai 介绍, 谷歌助理有这样三个主要特性: 健谈 (Conversational), 务实 (Get things done) 和贴心 (In your world)。  健谈是指谷歌助理具有世界最强的自然语言处理系统,基于谷歌的类神经网络和深度学习系统。 这个系统可以和人类作比较通顺的自然语言沟通。 务实是指谷歌助理的精通任务管理和时间管理。 贴心当然是指她知道你的喜好和脾气。

接下来的几段演讲, 都是用具体的硬件或者应用软件来展示 Google 的人工智能对世界的深广改变。 一般媒体喜欢聚焦 Google 在 IO 大会上发布的新硬件或者新版本软件, 但是我觉得, 这次的 IO 大会, Google 向世人再次凸显自己 “始终是一间人工智能研究公司” 的身份, 并且清楚表明她在人工智能领域当仁不让的领先地位。

 

Google Home

这届 IO Keynote 淡化硬件设备的角色。 唯一被介绍的新产品 Google Home 却有非凡的意义。 这个小小的
圆锥形设备是谷歌助手在家居生活中的一个载体。 主要有三大用处: 娱乐, 日常任务管理和请教 Google (Ask Google)。 人们可以用语音指令或者触碰来控制她。 她内置的喇叭可以用来播放音乐 —— 当然可以用语音控制, 和跟人流畅对话。 她可以控制家居的智能设备, 提醒主人各种重要事项和出行时的周边环境。 “请教 Google” 功能则把大千世界的许多知识带到家里。 大会上有播放了一段短片, 说的是在一个忙碌的早晨, Google Home 怎样与一个家庭互动, 是家庭里忠实可靠的一员。 这令我想起一部英国电视剧里的忠实仆人 Jeeves。 只不过 Google Home 上知天文下知地理, 恐怕比 Jeeves 要博学得多。




这个小小的设备要流畅控制家居电器, 当然少不了日后各大物联网设备厂商的支持。 在目前来看, 主要还是根据家庭成员的 Google Calendar 行程表作些提醒以及相关资料自动呈现工作。 但是无论如何这是 Google 进入家居领域的可喜第一步。

这个 Google Home 设备有各种颜色可供选择。 

Google Allo 和 Duo


Google 的即时通讯软件 (就是通常所说的聊天软件) Hangout 跟竞争对手相比似乎不太流行。 Google 决心在今年改变现状。 他们制作的全新的即时通讯软件 Allo, 在里面深度整合了大量 Google 无与伦比的人工智能。

比如, Allo 懂得对方讲的话的语义, 可以向你提供几个回答选项, 这样, 你不必打字, 选择怎样回答就可以。 她也懂得对方发来的图片或者影片里有些什么, 会向你建议几个回答选项。 这是我个人觉得很酷的功能, 中国的微信或者脸书的 messenger 还没有的。

当你和对方讨论某个话题时, Allo 还会适时提供建议。 比如, 附近有些什么意大利餐厅, 或者某种砾石应该是什么样子, 聪明的谷歌助理当然有附身在 Allo 上, 她的建议在 Allo 中无缝整合。 大家要查看任何事实, 不必切换到别的应用程序。



Allo 还有一个值得一提的特性是安全。 你的谈话有端对端的加密机制, 确保隐私。 在 Snapchat 上很流行的谈话内容过期删除功能 Allo 也有。

除此之外, Google 还为用户提供了多种生动有趣的贴纸。 提供所谓 Whisper Shout 功能, 字号的大小可以随时改变, 以表达语气感情 (见以上截图中的 Cool 一词)。

Google IO 令我感到贴心的是, 他们的高层永远在会上表示对广大开发人员的最大尊重与器重。每次 IO 都要反复强调, 没有开发人员的创意和努力就根本没有 Google 的今天。 这样受到重视,所以, 我们这些技术人员喜欢 Google。 就算是在中国, 都有 100 多万开发人员半夜翻墙看 Google IO。 

Google Duo 则是一款视频聊天软件, 是 Allo 的好搭档。 个人认为 Duo 最大的亮点在于她的高效视频压缩解码以及传输技术。 这项技术是流畅视频通讯的保证。 Duo 能做到视频流畅, 归根到底还是底层技术过硬。 所以我一直有说, 在科网产品界, 深度决定高度, 与其炒作各种商业概念, 还不如潜心修炼技术内功。 基础研究一定会有用武之地。 个人觉得中国国内流行的许多软件产品, 在技术上来说, 跟国外同类产品相比差距还是不小的。

这次 Keynote 上介绍的 Allo 和 Duo 都将在今年夏天上架。 欢迎使用!

Android N


Android 在今年进化到第 N 版。 到底叫什么名字, Google 表示还没有想好, 大家可以到网上向 Google 建议。 注意他们会比较想要甜食的名字哦~

Android N 着重在运行速度, 用户工作效率, 和安全性这三个方面作出改进。

这次推出全新的图像编程接口 Vulkan, 令复杂的多边形处理更为高效, 移动设备上的影像更为逼真流畅。 首先是广大 gamer 的福音。 照相机运行时也用到更少的内存。 Android 操作系统也有作过大幅速度优化。 新的 Just In Time (JIT) 编译器, 令 app 的安装和运行流畅许多。 下面是大会上展示的 Android N 的 JIT 编译器的效率在几个不同的基准包上相对于去年的 Android M 的测试结果:



为了提高用户的工作效率, Android N 提供了屏幕分割, 双击切换常用 app 等功能。 屏幕分割在平板电脑上会很有用。 通知的设置系统也有很大改进, 用户可以更为简便地对某种系统通知进行设置, 减少无用信息的噪音, 让真正关心的事不至于被埋没。   软件的更新更为平滑, 安全系统也有改进。 下面这张 slide 对 Android N 的主要改进作了归纳:



下面这张图上, 提供更多改进的细节项目:


上面这张图上有提到 Emoji。 是的 Android N 向大家提供更多基于 Unicode 的系统表情符号!


Daydream VR

我在 2014 年的 Google IO keynote 综述中就向大家隆重介绍过 Google 家轻便,简单又价格亲民的虚拟现实设备 Google Cardboard。 但是毕竟这个简易设备在舒适性, 交互方式的多样性和沉浸式体验等各方面是有所不足的。 今年 Google 就推出他们全新的虚拟现实系统 (VR 系统), 代号白日梦 Daydream。

一些厂商做 VR, 只是做硬件设备, 即头戴式的 VR 眼镜。 但是 Google 不同。 他们对 VR 有三大方面的系统性认识。

首先,他们要使 VR 系统在移动设备(主要是手机)上也能运行, 而不是只在高端个人电脑或者游戏主机上运行。 这当然对手机的内置感应器, 图形处理器, 显示屏, 系统芯片等硬件有一定的要求。 Google 就发布了一个所谓 Daydream-Ready 的硬件配置标准。 目前, 已经有包括三星, 华为, LG, 小米, 华硕等在内的手机厂商生产 Daydream-Ready 的手机。 刚才说到的 Android N 也有内置的 VR 模式。 这个 VR 模式提供更强的运算性能, 极短的系统反应延迟时间 (这两项听上去比较耗电……)和 VR 系统操作界面。


其次, 他们推出了一套 VR 眼镜和控制器的技术设计, 欢迎广大硬件厂商生产 Daydream-Ready 的头戴式 VR 眼镜。 大会上演示了控制器的使用, 非常简便且精准, 令我印象深刻。


一个成熟的 VR 系统还必须有足够的 content 支持。 Google 又一次表示, 亲爱的 app 开发者们, 未来是你们的, 做白日梦还要靠你们! 本桑再一次被哄得飘飘然, 已经半夜了还在这里为 Google 义务宣传。

除了以上提到的三点,Google 还把他们的在线电影商店和 Youtube 进行大幅改造,目标是令它们也能随时放映白日梦。
 

Android Wear 2.0 以及 Android Auto 

我手上戴的是 2014 年买的, Android Wear 的第一款手表, 三星产的。 当年只有三款还是七款 Android 手表可供选择。 短短一年里,市面上形形色色的 Android 手表超过一百款了~ 一些著名的时尚品牌比如 Michael Kors 都有 Android 手表推出。



在过去的两年里, 我有感受到 Android Wear 系统软件的巨大进步。 而今年推出的 Android Wear 2.0 系统软件则更是一次质的飞跃。 个人认为最为有用的特性之一, 是用户可以选择把一些常看的信息直接嵌在表面上, 这样就不必用手指去滑出有关的 app, 真正便利。



很多功能, 可以不必依靠手机做 host, 手表直接就可以运行。

从手表上回覆交谈, 可以用三种不同的方式: 选一个系统给你的选项 (又见谷歌助理的语义分析能力!), 或者用手指在表面上写, 或者用表面上的键盘输入。


大家还要记得苹果的智能手表上也可以安装 Android Wear 的软件哦~

至于 Android Auto, 这次在 keynote 上倒是一两句话就带过, 主要是说越来越多的汽车制造商支持 Android Auto 系统, 已经超过一百间了好像。Keynote 散会后, 当然还有专门关于 Android Auto 新特性的 session, 我还没来得及看。

Android Studio 2.2 以及其他开发者工具

基于 IntelliJ IDEA 的 Android Studio 自问世以来就是广大专业 Android 开发者的首选工具。 这次的新版本大幅提高了运行速度, 尤其是测试时的运行速度。 还提供测试动作自动记忆, Java 8  的特性支持, 更强的 C++ 支持等等新特性。  Firebase 也对开发者常用的功能进行了一系列整合,令开发者的使用体验更为顺畅。

煽情时刻以及结语

Keynote 到最后快要结束的时候, Google CEO Pichai 又上台讲话。 他介绍了 Google 云平台的三个最强大优势, 即云端机器学习, 计算机视觉 API 和自然语言处理 API。 其实这三个领域是当今世界上几大 IT 服务公司的兵家必争之地, 几乎每个大公司都在这方面有所布局。 过几天我会写写 IBM 的 Bluemix 以及 Watson API。 但是目前为止不得不承认, Google 在这些方面还是有优势的。

然后 Pichai 又深情回忆了不久前 AlphaGo 的辉煌战绩以及第二局中富有创意的一手棋, 他说, 以前人们认为不可能的机器 creativity, 在机器学习的不断进步下, 也在变得可能。  不太熟悉 AlphaGo 的同学, 可以参看我前不久写的文章: 浅说 AlphaGo



Google IO 的 Keynote 每年都有煽情时刻。 今年说的是一位土耳其的软件工程师, 为叙利亚的难民们编写 app,以帮助他们在土耳其开拓新的生活。 他说, 他希望叙利亚的难民在土耳其感到温暖。 啊 Google 真的很关心欧洲, 但就在几天前, 欧盟判罚 Google 三十亿欧元, 说 Google 妨害竞争。 欸话不可以倒过来讲的……

最后的最后, Pichai 说: “真正的考验在于, 人们是否能在人工智能的协助下完成更多的壮举。 一些以前人们认为不可能的事, 也许其实是可能的。 ”

自己写的这句话每年都要重复至少一次: 想象力从来不是凭空而来,而是许多科学上的知识,工程上的经验, 对社会对他人的热情和诚意的积累。 去年这句话是序, 今年作跋, 与各位同道共勉。



谢谢阅读,下次再见。



PS: 今年的开幕演讲只持续了大约 2 个小时, 比往年紧凑一些。 而这 2 小时里传达的内容却是丰富, 集中而意义重大。 今天作演讲的 Google 各位高层, 从衣着,叙述结构到细部措辞都平易近人, 没有夸张的抒情或者华丽的自夸。 令人真正相信 Google 是一个有使命感, 同时也脚踏实地的技术公司。

No comments:

Post a Comment