AI 将更多地模拟真人;可用性越来越强;与人类劳动呈现竞争与合作相伴的关系。
文 / 书航 2020.9.21
9 月 15 日举行的“百度世界 2020”大会展现了百度过去一年的 AI(人工智能)布局及成果,为国际 AI 大厂年度“交作业”补上了一片重要的拼图。
谷歌、微软、亚马逊等实力雄厚的科技巨头,是全球 AI 产业的重要驱动力量。这些头部公司大多会每年一次集中发布新技术和新产品,每次都成为预测全球 AI 趋势的风向标。
受疫情影响,今年的谷歌和 Facebook 开发者大会取消,但是苹果、微软 和亚马逊等还是分别在线上发布 AI 相关进展。通过巨头们今年的各项技术发布,全球 AI 业界的三个主要发展趋势也逐渐清晰起来:
AI 将更趋向于模拟真人,包括模拟语音、动作和性格。
AI 在不断训练之下会变得更有用,可靠性更高;同时越来越不依赖云端,而是在本机和低功耗设备上运行。
AI 将从事更多重复的事务性工作,人类与 AI 的分工合作也同时增加。
今年的“百度世界”都发布了什么
“百度世界 2020”定档 9 月,是国内疫情防控常态化的又一标志。3 个小时的大直播与央视新闻联合呈现,由康辉坐镇主持,多位央视新闻名嘴作为“AI体验官”全程参与。
让媒体感到新奇的是,百度安排大家在“分会场”一家电影院的 IMAX 厅观看直播,这不禁让人想起去年央视携手全国影院以 5G+4K 直播国庆 70 周年阅兵式的情景。
无人驾驶、小度助手、度晓晓、虚拟人
会上的主要发布包括:
(1)无人驾驶:百度 Apollo 在首钢园区现场演示了完全无人驾驶所包含的三大要素:前装量产车、AI 老司机(即不配备安全员的“主驾无人驾驶”)、5G“云代驾”。当路面路况有变动或交通管制等情形时,车辆可由云端驾驶员远程控制来“平行驾驶”。
(2)小度助手:小度助手(DuerOS)版本升级到 6.0,公布数据称月交互次数超 58 亿次,有 4.2 万名开发者和 4000 多个优秀技能。大会展示了小度的三个主要场景即家庭、酒店地产、车载。此外发布了首款搭载小度的真无线智能耳机,为小度补充了第四个场景随身。
(3)百度移动生态的服务化、人格化:大会介绍了百家号、智能小程序、托管页的相关进展。百度知道、文库等 U/PGC 平台正陆续和百家号体系打通。专家、达人通过百家号开设的直播会在百度搜索结果页优先展示。百家号创作者数量已达 340 万。
大会还发布了创新搜索产品“度晓晓”,这款手机上的养成类虚拟助理App建立在小度助手的能力基础上。随着用户的使用,“度晓晓”可以形成不同的性格。
(4)百度大脑 6.0:大会展示的终端虚拟人“小康”“小李”融合了视觉、语音、语言、知识等多模态的百度大脑 AI 技术。和同类产品相比,它们的“认知能力”有很大提升,生成和展示门槛也大大降低,有助于打造具有人情味的下一代虚拟客服。
百度大脑目前开放了 270 多项能力,聚集了 230 万开发者。飞桨深度学习平台和昆仑通用 AI 处理器,标志着百度掌握了 AI 核心底层技术。会上还展示了山东电力、森林防火、央视新闻等 AI 应用案例。
可以明显地感受到,现在提及全球范围的 AI 巨头时,人们越来越频繁地提到百度。有些时候,百度还可以作为其中唯一的中国企业代表。去年《哈佛商业评论》中文版发布的《2019 人工智能专项调研报告》显示谷歌、苹果、微软、百度、亚马逊为2019“全球 AI五强公司”。
2019 全球 AI 五强公司
虽然当今任何大型科技企业都会触及 AI,不过很多巨头的 AI 实践是分散在主营业务之内,随业务的发展而发展。百度则很明确地以 AI 作为发展方向,其业务线均围绕 AI 能力展开,并反哺 AI 能力的进一步增强。
李彦宏在 2017 年表示百度“是一家人工智能公司”,此后多次承诺增加在 AI 方面的投入。即使受疫情影响,百度也没有削减研发预算。2020 年 Q1/Q2,百度的研发费用分别为 44.43 亿元和 48.39 亿元,与当季总营收的比值分别为 19.71% 和 18.59%,均是近年来的高位。
根据沙利文公司(Frost & Sullivan)《2019 中美人工智能产业及厂商评估》报告,百度、阿里、腾讯和华为等综合型厂商在计算机视觉、自然语言处理、语音识别等核心技术领域均有布局,同时加速基础层软硬件的布局和追赶。
中美 AI 厂商布局表
在此基础上,在智慧城市,智能客服与营销,智慧医疗,智能营销,智能制造,智慧能源,智能制造等方面,百度均有自有布局。至于 Apollo 在出行方面的成就,更增添了百度 AI 版图的完整度。
从大厂动向看今年的全球 AI 三大发展趋势
疫情改变了全球科技企业的新品发布节奏。受疫情影响,今年的谷歌 I/O 大会 和 Facebook F8 开发者大会宣告取消,但是苹果 WWDC、微软 Build 和亚马逊 Alexa Live 2020 等还是在线上举行。
今年已经走过三分之二,此时召开的“百度世界 2020”可以说为国际 AI 大厂的年度“交作业”补上了一片重要的拼图。接下来还会有微软的 Ignite 和 AWS re:Invent 等活动,苹果还缺一场秋季发布会;谷歌也计划推出新的手机和智能音箱等。
今年各家 AI 巨头都省略了开发者现场参会的环节,变成视频和“PPT发布”,有的直接群发新闻稿了事。总体上说,今年它们带给开发者和市场的新东西都不多;更重要的是,疫情及远程办公也降低了工作效率,拖慢了内部研发和硬件制造的进度。
除小度之外,几大语音助手 Alexa、Siri、Google Assistant 也都趁机宣布了最新的用户数、装机数和开发者数量,但微软的 Cortana 则退出了消费者端的竞争。在用户分布方面,中美两国继续保持着“划江而治”的状态,尚未出现什么产品可以广泛打入对方的市常
看完百度世界 2020 之后,结合其它国际AI 大厂今年的各项技术发布,全球 AI 业界的三个主要发展趋势也逐渐清晰起来:
人工智能将更趋向于模拟真人
其实 AI 每一年都在尝试模仿真人的音容笑貌,但 2020 年可以说是厂商们在拟人 AI 研发方面取得突出进展的一年。像是沙特“机器人公民”索菲亚那样的“实体 AI”尝试暂时消停了,但在屏幕内出现的三维形象,则在飞速跨越拟人形象的“恐怖谷”,变得越发实用。
AI 对真人的模拟包括语音、动作和性格。显然,语音方面的拟人 AI 技能现在已经“点满”,AI 客服在日常生活中已被大量应用。更多人会与 AI 互动,即使自己还没有意识到;但反过来,在我们不认识 AI 的同时,AI 会认出我们。
2018 年机器人形象和 2020 年 Vtuber
如今,厂商们终于具备了跨越 “恐怖谷”,向人形 AI 这一高峰进军的决心和实力。过去一年诞生了众多虚拟偶像(Vtuber),而一些由人控制的 3D 形象,在需要采集人类动作时也不需要大量的传感器,只要用手机摄像头,甚至是一些录制好的视频片段就可以了。
在百度世界大会宣布上线的虚拟助理“度晓晓”从2019年开始研发,她的造型、动作和语音都已经非常自然,知识储备更丰富,应答也更接近真人。
百小度、小度、度晓晓
用户见惯了多种 AI 助手之后,口味也更为挑剔。从 2015 年搜索框旁的机器人“百小度”,到语音形态存在,外形也是机器人的“小度”,再到 3D 人形 IP“度晓晓”,技术难度不断加大。
对人类性格的模拟也将帮助AI越来越多地用于创建电影、音乐和游戏。2019 年五四青年节晚会,百度帮助打造的虚拟主持人“小灵”亮相。一年以后,百度世界大会上的虚拟人“小康”技术水平又有了重大提升。
小灵、小康和小康的原型90 年代的康辉
现在打造虚拟人不再需要录制长时间的视频,只需要几分钟现成的视频资料即可,而且它的对话能力也更强,两个虚拟人之间可以“机机对话”。虽然还是略显尴尬,但已经不至于出现停顿和“乱码”了。
今年很多家开发的 AI 助手在“认人”方面都有了新进展,认出不同的家庭成员成了新的“基本功”。小度助手(DuerOS)6.0 增强了根据音色区分家庭中不同成员的能力,并且只需要录入 20 句话,就可以模仿父母的声音给孩子讲故事。
此外,语音助手也在更努力地学习人类的交流逻辑,例如识别模糊化的指令。人与人交流的时候,对同一种事物有多种不同的表达方式,有时可能会相当模糊,对这种模糊指令的识别一直是一个难点。
7 月 22 日,亚马逊线上举办了 Alexa Live 2020 开发者大会。本次 Alexa 发布了 31 个新功能,其中基于深度学习的多轮对话开发工具 Alexa Conversations,可以让语音助手的交互体验更加自然。
基于此,用户可以不用清晰记得技能的名称,只要大概说关键字让 Alexa 推断你的意图,就可以调用技能,使用更轻松方便。如果 Alexa 不能完全确定时,将会与用户确认,随着持续深度学习和训练,效果会更精确。还有,现在 Alexa 在执行一项任务的同时,还可以在中途暂停,等过段时间回来还会继续原来任务的进度。
人工智能将越来越有用
随着真实模拟的精度和可用性提高,数据变得更加准确和可用,人工智能变得越来越有用。例如,个性化推送将越来越多,成本也降低;AI 越来越处于“边缘”而不是云端,即在本机完成、在低功耗设备上运行。更多设备(包含物联网设备)将运行 AI 驱动的技术。
现在我们生活中最常用的网络服务,已经淘汰了大多数的手动推荐位,走向“千人千面”,这意味着对 AI 算法推荐的越来越信任和依赖。