周韶宏
周三晚上10点,百度用机器人助理“度秘”做了一场篮球比赛的“现场解说”,我们在现场看了一下。
度秘解说的是奥运会篮球四分之一决赛,澳大利亚VS立陶宛。这次百度找来了篮球评论员杨毅,他坐在位于百度办公楼的一间演播室里,桌上放着一台装有度秘应用的平板电脑,背后的大屏幕打出“杨毅约战机器人”几个字。
这是个怎么样的过程?
比赛开始前十多分钟,杨毅和度秘“聊”了一会儿背景情况。从直播现场看到的效果是,杨毅抛出一系列的问题比如“度秘,你知道澳大利亚队有几个NBA球员吗?”
度秘随后会用语音播报一段答案,语言状态非常“机器人化”,如果没用过度秘,可以拿起iPhone和Siri“对话”感受一下效果。
而B站的视频直播是另一番效果。画面被切成两块,左右分别是杨毅和度秘的操作界面,你能看到后者是个对话框。
蓝色部分是杨毅输入的问题关键字,这是度秘在对话框下方显示出来的各种标签,它们的目的是推荐你可能感兴趣的话题,方便搜索。也就是说,杨毅在直播里充当了度秘的一个用户。
我们记录了一段解说效果:
杨毅:度秘,你知道立陶宛男篮之前的男篮奥运历史吗?
度秘:篮球是立陶宛的国球,一共5次参加奥运会,得到3次铜牌,战绩不俗哦!除此之外,立陶宛还是一个美女如云的国家,篮球宝贝非常漂亮!
杨毅:澳大利亚和立陶宛历史上有过几次交锋?
度秘:两队最近6次交手,澳大利亚2胜4负,略占下风~
比赛正式开始后,杨毅和度秘会继续用这种交互方式做“解说”。我们在现场的一个直观感受是,度秘基本能覆盖到比赛的事实部分,比如谁进球、谁犯规、谁罚球、哪一方得了几分……
度秘:澳大利亚队失误了,立陶宛再得2分。第二节比赛结束,现在澳大利亚队领先立陶宛队18分。
但它的语气还是略显生硬,特别是其中夹杂着一些网络词汇“也是蛮拼的”、“哦耶”、“合不拢嘴”,真是谜一样尴尬。
度秘:米尔斯小组赛场均20.5分,高据得分榜第二位,波波维奇估计梦里乐得都合不拢嘴了!
又比如:
度秘:杨毅老师的解说真的是特!别!好!度秘这里给杨毅老师磕头拜师了,咚!咚!咚!
相比之下,杨毅的解说显然更加老道,他会凭借自己的经验告诉观众丰富的花边故事、背景材料,也有抑扬顿挫的语气和恰如其分的幽默。
从这个角度来看,度秘的作用更像是解说员的辅助工具,主导解说的依然是人类。
杨毅也在现场调侃说:“度秘是含蓄派,我听你一个晚上,声音可能就回不来了。”
这样的效果和它背后的技术原理有关。
“解说”功能的实现,按照百度的说法,是“从全网各种各样的数据中找到所有跟直播相关的讨论、评论、新闻、图文等,然后汇集到一起,做整合处理,然后再做分析和理解,生成内容输出,再加上语音播报。”
你可以把它大概理解为一种进一步的搜索结果优化。百度大搜索总产品架构师景鲲告诉《好奇心日报》,这不是让度秘接入视频然后读取和识别画面,而是“耳听六路,眼观八方……利用搜索擅长的东西,把所有相关的信息汇集起来,以大数据的形式呈现。”
百度方面表示,度秘解说球赛功能的背后主要技术是自然语言处理技术,为了让机器的语言更加流畅,度秘需要在前期“大量学习,去理解用户的语言、网络上的内容。”
所以对普通用户来说,度秘的赛事解说功能更适合在看不到画面的情况下使用,类似你在体育门户上看到的图文直播。
这次的演示,我们在现场和B站也都没看到有实时赛事画面接入进来,因而整个过程有些枯燥乏味。百度的负责人说这是出于版权的考虑。另外视频信息流本身也有不稳定性,其实没办法直接判断度秘的解说到底能有多快。
但按照百度的说法,度秘会比人工编辑的直播形式更“个性化”,因为它允许你定制某位球星、某个球队的信息,以及你能像杨毅那样输入问题和它“互动”。
解说球赛是度秘对外展示的一次实验。在这之前,度秘还和肯德基合作,在上海开了一家“智能点餐”的门店。百度在餐厅放了一台机器人充当服务人员,顾客用自然语言和它交互。
类似的事情微软小冰也做过,他们和东方卫视合作让小冰当了一回天气预报主持人。这些活动的目的是为了提升人们对技术的理解程度,从而拉拢更多的用户。
就度秘来说,它从2015年发布以来就是为了连接更多的百度服务。如果你用过这个应用,会发现它的导航栏里突出显示了外卖、电影、酒店、新闻等标签,连接到的也是百度糯米等百度自家的服务。
除了给服务业务拉用户和流量,度秘的作用是为百度带来一个新包装的故事,它和人工智能相关,背后依然是百度那个正受到越来越多管制的搜索业务。