你印象中的微软小冰是什么样的?
2014 年,第一代微软小冰发布,最初她以微信公众号的形式存在,可以用不那么生硬的语气回答天气、交通、星座相关问题。
之后的五年,小冰又出现在 QQ、网易云音乐等 App 中,用俏皮话和用户留言互动;最新的消息是,小冰将与小米 OV 等厂商合作上线“召唤小冰”,还要给阅文集团的 IP 定制形象。
不管你看得见还是看不见,小冰似乎变得无处不在了。根据微软公布的最新数据,小冰在全球覆盖的用户量有 6.6 亿,第三方设备则有 4.5 亿台。
在诞生之初,小冰以“有情绪”著称。与那些你问它答的语音机器人不同,小冰会生气,会吐槽,还会拒绝你不健康的请求。时任微软全球执行副总裁陆奇曾在复盘小冰时说过:“AI 产品应该在 IQ 之外,引入 EQ 这个新维度。”
如今,小冰身上的“人格化”标签更加明显。
在8 月中旬微软“小冰七代”的年度发布中,微软团队又演示了小冰新开发的多个场景:
1、两位微软研究员在开车途中唤醒小冰,当驾驶员在与小冰的聊天中出现“堵车烦躁、开车犯困”之类的表达后,小冰会立刻回应:“我给你讲个笑话吧”、“要不要给你唱首歌”。
2、一个日本宅男拿着手机、戴着耳机去逛水族馆,宅男时刻与手机中的小冰进行互动,当小冰通过图像、声音感知到宅男来到“水母”展馆时,她发出了“水母好漂亮啊~”的赞叹,宅男则欣喜地回应:“是啊是啊,很漂亮。”
3、微软还展示了一段小冰与消费者的截图对话。在这十轮对话中,小冰用对话引导用户明确了购物需求,最终成功在第九轮推荐用户下单了照相机。
这三个场景实际上代表了微软小冰进阶的三种技术类型不用唤醒词即可在车载场景下与小冰发生多轮对话,这叫“全双工语音交互”;结合视觉、对话与小冰边听边说,这是“多模态感官交互”;引导用户明确购买需求,这被称作“主导对话”。
七代小冰可以进行“主导对话”。图片来源:微软小冰官方提供
技术一直是小冰团队引以为傲的长板。拿它最新发布的 Avatar 框架来说,该平台包含了训练一个虚拟机器人需要的所有工具包,包括对话、声音、视觉、观点、技能、知识及创造力等。微软宣布,到 8 月底,B 端开发者就可利用这一框架如流水线般生产出更多“小冰”。
而在技术之外,小冰在国内 AI 领域有着更广泛的参考价值。
眼下,国内 CV(视觉识别)行业已经有了商汤、旷视这样的准独角兽,但 NLP(自然语言处理) 受制于技术难度与落地场景受限,始终有些不愠不火。作为国内 NLP 赛道的代表项目,小冰做了什么、进入了哪些场景、怎么实现商业化,自然有着参考意义。
大公司的包容度
小冰变得更聪明了,这一点毋庸置疑。可一直让业界存疑的是,这个被巨头孵化、有 EQ、能说会道的机器人,难道只能把人工智能用在打嘴炮上?
若在 2017 年以前,答案或许并不明朗。在小冰诞生的前三年,微软团队有意让该项目的商业化节奏慢下来。很长一段时间里,有关小冰的新闻大都是:“小冰学会了写歌/作诗/主持”,与商业化没有太大关系。
微软给了小冰在“人格化”上更大的发挥空间,即使这些属性在短期看来大多与商业化无关。拿一个小冰团队津津乐道的例子来说:当用户把脚扭伤的照片发给小冰,小冰的回复是,你伤得严重吗?
这则回复包含了小冰的两项能力:一种是图像识别。小冰需要具备对人体部位的检测功能,认出“脚踝”;更重要的是,小冰能通过情感框架,给出和人类相似的关心、安慰等情感表达。
在微软团队看来,这些看似无关的闲聊与技能,实际上是小冰积累语料、训练数据的过程。也正因为在闲聊中能与用户产生共情,小冰的多轮对话数量远超其他 AI 机器人。根据微软公布的数据,微软小冰与用户的单次平均对话轮数(CPS)保持在23轮。
“其实四年前小冰就能商业化,只不过我们选择不去那么做。”小冰如今的负责人,微软(亚洲)互联网工程院副院长李笛对 36 氪说。他认为,如果在数据积累不够多的情况下盲目推进商业化,对后续的商业订单推进并无好处。
微软小冰负责人、微软(亚洲)互联网工程院副院长李笛。图片来源:微软小冰官方提供
可同行就没有小冰的耐心了。同属于 NLP 赛道的小 i 机器人已经在银行、金融、运营商领域深耕了快 20 年,拿下过招行、建行、联通等央企订单;还有在2014 年后成立的三角兽、竹间科技、追一科技,几乎在诞生的同期,就开始考虑产品落地与商业化。
相比创业公司的生存压力,有着巨头护翼的小冰,得以拥有更大的试错空间。“微软的确给了小冰更多的包容度,这可能是其他创业公司不具备的。”微软全球资深副总裁王永东对 36 氪说。
但变化也在发生。
2017 年后,小冰明显加速了商业化节奏。当年,小冰宣布通过“Yeelight”智能助手设备的形式,进入小米生态链;随后,小冰日本团队又与 Line 合作,为日本第二大便利店集团罗森提供打折券促销服务。
小冰的“人格化”特点开始在商业化中展现出优势。陆奇很早就提到过,小冰具备的情感属性可以影响人们的决策,这在电商、社交等场景均适用。拿小冰目前落地的在线零售客服案例来说,通过与用户的闲聊,小冰可以将用户模糊的购物需求一步步明确下来,最终为对方推荐出心仪的商品。
根据微软透露,上述小冰在线零售案例已经在美国市场进行试点,其推荐转化率可以达到68%。
小冰的“叛逆”
当被 36 氪问及“微软是否在加速小冰的商业化”时,李笛给出了肯定的答案,“因为同行业都在跟进。”他说。
“所以是受制于行业竞争的压力?”
“我不觉得我们有这么被动。”李笛解释到,“竞争是一个好事,能让我们明确应该把研发重心放在什么环节。”
成立五年,微软小冰的风格正如她去年对外放出的 3D 形象,明艳单纯,看起来与世无争。可少女终要长大,在微软的布局中,小冰将化身为商业世界的成熟形象,不仅要作为虚拟机器人在内容、营销、设计领域拿下订单,还要与微软云等业务产生联动,甚至要与市场上 AI 的常规商业模式反其道而行之。
微软发布六代小冰时公布的小冰官方形象。图片来源:小冰团队提供
在 8 月中旬小冰七代的发布会上,一向佛系的微软团队就对 AI 领域的固有模式发起挑战。微软小冰团队商业负责人徐元春表示:“我们不会单纯销售小冰技术的API,也不会通过生产硬件产品、并进行大量补贴的方式获得OS的市场份额,这种方式是不稳定的。”
这一番话涉及到当下 AI 领域两种重要的商业模式:
大多创业公司都是先做基础的 AI 平台或者算法引擎,再给合作伙伴提供 API ,根据处理的数据量或者是调取次数收费。
诸如阿里巴巴、百度、京东等大公司则是通过补贴的方式,把诸如智能音箱、翻译机之类的硬件产品卖给 C 端消费者,再通过加载广告、服务的方式变现。
“很多智能音箱把‘智能’当作卖点,但AI 起到的作用最多是用同样的命令去触发,没有交流。厂商关注的还是卖多少钱、有多少曲库。这不是我们要的。”李笛告诉 36 氪。
软硬结合、以软为主这是微软给小冰的定位。为此,微软还特别宣布小冰将坚持“第三方平台”发展策略,不会推出独立的第一方产品形态。也就是说,未来我们不会看到以小冰名义推出的硬件或者独立 App。
虽然看似退居幕后,但小冰仍旧野心勃勃。
这从小冰对开放 API 的谨慎程度也可见一斑。对于小冰团队来说,开放 API 虽然可以让小冰集成到更多产品和服务中,但也让小冰对外部合作的方案失去了感知。
那什么是小冰理想状态的合作模式?李笛给 36 氪举了日本罗森的合作案例。
在与罗森的合作中,微软团队首先把微软云、微软小冰的业务整合起来,提供了云的部署到智能机器人一整套服务;之后再根据罗森的具体要求(比如推销优惠券、帮助顾客了解商品信息)等开发相应的零售机器人;最后还要根据机器人的转化反馈实时修正。
之所以这么大费周章地服务一个客户,小冰自然有她的道理。
首先,在该方案中,小冰的推广搭售了微软云服务;其次,彻头彻尾服务过罗森后,小冰能将这套方法论复制到其他零售客户;更重要的是,李笛告诉 36 氪,小冰在这种合作模式将不仅向罗森收取聊天机器人的授权费用,还会与罗森在推广优惠券的转化上分成这相当于增加了小冰的营收渠道。
“如果小冰是一个急着回答投资人如何商业化变现的创业公司,当客户问我们能不能给他一个对话机器人的API时,我们可能就得给客户。”李笛说。
但小冰不是创业公司,在微软的支持下,小冰有了“叛逆”的资本,她可以在与合作伙伴的方案中要求更多话语权,比如微软其他业务的搭售,比如新的商业模式的拓展。
更多形式的合作已经在进行了。除了零售以外,小冰还将它的设计、内容能力延伸至更多产业。目前,微软小冰为SELECTED、万事利、依文等品牌设计的产品已上架销售;音乐方面,小冰与联通沃音乐共同推出的音乐生成平台也已上线。
不过,尽管小冰有了频繁的商业化探索,可与微软对她的研发投入相比,这些项目的回报目前还只是杯水车薪。当 36 氪问及小冰未来的盈利可能时,李笛显得有些茫然,“至少在我们面对的领域,还不太考虑毛利的问题。”他说。
(文图、头图均由微软小冰官方提供。我是 36 氪作者苏建勋,关注智能硬件、AI 、云计算,如果您是相关从业者欢迎与我交流,我的微信是 jason907,添加烦请备注姓名、职务、公司。)