导读:最近两年,不断有人问我同一个问题,移动互联网的创新方向是什么? 我每次的回答都是:围绕手机终端特性的功能创新。与PC不同,手机天生是有眼睛(摄象头)、嘴巴(话筒)、耳朵(听筒)、有位置(LBS)等等,而其中要重点解决的一个问题就是输入。 PC时代输...
最近两年,不断有人问我同一个问题,移动互联网的创新方向是什么?我每次的回答都是:围绕手机终端特性的功能创新。与PC不同,手机天生是有眼睛(摄象头)、嘴巴(话筒)、耳朵(听筒)、有位置(LBS)等等,而其中要重点解决的一个问题就是输入。
PC时代输入靠得是键盘和鼠标,它们让计算机的输入非常简单、直接。而手机上,使用全键盘和鼠标都是不现实,虽说触摸屏可以看做另一种形式的“鼠标”,但在手机上,输入体验一直并没有得到本质改善。
所以早在2009年我们就判断,在触摸屏之后,“输入”还会有两次革命,而第一次就是语音。
2011年10月,苹果发布了Siri,它通过语音大大简化了手机操作,使iPhone4S变身为一台智能机器人助手。我也在当月UC发布的《2011年第三季度移动互联网报告》中,再次强调了语音的重要。
12月26日, UC浏览器语音公测版发布,我们终于把判断落实到了产品上,使UC浏览器成为全球首个使用语音智能控制的手机浏览器。
不少朋友在此之前就已经通过网络获悉了这一消息,有些媒体还用“中国版的Siri”来描述UC。我们当然感谢大家对于创新的肯定,但“中国版的Siri”并不准确,目前UC浏览器只是实现了通过语音对浏览器的操作控制,如打开网页、控制浏览器功能操作、语音搜索等,但我们清楚,在语音控制和智能使用创新上,UC只是迈出了第一步,还有大量的工作和难题需要去突破。
事实上,Siri发布之后,确实引起了一股语音风潮,很多开发者都跃跃欲试,市面上也出现了不少语音类的产品,但大部分局限在“语音输入转换到文本”这个环节上,用户需要的只是文本转换吗?
绝对不是!必须更进一步 。
很多人都忽略了一点,Siri之所以让我们惊喜,并不是它因为用了语音,而是将语音与手机的各种应用完美结合。在语音这个问题上,开发者要避免两个认识上的误区:一、把大量精力花在语音采集技术上,二、只停留在语音输入转换给文本环节,裹足不前。
语音识别并不是什么革命性技术,早在多年前,IBM 的语音识别软件在 PC 上就有不错的识别率,近年来,Google、微软包括国内的一些公司也投入了大量研发,形成了一些相当成熟产品。可以说,在语音识别环节,开发者想做出差异化已经非常难了,完全没必要自己动手,只要找到靠谱的技术提供商即可。这一点相信大家都能理解,造飞机的人不是每一个零件都要自己生产。
另一点提醒是一定要走向用户需求识别和控制环节,与产品流程很好的耦合。当然这不是选择问题,而是能力问题,因为从语音转换成文本容易,理解“用户需求”和“做成动作”却是难点,它需要对海量手机用户习惯和需求的挖掘,以及学习算法。
作为致力于移动互联网创新的公司,UC当然不会放过语音这个创新点。UC浏览器之所以能在全球首创使用语音控制的浏览器,背后是7年移动互联网产品技术积累、全球3亿用户的海量数据,以及自主研发手机浏览器内核的“核能力”。
当然,如前所说,目前的语音产品只是UC交出的第一份作业,但UC会坚持在语音智能上发力,相信在中国以及手机浏览器这一领域,我们一定能抓住语音这一移动互联网创新机遇,提供更多浏览器人机交互创新,让中国用户更快享受到全球最先进的移动互联网产品。
BTW:前文说到在触摸屏之后,“输入”还会有两次革命,第一次是语音,至于第二次是什么?卖个关子,大家可以想一想。