《星际穿越》在中国大陆首映的当天,光年无限创始人兼CEO 俞志晨携自己的团队一同观看了这部电影。在《星际穿越》中,有诸多对“虫洞”的描述,虫洞是宇宙中的隧道,它能扭曲空间,让原本相隔亿万公里的地方近在咫尺。热爱物理学的俞志晨将公司第一款产品命名为“虫洞语音助手”,这款产品支持自然语言理解的人机对话、智能问答应用,可内置于智能手机、智能硬件等平台。
俞志晨告诉《商业价值》,他们在2010年就取了虫洞语音助手这个名字,当时业内知道虫洞这个词的人寥寥无几。近年来,随着科幻电影以及电视剧的普及,让人们了解了虫洞、黑洞、五维空间在内的多种物理名词,引发了国内的科幻热。从某种意义上说,科幻热的兴起反映了国人对于技术变革的期待。国内的大部分互联网公司只是在商业模式上取得了新的突破,而技术变革带来的震动将会是商业变革所无法比拟的。
俞志晨和他的团队正处于一场巨大技术变革的中心。2014年,全球十大科技核心热点是智能机器,而智能机器终极的版本就是智能机器人。
就像30年前比尔盖茨预言,每家每户都会拥有PC一样,智能机器人也将在十年之内走进每一个家庭。与此同时,对于智能机器人核心——“大脑”的争夺也进入了白热化阶段。特别是产品出现的前夕,标准的争夺更为激烈。在这场战役中,我们欣喜的看到以小i机器人为代表的国内公司与谷歌、苹果、雅虎这些国际互联网大佬站到了同一起跑线上。
虚拟机器人的启蒙运动
其实,上世纪90年代,国外很多实验室里面就已经出现可以跟人互动聊天的机器人。2011年底,随着苹果手机上Siri语音机器人的发布,聊天机器人概念真正爆发,瞬间激活了全球智能机器人产业。自此,智能机器人进入快速发展阶段,谷歌相继收购了十家机器人公司,覆盖运动、家庭服务、虚拟大脑等众多领域,同时苹果、微软也都在全世界范围内大力发展相关业务。
机器人大致可分为两大类,第一类是工业机器人,像机械手、机械臂这样的形态在加工工厂里很普遍,上汽集团里很多汽车制造都是由机器人完成的。未来,全球人工成本将会不断上涨,通过机器人去替代人工从而降低成本。工厂中的产品大多为流水化作业,机器人操作起来难度并不大。另一类是服务类机器人,又叫家用机器人。家用机器人又分为两类,一类为实体机器人,一类为虚拟机器人。
现阶段,我们还把虚拟机器人和实体机器人割裂开,但未来二者一定会合二为一。虚拟机器人可以看做是实体机器人的前奏,而虚拟机器人最终会移植到实体机器人之中,或者是其他智能硬件。
虽然大众还没有享受实体机器人的带来的好处,但是虚拟机器人已经无处不在。手机用户给运营商发送查询短信就能得到相应的自动回复,通过银行的微信服务号及时查询信用卡额度、积分,这些便利服务的背后就是虚拟机器人,更确切的说是小i机器人。
国内很多企业都有自己的呼叫中心,这些呼叫中心普遍面临人工成本居高不下、用户问题重复率高的问题。以招商银行为例,平均每天有60万通交互,如果用人工来处理,最少需要两三千人,有了i小机器人后,现在只用了12个人,95%的问题都是由机器人回答。
企业营销和服务的需求越来越强烈,今年11月,光年无限推出“图灵机器人”,将自己的后台开放给开发者,可以很好地与微博、微信、App、智能硬件相结合结合。
上海智臻网络公司董事长袁辉告诉记者,“在虚拟机器人这个领域,就像教育小孩子一样,需要不断去学习,机器人也是。从小孩诞生,一年级、二年级,积累不同行业的知识库才能成长的。”虚拟机器人的研发需要极大的耐心和恒心,需要持久的关注和投入。
从软到硬的发展路径
随着大数据、云计算、4G、智能硬件等相关技术的不断成熟,袁辉认为是时候重新启动他的梦想了。袁辉告诉《商业价值》,
“我们的名字就是小i机器人,公司创立之初就是想做实体机器人,只不过是当时的硬件不具备条件而已。我当年创立的梦想和今天没有区别,就是让机器人改变人的生活,每个人都拥有自己机器人。”
近两三年来,智能硬件风靡全球,能够支撑实体机器人的条件越来越成熟。“以前,机器人的身体不够强壮,现在足够强壮了,这样我们就可以把大脑移植过来。以前大脑都是在互联网和移动互联网中使用,现在可以用实体机器人作为载体。”袁辉在2011年就萌生了这样的想法。
当然,从软到硬的发展路径并不仅仅局限于智能实体机器人,智能电视、智能汽车、智能家居也是虚拟机器人大展宏图的机会。袁辉向《商业价值》记者介绍道,LG、联想等智能电视中,都搭载了小i机器人的系统,用户完全可以跟遥控器进行语音对话,发出类似“我想看钢铁侠!”式的指令,智能电视便能提供相应的服务。
与小i机器人不同,虫洞语音助手最初的定位就是把手机变成智能化机器人。俞志晨认为,手机除了跟机器人形状不一样,本质并无太大区别。未来,各种硬件不过就是功能硬件而已。
人工智能有三层次,分别是感知层、认知层、控制操作层。感知层类似人的眼睛、耳朵、皮肤等,不断去感知信息,并将其转换成机器可以理解的语言。随后,将感知到的信息反馈到认知层,认知层就像人的大脑一样,做出相应的判断。最后,由控制操作层完成操作,例如讲话或者拿东西等。
未来,硬件终端只需要存在感知层和控制操作层,认知层将会移步云端。也就是说,智能机器人的硬件只做两件事儿,一个是感知外部信息,另一个是完成这件事情,比如发出声音或者移动几步。这时候,手机、智能硬件、智能玩具只需要联网即可。
多点开花的时代
当硬件的成本越来越低,链条越来越成熟,产业化程度越来越高,未来机器人的硬件生产一定不是门槛。门槛体更多体现在软件服务,“如果说一个20岁的小伙子长得很帅,但你问他几个问题他回答的像个智障。你还会喜欢他吗?即便你硬件做的特别好,软件很差,还是失败的。”袁辉如是说。
IBM的Watson、谷歌大脑Nao、小i机器人、图灵机器人都在人工智能的认知层上做文章。语音只是认知层的一部分,俞志晨将它比做耳朵,
“它只是一个引擎,把这种信号转化成机器可以理解的语言。但是他真正去认知、思考、决策,跟语音没太大关系。”
很多时候,语音并不不是一个好的交互方式。在嘈杂的环境下,无论用户怎样喊叫都无济于事,这个时候用户能够摆摆手或是摇摇头,智能机器人就可以领会用户传达了“不”的意思。
未来,像图像、语音、体感交互等技术将会在认知层、控制操作层上融合,用户和智能机器人之间将会有多种交互方式。
LeapMotion CEO Michael Buckwald告诉《商业价值》,“对于机器人来说我们要良好控制好机器人,全世界都是把这种控制作为一个研究,我们如何准确控制机器人来抓东西,甚至如何控制机器人在太空修理机器。”LeapMotion工作原理很简单,即通过两个摄像头捕捉手跟手指的动作。手掌上面总共有14节指骨,5节掌骨总共27个骨头,演算28个追踪点,追踪更精细,可以辨别左手跟右手。在新的算法了,还能够区别抓取跟捏取,开发者更容易去发展他们所要、想要的功能。
今年8月,在LeapMotion入华的发布会上,两位来自北京市第35中学的高中生向大家展示了,如何借助LeapMotion,优雅操作地机器人。在演示过程中,通过电脑程序和机器人连接,就可以用手来控制复杂的机器臂。比如说让机器人递一杯水,人们在现实中的第一反应是伸手去抓,随即机器臂就会去抓,而不是不是去刻意控制拿水、递水的每个角度。
语音识别、图像识别、体感交互都是人工智能一部分,现在还没有一家公司能把每一领域都做好。人工智能发展的第一步是各点开花,第二步是融合,第三步才是智能化。显然,现在还处于各点开花的阶段,未来几年会慢慢融合。
融合带来的好处将是成本的降低。智能机器人定价居高不下,一款看似很普通的机器人动辄10万块,购买者往往都是极客,普通消费者并不会购买。俞志晨告诉记者,“硬件机器人很贵就是因为他们在同时做感知、认知、控制操作这三件事。如果是分离的话,认知层去云端,硬件成本会降低,如果真的跟手机一样便宜,智能机器人才会走进每个家庭,这个事儿才合理。”
在很多科幻电影中,机器人能够为主人做所有的事情,现实生活中显然是不现实的,或者说实现的路径比较长。未来,智能机器人的服务会走向场景化,把每个场景都做到极致,再谈融合。在众多场景中,用户黏性最高的有三类,分别是4—10岁的小孩,50岁以上的老人,车载用户。其中,智能玩具、老年人陪护机器人都已经在国外一一实现。
2006年,袁辉去讲机器人,台下大家就说你讲的太好了,能不能把机器人牵出来我看看。当时大家都停留在工业、物理这个认识层面,对虚拟大脑就没有认识。熬过了十几年,外部环境终于具备了,小i机器人还活着,并拥有了先发的优势,这是让袁辉最庆幸的事。他向《商业价值》记者许诺,不久后就能在市面上买到和还海外公司合作的实体机器人,并且是普通消费者能够承担的费用。