总有人爱谈人工智能。比如斯蒂芬·霍金、埃隆·马斯克、斯蒂夫·沃兹尼亚克等人坚持认为,发展人工智能是一件极其危险的事,在某些领域应该加以控制,甚至有必要远离和杜绝人工智能;而另一种观点如托马斯·迪特里希、孙正义、吴恩达等人则认为,人工智能需要融入生活,且目前远没有对人类产生威胁,生活更需要人工智能。
无论观点如何,总有专门的人、团队和企业致力于研究人工智能,并希望把它推向一定的应用高度和广度,使其不同凡响。
捷通华声创始人张连毅
一家想要造“智能人”的人工智能公司
在捷通华声的创始人张连毅看来,人工智能是一个由浅入深的智能化过程。在较浅层次上,人工智能意味着智能化的人机交互方式,在深层次上,人工智能意味着基于机器学习技术的知识表达、归纳、推理等智能计算过程。智能人机交互是人工智能的触角,智能计算是人工智能的核心,二者缺一不可,共同组成一个智能网络。
因此讨论人工智能就不应只谈论某个单一的技术,诸如我们现在所热衷讨论的语音交互、图像识别或者自然语言理解等,都只是其中的一部分;相对的,人工智能更应该是一类将不同细分技术加以整合的结果。因而捷通华声和国内外大多数人工智能企业的区别在于,他们要将所有细分的人工智能技术加以整合,并早在2011年推出了一个名叫“灵云”的人工智能开放平台。
灵云是一种可以用语音、手写、拍照,手势,将来甚至可使用脑波识别等智能手段来操作、感知手机、计算机等数字设备的网络云服务,其目标是让人机交互像人与人沟通一样的简单自然。灵云目前以“云 + 端”方式,为用户提供语音合成、语音识别、手写识别、OCR、声纹、人脸、指纹识别,也包括自然语言理解、机器翻译等多项人工智能技术能力。
“人们对人工智能的理解,都是期望通过人工智能去创造近似于人类的智慧甚至‘类人’的实体,人们同时对人工智能充满无限的期望,比如现在热炒的机器人,但实际上无论机器人制造的怎样精巧、拟人化,但如果不具备人的基本功能,如“能说会听”与人类交流的基本能力,机器人不过就是一台和洗衣机等电器设备一样没有什么区别的机器,或者说是电器。”
张连毅表示,捷通华声现在做的事情,就是研究并将人工智能各项关键技术能力整合,并面向所有希望应用人工智能技术的产业,也包括现有的机器人生产制造厂商全面开放,助力更多的应用与机器设备能够实现“能说会听、能写会看、能思考、会判断”等人类的基本功能,让更多人通过各种应用、设备了解并感受到人工智能技术的魅力与力量,带动更多产业的智能化产业升级。
今年8月初,捷通华声宣布灵云向国内外所有机器人硬件厂家免费开放,并相继推出基于灵云平台的虚拟机器人——灵云客服机器人,及多款与国内外机器人厂商合作推出的实体机器人——灵云机器人,鼓励更多开发者与企业应用灵云人工智能技术开发满足各种需求的机器人。
伴随机器人受到大众的广泛关注,张连毅认为虽然人工智能技术与产业的发展还有很长的道路要走,但机器人已开始进入实用化阶段,各行各业需要机器人走进商尝营业厅、医院、幼儿园、老人院等公共场所,或者期望基于驾驶、旅游、咨询等场景中发挥他们应有的作用,或节省人力成本,或直接为人们带去人机交互的乐趣;目前的人工智能技术水平能在一定程度上满足部分需求,但还不能满足所有应用场景的需求,大众应该用更宽容与理解的心态迎接机器人的应用与发展。
未来,捷通华声将基于灵云开放平台,和来自不同领域的开发接入者们合作,针对细分行业应用领域,与合作伙伴一起针对机器人的广泛使用所带来的大量数据进行数据挖掘与数据分析工作,让更多机器人变得更加聪明,继续提高机器人人工智能交互与服务的水平。
从低调到主动,代表了人工智能过去、现在和未来
捷通华声是国内老牌的人工智能公司,它创立于2000年,依托于清华大学在人工智能领域的若干技术成果,进而推进其商业化应用。捷通华声最早引入的是来自清华大学的OCR技术,并很快将其应用在文字批量信息化商业领域;而后又不断从清华引入更多包括语音识别在内的人机交互技术。
企业目前直接的对标企业既有同期成立的人工智能服务提供商汉王、科大讯飞,也有诸如云之声、出门问问、图灵机器人、Face++等一批提供语音和图像识别的国内新兴创业团队;国际上,Siri、Google Now、Cotana、Wit。ai、Nuance等,也是他们看得见的行业标杆。
不过,“低调”还是成为了这家公司区别于其他市场参与者最“显眼”的标签。如果不是特意去了解,你很难知晓他们已经是百度、阿里、京东、去哪儿、网易、搜狗,滴滴打车等国内大型互联网企业的语音和图像识别等技术与方案的提供商,同时他们在金融、电信、能源、交通、教育等行业中,也提供长达15年之久的人工智能技术与方案。
但相比已经上市的汉王与科大讯飞,捷通华声在公众层面仍然较少地被认知,也未能在资本圈子里依托资本力量对企业进一步包装和宣传。对此毫不避讳的张连毅坦言,他们之所以如此行事,是因为人工智能长期以来经历了太多的技术磨合和过分地被炒作,因而捷通华声需要脚踏实地做好一些事情。2011年随着苹果公司推出了Siri,人工智能被苹果这家科技企业真正意义上地带到大众的视野,人工智能市场的盘子开始被做大,创业公司和科技巨头开始跟风而至,与此同时人工智能也逐步融入人们的生活工作中。
张连毅的态度在此期间也发生了转变,变得更积极和主动。甚至在他现在看来,从1998年到2011年,捷通华声经历了的一个企业的探索与积累的创业过程,从2011年开始,企业才正式进入到发展的阶段。
“到这个时候你再说酒香不怕巷子深就该落伍了。”在技术方面已经达到一定阶段性的成果,但缺乏包装和宣传基因的捷通华声,让张连毅倒觉得有些着急了,“我们确实不太会炒作,全都是实实在在的宣传自己做了什么,甚至偶尔还会被竞争对手利用,所以现在只能玩命补习功课,向别人学习。”
自灵云平台2011年创建以来直接或间接服务用户达数亿之众,然而捷通华声并没有针对其进行大规模的宣传。现在张连毅表示,他们将加强与媒体的沟通,加强企业宣传,提高企业知名度。但在张连毅对未来发展期望性的一些言语中,仍然能发现他留有的些许介怀,这份顾虑既来自于企业对于人工智能技术应用本身所承担的责任,也来自于创业发展过程中付出的艰辛与不易。
张连毅眼中的人工智能
1989年,从清华大学环境系毕业的张连毅,供职于清华大学科技开发总公司(即现在的清华紫光集团),“剑走偏锋”地和人机交互科学打起了交道,并从此产生浓厚的兴趣。时隔数年,在清华找到更前沿的人机交互技术后,他于2000年创办捷通华声,然而拿着清华大学的先进技术却到处碰壁:从技术应用和商业化的各种困难,到进入市场后运筹各方人脉关系,成为了创业路上看得见和看不见的重重挑战。
人工智能永远是纵深而宽广的话题,从事人工智能技术研究与应用的企业,只有和上下游伙伴之间的深入合作,才能让人工智能技术得到更加广泛的应用。而捷通华声这场并不轻松的创业旅途,造就了张连毅重视技术和服务且低调行事的风格。当人工智能技术在这几年实现爆发性成长,最终让他决意抓住接下来的机遇,厚积薄发去占领市场的制高点,而保持开放和热情,始终成为捷通华声更乐于与广大行业领域交流与合作的基本理念。
尽管人工智能远远未达到我们所畅想的那种效果,但张连毅认为,越来越多的人工智能企业与研究机构希望通过人们现在的好奇心,让处于初级阶段的人工智能服务开始普及,然后再基于这些市场实践,包括从应用中获得的数据、反馈和评价,迅速找到通往下一阶段的突破口。
“未来人工智能产业发展还有很长的道路要走,人工智能技术的成熟还早着呢,路遥知马力,来日方长#”张连毅说。