每一个时代都有一种占主导地位的交互方式,人类的生产及生活方式也因此被改变。
未来十年我们的生活将变成什么样子? 尽管众多科技公司的技术演进方式并不相同,但语音交互一定是绕不开的命题。
自1952年AT&T贝尔实验室研发的语音识别系统Audry算起,语音已在科技史上历经了70年的变革,语音方案也渐渐从云计算中心向边缘端下沉。
当时间的飞轮驰入2022年,语音又将给出什么样的惊喜?
离线NLP,这是探境科技给出的答案。离线NLP(Natural Language Processing,自然语言处理),或称端侧NLP技术,是不依赖云端算力,通过端侧芯片来实现自然语言理解的方案。探境科技CEO鲁勇坚信:随着AI语音模型的轻量化,以及端侧芯片算力的逐步提高,AI语音最终将全部以分布式部署到终端设备上。
离线 NLP 即普世,又普适
尽管语音成为 IoT 设备的交互标配是大势所趋,但从现实来看,在各式各样名目繁多智能音箱在不断的“教育和打磨”市场后,AI语音的智能家居并未如设想一般进入寻常百姓家。
这主要由于传统实现语音支持主要通过云端来实现,配置维护难度极高,如Wi-Fi经常断网、下载各类APP、要进行各种繁琐操作等,复杂程度让人望而却步,用户不愿意花精力去学习。
“所有的高科技一定是要化繁为简,家电应该以人为中心,越智能的家电,用起来就应该越简单、那些让人望而生畏的家电,只适合被敬仰,不适合被使用。”鲁勇解读说。“想要翻越用户体验这座大山,必须解决传统配置方式带来的市场端问题。”
与之相比,离线语音方案则无需依赖云端技术,可以直接在本地语音控制家电产品,并且不需要其它额外的操作,即插即用,拥有更快的响应速度和更好的隐私保护,与云端相比,更符合原有家电使用习惯,属于更为普世的“百姓智能”。
如果说AI语音从在线到离线是一大跃迁的话,那从离线到离线NLP则是另一个层面的飞跃。离线NLP让自然语义从云端下移到了端侧,用户与家电之间的交互就像日常对话,既操作简单,又交互自然。离线NLP在应用层面给到用户更普适体验的同时,也势必会加速其在国内家电市场落地的脚步。
此外,将语音处理放在端侧,对于家电厂家而言,从搭建并运营一套复杂的云端系统,变成了元器件级别的改造,直接从生产端切入,降低了产品间的转换成本,这也是鲁勇对于离线NLP落地前景看好的底气之一。
芯片和算法 咬合紧密的双轮 NLP 引擎
越易用的产品,内核往往越复杂。
离线NLP方案的挑战在于要低功耗情况下保持高性能、低成本,减少由于环境复杂和模型压缩带来的精度损失。这对于技术层面的考验有两个:一方面在芯片设计时要在低成本的前提下,考虑到算法的需求,包括算力、存储容量等是否满足需求,并且是否有盈余以应对未来的再升级。
另一方面,在算法层面要考虑对深度学习的支持度上是否够广泛,同时根据芯片所能实现的能力进一步优化和整合,保持原信息处理能力的轻量化算法重新构建能力。
这就需要在底层芯片与高精度算法间腾挪跌宕,进行软硬协同的全面整合,才能实现两者间的高度耦合。
探境的离线NLP芯片Voitist721,作为探境性能强劲的三核AI芯片,集成NPU、DSP和CPU三核,并且实现了对算法模型的端到端支持。
探境Voitist721语音芯片
此外,支撑端到端的 NLP意味着不用局限于人为设计的数量有限的关键词,而是依靠知识图谱和基于注意力机制的深度学习算法,挖掘出自然语言表达中所蕴含的信息,以适应更为灵活的表达方式和更为广泛的落地场景。
照明领域NLP知识图谱示例
要想在离线NLP领域构筑全新价值,需要做到以下两点,一是语义识别的广泛度,二是更高的准确度。
这就需要在算法模型下足功夫,“深挖洞,广积粮”,探境的算法模型工业化生产平台,是终端智能落地应用的强有力支撑,能够有效解决远场识别、误唤醒率、噪声干扰、地域口音、词语泛化等核心用户体验痛点,其基于统一数据管理系统的采集、训练、测试三大系统平台整体联动,快速响应能满足批量化发布的业务需求。
据鲁勇透露,探境NLP算法今年上半年就已经研发成功,并且凭借超强的人机交互能力,让多个头部客户的眼前一亮,从而获得了进一步打开离线AI语音市场的新“钥匙”。
正在形成的正反馈
不止是技术要“探路”,市场也更是循序渐进式的。
“智能家居市场的需求是碎片化的,每个公司每个品牌都有不同的利益诉求,我们的做法是先做出一些爆款,在市场打响,相当于走到市场中教育了一部分用户,然后用户反馈来拉动更多厂家的加入,慢慢形成正反馈,从而达到反哺这一行业的目的。”鲁勇对离线NLP应用充满信心。
“从目前来看,灯具、空调、窗帘、风扇等应用的接受度都在肉眼可见的扩大,许多头部的大客户开始逐步进入批量出货阶段,这也意味着市场在真正起势。”鲁勇的话语透露出一股自豪。
探境科技合作伙伴包括美的、海尔、松下、欧普、奥克斯等知名厂商,从0到1的突破之后,从1到100也变得顺理成章。探境不仅客户层面形成了规模效应,芯片层面的布局也一一展现,探境拥有更强算力的722芯片已成功点亮,明年年初实现量产,面向超低功耗可穿戴市场的芯片也将面世。
鲁勇表示,今年探境的出货量在几百万片,凭借离线NLP等技术的加持,及多个芯片系列的推出,预计明年销量会实现指数型的上升。
鲁勇认为,家居场景下的智能化可分为三步。第一步是轻智能,赋予电子产品轻量级却实用性很高的语音控制功能,快速将单品智能化推向用户市常
第二步是重智能,在终端AI芯片上升级更强大的算法,让单品变得更加智能,例如自然语义理解、多模态识别等,同时叠加IOT联网,无需连接云端,单品之间就可以构建一个保护隐私且用户体验更好的智能家居整体场景。
第三步是进一步深化软硬件协同,实现深度智能,构建属于未来的AI产品,包括情感分析、对话、类人机器人等科幻级产品,将AI技术提高并融入生活。
探境的愿景其实很简单:让用户在家居场景下能够实现“想到-说到-做到”的自然交互过程,不必再看那些冗长繁琐的说明书,学习那些复杂的家电操作步骤,实现“有电就有智能化”的体验。
就像科幻电影钢铁侠的贾维斯,用户回到自己家里以后,不需要特意去寻找开关或者遥控器也好,他可以在屋子里的任意一个角落,边走边说,贾维斯把窗帘都打开,给我倒一杯柠檬水,这些设备就开始配合工作起来了。
柯林斯在《从优秀到卓越》提到过飞轮效应,有一个巨大的、无比沉重的轮子,想让它转起来,开始要费很大的劲,但只要你用力的方向正确,一直推下去,轮子会越转越快,到后面,你只要使很少的力,轮子依靠以往积聚的势能就可以转得飞快。
从离线NLP到更高级的深度智能,“飞轮效应”正在向我们驶来。