智能硬件产品在很多场景下因语音交互体验不如人意而深受诟病,究其原因主要是受限于背景噪音、其他人声干扰、回声、混响等多重复杂因素,进而导致的识别距离近、识别率低等明显痛点,讯飞远场识别技术将能够很好的解决这些问题。
科大讯飞远场识别技术对外亮相发布,超过5米的远场识别距离大幅突破了语音交互距离瓶颈,再次刷新业界期待。由此,集语音识别、语音合成、语义理解、人脸识别、声纹识别、语音唤醒、语音评测、语言云于一体的讯飞智能硬件整体解决方案再添利器,或将全面催生智能硬件新品开发浪潮及应用场景的创新空间,行业新一轮风口已经打开。
智能硬件产品在很多场景下因语音交互体验不如人意而深受诟病,究其原因主要是受限于背景噪音、其他人声干扰、回声、混响等多重复杂因素,进而导致的识别距离近、识别率低等明显痛点,讯飞远场识别技术将能够很好的解决这些问题。
据讯飞开放平台产品总监王磊介绍,远场识别技术的核心有两点,一是语音前端处理:利用麦克风阵列、回声消除等技术将目标说话人的声音增强,并抑制/消除周围或本身无用的声音(噪声+回声);二是语音识别引擎:针对麦克风阵列处理后的数据进行收集、训练,以使远场效果最优化。早在2010年,讯飞就通过构建联合实验室投入语音前端处理研究,迄今成果颇丰。2年前,讯飞全球首创的基于麦克风阵列的车载降噪模块就开始试水汽车市场,得到了众多车厂和车机厂商的认可,出货量十分可观。
讯飞此次推出的远场识别技术,集成了全新的4麦克风阵列方案,并利用麦克风阵列的空域滤波特性——在目标说话人方向形成拾音波束,抑制波束之外的噪声和反射声,其降噪和去混响效果均为国际顶级水平。
可以想象,基于远场识别的远距离、高识别率支撑,现在用户在以家庭为单位的活动范围内,已经可以通过语音轻松操控家里的一切智能硬件设备,推而广之,搭载远场识别的智能硬件产品将无限扩大适用范围和应用场景。”我们目前的方案主要是均匀线性麦克风阵列,根据算法不同,可分为适用于电视机、空调、机器人等的加性麦克风阵列和适用于采访话筒、录音笔等的差分麦克风阵列 “,王磊介绍。
发布会上,来自小鱼在家、华居智能等智能硬件的近百位行业大咖还就远场识别应用、智能硬件发展等问题进行了深入探讨。正如刘庆峰董事长在两会媒体采访时所说,智能硬件从概念走向实用的进程中,科大讯飞的目标不仅是让所有的智能硬件能听会说、能理解会思考,随着智能硬件的联网化,未来打通后台的大数据+人工智能还将给合作伙伴和最终用户带来更多惊喜。
今年2月,讯飞开放平台单日在线语音交互突破1.2亿次;3月初,科大讯飞与京东集团成立合资公司围绕智能家居展开全面合作。根据最新数据,讯飞开放平台应用合作伙伴超过6万家,终端用户数量超过6.8亿,其中开发速度增长最快的就是智能硬件。我们看到,伴随着移动互联网+人工智能时代的东风,处于新一轮风口上的中国智能硬件产业,已经迎来走在世界前列的发展良机!