展会信息港展会大全

突破核心技术 做强语音产业(新视点)
来源:互联网   发布日期:2022-01-06 12:44:57   浏览:15606次  

导读:你好,欢迎来到北京冬奥会。 话音刚落,便被转换为英语、法语、日语等多种语言依次播报。走进北京冬奥小屋,一位名叫爱加的虚拟主播已正式上岗,在智能语音识别技术的支持下,可将普通话实时翻译成全世界多个语种,让奥运声音更快传遍全球。 不只是虚拟主播...

“你好,欢迎来到北京冬奥会。”

话音刚落,便被转换为英语、法语、日语等多种语言依次播报。走进北京冬奥小屋,一位名叫“爱加”的虚拟主播已正式上岗,在智能语音识别技术的支持下,可将普通话实时翻译成全世界多个语种,让奥运声音更快传遍全球。

不只是虚拟主播,与试衣镜融为一体的AI(人工智能)私教、帮助快递小哥快速收派件的智能穿戴设备、能“听懂”语音自行打字上网的鼠标……如今,越来越多智能语音技术从实验室走向终端应用,走进并服务人们的日常生活。

“作为软件产业的重要组成部分,智能语音产业已步入快速发展的新阶段。”在日前举行的中国智能语音产业发展高峰论坛上,工信部信息技术发展司副司长王建伟介绍,近年来我国智能语音产业蓬勃发展,核心技术有所突破,目前语音识别准确率已达到98%。

最新发布的《20202021中国语音产业发展白皮书》(以下简称《白皮书》)显示,2020年我国智能语音市场规模达到217亿元,同比增长31%,2021年可达到285亿元,同比增长44%,有力带动产业数字化发展。“进入万物互联时代,越来越多的智能设备需要在一定距离外操控,为智能语音产业带来发展机遇。”中国语音产业联盟理事长、科大讯飞董事长刘庆峰介绍,语音交互赋能的智能设备正快速增长,以科大讯飞为例,2021年语音助手交互量同比增加84%。

随着我国智能语音产业进入规模化深耕期,如何加速关键技术研发和产业化,推动产业持续做大做强,成为业界普遍关注的问题。

“当下,智能语音技术发展面临多语种语言互通、复杂场景人机交互和多模态虚拟世界三大挑战。”刘庆峰分析,多语种不仅指国外语言也包括国内方言;复杂场景就是要在高噪音多人说话场景下做到精准识别,今年讯飞产品识别率有望从69%提升至80%;多模态交互,就是要在语音中加入音色、语气、表情、嘴型等因素,让感知更智能。

《白皮书》指出,智能语音未来发展的关键创新点,是无监督学习、多模态融合、脑科学交叉融合创新等。目前在算法上,无监督学习、低资源模型算法等需要突破。此外,作为算力基础的AI芯片领域,我国与国际先进水平仍存在差距。

推动智能语音产业高质量发展,下一步工信部将开展三方面工作。王建伟介绍,一是鼓励地方加快制定有利于促进智能语音技术与实体经济融合发展的产业政策。二是鼓励龙头企业、科研机构联合开展技术攻关,进一步提升语音识别、合成、交互和语音芯片等技术水平,并建设国家级检验检测等公共服务平台,为产业发展提供有力支撑。目前,中国语音产业联盟已吸引70多家产业链上下游拥有核心技术的企业,未来还将再增加70家相关企业,并鼓励更多科研院校加入联盟。三是不断拓展应用场景,加速语音技术在智能制造、智能家居、智慧医疗、教育养老等领域的融合应用。

《 人民日报 》( 2022年01月05日 17 版)


赞助本站

相关内容
AiLab云推荐
推荐内容
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港