展会信息港展会大全

直击|阿里公布新语音合成技术 录音10分钟定制AI语音
来源:互联网   发布日期:2019-07-10   浏览:406次  

导读:新浪科技讯,7 月 10 日下午消息,阿里巴巴发布新一代语音合成技术 KAN-TTS,称可大幅提高合成语音与真人发声的相似度,并将语音合成定制成本降低 10 倍以上。该技术由达摩院机器智能实验室自主研发。 阿里方面称,当前业界商用系统的合成语音与 ......

新浪科技讯,7 月 10 日下午消息,阿里巴巴发布新一代语音合成技术 KAN-TTS,称可大幅提高合成语音与真人发声的相似度,并将语音合成定制成本降低 10 倍以上。该技术由达摩院机器智能实验室自主研发。

阿里方面称,当前业界商用系统的合成语音与原始音频录音的接近程度通常在 85% 到 90% 之间,而基于 KAN-TTS 技术的合成语音可将该数据提高到 97% 以上。

据悉,KAN-TTS 由达摩院机器智能实验室自主研发,深度融合了目前主流的端到端 TTS 技术和传统 TTS 技术,从多个方面改进了语音合成。传统语音合成定制需要 10 小时以上的数据录制和标注,对录音人和录音环境要求很高。从启动定制到最终交付,项目周期长成本高。

阿里利用 Multi-Speaker Model 与 Speaker-aware Advanced Transfer Learning 相结合的方法,将语音合成定制成本降低 10 倍以上,周期压缩 3 倍以上。也就是说,用 1 小时有效录音数据和不到两个月制作周期,就能完成一次标准 TTS 定制。

此外,这使得普通用户定制 AI 声音 的门槛更低。只需手机录音十分钟,就能获得与录制声音高度相似的合成语音。(韩大鹏)

赞助本站

人工智能实验室

相关热词:

AiLab云推荐
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港