IT之家 11 月 6 日消息,人工智能技术的进步,对语音合成(TTS)的自然性和表现力的需求越来越高。上个月,微软发布了三种专为对话场景设计的新型逼真的人工智能语音。近日,微软又为美国东部 / 东南亚 / 西欧地区等更多区域发布了 7 种新的逼真的人工智能语音,涵盖了法语(加拿大)、法语(法国)、德语(德国)、意大利语(意大利)、韩语(韩国)、葡萄牙语(巴西)、西班牙语(西班牙)等语言。
这些新的语音非常适合需要生动的语音交互的应用,包括聊天机器人、语音助手、游戏、在线学习、旅游景点等。
除了这 7 种新的语音,微软还对现有的 3 种语音进行了更新,增加了更多的表现力。
微软是如何创建这些逼真的人工智能语音的呢?微软称,“我们首先为每种语音设计了一个人格,就像一个真实的人一样,友好而乐观,总是乐于帮助别人,分享有趣或实用的知识。这种语音的说话风格类似于与熟人喝茶时的对话,保持自然而不夸张的语气。”
目前,微软提供了超过 400 种神经网络语音,覆盖了 140 多种语言和地区,IT之家小伙伴在这里试听这些新的语音。