导读:品玩7月27日讯,据微软官方消息,微软推出一款名为NaturalSpeech2的语音模型,可带来高质量的语音合成产品。 微软表示,NaturalSpeech2 可以生成具有不同身份的人声语音,拥有不同的韵律和风格,还具备唱歌能力。 实验结果表明,NaturalSpeech2 在零样本条件...
品玩7月27日讯,据微软官方消息,微软推出一款名为NaturalSpeech2的语音模型,可带来高质量的语音合成产品。
微软表示,NaturalSpeech2 可以生成具有不同身份的人声语音,拥有不同的韵律和风格,还具备唱歌能力。
实验结果表明,NaturalSpeech2 在零样本条件下生成的语音与语音提示和真实语音的韵律近乎一致,并且在 LibriTTS 和 VCTK 测试集上的自然度(以 CMOS 为度量)与真人语音难以区分。