从文本到语音转换技术并不算是什么新鲜事物,不过目前这项技术还存在很多不完善的部分。而现在它遇到最大的困难就是,技术的进一步迭代和突破遭遇瓶颈。这意味着,如果您希望通过文本到语音来模拟真实的人类对话,那么这可能是一项非常困难的任务。
然而,在这个领域人类从来没有放弃探索,甚至已经付出了相当多的努力,最近,微软方面传出消息,他们似乎在这个技术领域取得了一些小小的突破。这次微软做出的模型在实际运用中可能进一步简化了转换过程,即使是普通人也能快速上手使用这项功能。这款AI转换软件是由中国研究人员开发的,基于200个语音样本,他们能够创造出听起来更加真实的语音。
技术突破的关键因素是“Transformers”,“Transformers”是一种深度神经网络,旨在模仿我们大脑中的神经元。通过使用转换器,它可以帮助它更有效地处理信息。到目前为止,从结果来看,新模型在单词可懂度方面的得分为99.84%,尽管有报道称它听起来仍然有点机械。如果想亲自体验一下你可以搜索GitHub上发布的样本去试听。
我们不得不承认,目前的效果听起来还是相当真实的,水平基本达到了谷歌的双重人工智能技术。虽然这些技术进步是受欢迎的,但我们也必须关注人工智能如果造假能力太强,我们也要警惕和担心它知否可能被滥用来传播错误信息。