IT之家 11 月 20 日消息,微软近日在 WIPO 知识产权门户网站上提交了一项专利,专利题为“用于合成音频的人工智能模型”。
专利说明微软正在发明一种智能音频合成技术,用于为各种媒体如电影、电视节目、游戏,甚至现场录音创造声音、音乐和其它音频元素。该专利提到了游戏中的动态时刻,表明它可以创造出配合玩家行动的乐谱。该专利的摘要指出,可以使用视觉、音频和文本特征及提示(统称为“数据集”)来设置参数,以指导众多的人工智能模型构建音频乐谱。
IT之家了解到,人工智能在视频游戏中发挥着不可或缺的作用。从敌人的行为和战斗遭遇到程序性关卡的生成以及与 NPC 和环境的互动,人工智能在游戏开发的各个层面都是不可或缺的。在声音设计方面,自适应 / 动态配乐在许多视频游戏中都有体现,如现代《毁灭战士》游戏、《合金装备崛起》、《鬼泣 5》等。
微软的新专利描述详细介绍了众多的人工智能引擎,这些引擎的任务是根据提供的数据集进行音频播放。他们可以分析人类的表情和情绪,收集位置数据,分析形势的基调等等。人工智能可以学习图片、视频、电影、现场活动,并产生一组音频文件,可以用适当的声音效果和音乐为视觉效果分层。这种高科技的人工智能可以为媒体创作开辟许多令人兴奋的道路,人们可以用一个巨大的、不断增长的音频乐谱库来制作电影、游戏等,例如为英雄的出场设计一首史诗般的管弦乐曲,为宠物的离去谱写一首忧郁的曲子,为枪声和爆炸开发音效,所有这些都可以委托给人工智能的算法。
IT之家了解到,该技术将由云计算驱动。该系统何时能真正投入使用还有待观察,但音频设计的未来看起来很有希望,微软可能会在这方面掌舵一场革命。