展会信息港展会大全

当前位置：人工智能实验室> 人工智能应用 > Meta推出AI音频模型Audiobox，支持语音及文字同时输入

Meta推出AI音频模型Audiobox，支持语音及文字同时输入
来源：互联网发布日期：2023-12-06 13:32:13 浏览：3424次

导读：IT之家 12 月 4 日消息，Meta 日前推出了一款 AI 声音生成模型 Audiobox，能够同时接收语音及文字输入，用户可同时使用语音及文字描述，让这款模型生成所需的音频。据悉，这款模型基于 Meta 今年 6 月推出的 Voicebox AI 模型，据称 Audiobox 能生成各种环...

IT之家 12 月 4 日消息，Meta 日前推出了一款 AI 声音生成模型 Audiobox，能够同时接收语音及文字输入，用户可同时使用语音及文字描述，让这款模型生成所需的音频。

据悉，这款模型基于 Meta 今年 6 月推出的 Voicebox AI 模型，据称 Audiobox 能生成各种环境音、自然对话语音，并整合了音频生成和编辑能力，以便于用户自由生成自己所需的音频。

Meta推出AI音频模型Audiobox，支持语音及文字同时输入

Meta 介绍称，生成高品质音频需要有大量音频库及深厚的领域知识，但大众难以获得这些资源，而该公司推出这个模型旨在降低声音生成门槛，让任何人都更容易制作视频、游戏等应用场景的音效。

IT之家发现，这款 Audiobox 模型基于 Voicebox 的“引导声音”机制，以便于生成目标音频，并配合“流量比对（flow-matching）”扩散模型生成方法，以实现“声音填充（audio infilling）”功能，从而生成多层次的音频。

Meta 测试生成带有雷暴声的下雨音频，并输入一系列提示句进行演示，例如“流水声伴随鸟鸣”、“以高音调快节奏说话的年轻女性”等；同时测试了同时输入人声及文字提示，以生成带有情绪（“哀痛而缓慢”）并拥有背景音（身处教堂）的语音。

Meta推出AI音频模型Audiobox，支持语音及文字同时输入

Meta推出AI音频模型Audiobox，支持语音及文字同时输入

Meta 声称，Audiobox 在音质及“生成内容的准确度” 顺利击败了 AudioLDM2、VoiceLDM 及 TANGO，超越了现有最佳的音频生成模型。

Meta推出AI音频模型Audiobox，支持语音及文字同时输入

目前 Audiobox 已经开放向特定研究人员及学术界试用，以供测试模型品质及安全性，Meta 声称，他们计划“再过几周将社会全面公开该模型”。

人工智能实验室

相关热词： Meta 推出音频模型 Audiobox 支持语音文

上一篇：到2040年，“脑机芯片”将会非常普遍

下一篇：自动驾驶出租车可不带安全员，交通运输部发文明确自动驾驶商用要求

相关内容

AiLab云推荐

最新资讯

本月热点

热门排行

ChatGPT 设计了一款芯片

阅读量：200215

2023年全球风投额创5年最低，机构：今年会有更多创业公司倒闭

阅读量：199399

计算效率提升超60倍！中国公司杉数科技用GPU芯片开启运筹学新的“大航海时代”｜钛媒体焦点

阅读量：196152

2023，AI创业者的50条反思

阅读量：107261

专访清华大学脑机接口科研团队负责人：中美“脑机接口”下一突破是什么？

阅读量：67904

2024，AI芯片之争加剧

阅读量：24362

推荐内容

展开

热门栏目HotCates

关于我们

人工智能实验室（AiLab：Artificial Intelligence Laboratory）中国人工智能领域的专业媒体平台，始于2010年的中国AI创业先行者，专注人工智能、机器人、无人驾驶、可穿戴、模式识别、物联网、云计算等新兴技术信息资讯，是人工智能爱好者学习和交流平台，是一群梦想者与实践者的网络家园！

版权声明

本站部分文章来源于互联网以及网友投稿，本站只负责对文章进行整理、排版、编辑，是出于知识传递之目的，并不意味着赞同其观点或证实其内容的真实性。如果您有什么意见或建议，请联系E-mail：kefu#ailab.cn(将#换成@)！

Copyright © 2010-2024 AiLab Team. 人工智能实验室版权所有关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港