仅需十五秒即可复制原音，OpenAI展示全新音频模型 | 蓝媒GPT-人工智能应用-人工智能实验室AiLab-中国人工智能网-Powered by AiLab.cn

仅需十五秒即可复制原音，OpenAI展示全新音频模型 | 蓝媒GPT

来源：互联网发布日期：2024-04-01 21:38:24 浏览：4071次

导读：OpenAI首次展示音频模型Voice Engine，15秒即可复制原音 3月30日凌晨，OpenAI在官网首次展示了全新自定义音频模型Voice Engine。用户只需要提供15秒左右的参考声音，通过Voice Engine就能生成几乎和原音一模一样的全新音频，在清晰度、语音连贯、音色、自然...

OpenAI首次展示音频模型Voice Engine，15秒即可复制原音

3月30日凌晨，OpenAI在官网首次展示了全新自定义音频模型“Voice Engine”。用户只需要提供15秒左右的参考声音，通过Voice Engine就能生成几乎和原音一模一样的全新音频，在清晰度、语音连贯、音色、自然度等方面比市面上多数产品都强很多。除了能合成音频之外，OpenAI还展示了Voice Engine很多其他际商业用途，例如，一位失去声音表达能力的女孩，在Voice Engine帮助下能像以前一样正常发音说话。

OpenAI据悉将于本月在东京开设首家亚洲办事处

4月1日，据市场消息，OpenAI将于本月在日本东京开设首家亚洲办事处，旨在为企业提供定制化服务，并参与制定AI技术相关道德准则。去年4月，OpenAI首席执行官山姆奥特曼曾在访问日本期间会见日本首相岸田文雄，并暗示将在日本设立办事处。

天工大模型3.0将于4月17日发布，开源4000亿参数MoE超级模型

昆仑万维将于4月17日发布天工大模型3.0，据悉天工3.0采用4千亿级参数MoE混合专家模型，并将同步选择开源，是全球模型参数最大、性能最强的MoE模型之一。

相较于上一代天工2.0MoE大模型，天工3.0模型技术知识能力提升超过20%，数学/推理/代码/文创能力提升超过30%。同时，天工3.0也将是全球首个多模态“超级模型”（Super Model），其集成AI语音合成、AI音乐生成、AI代码写作、AI表格生成等多项能力。其中，天工3.0 AI音乐生成大模型SkyMusic还将在4月2日（明日）面向社会开启邀测。

彼得蒂尔支持的AI创企Cognition Labs寻求以至多20亿美元估值融资

据报道，开发代码编写AI工具的初创公司Cognition Labs正与投资者洽谈，寻求以至多20亿美元的估值获得融资。如果按照这一估值完成融资，这笔新资金将使该初创公司的估值增至几周前的近六倍。

知情人士透露，Cognition现有股东Founders Fund等硅谷风投公司正洽谈参与本轮融资。据悉，Cognition去年才开始研发自家产品，尚未产生任何有意义的收入。今年早些时候，Founders Fund领投对Cognition的一轮2100万美元的融资，对其估值为3.5亿美元。Founders Fund创始人、科技大鳄彼得蒂尔帮助领导了对Cognition的投资。

无问芯穹发布“无穹Infini-AI”大模型开发与服务平台

3月31日，无问芯穹发布“无穹Infini-AI”大模型开发与服务平台，目前已支持Baichuan2、ChatGLM2、ChatGLM3、ChatGLM3闭源模型、Llama2、Qwen、Qwen1.5系列等共20多个模型，以及AMD、壁仞、寒武纪、燧原、天数智芯、沐曦、摩尔线程、NVIDIA等10余种计算卡，支持多模型与多芯片之间的软硬件联合优化和统一部署。该平台宣布自3月31日起正式开放全量注册，给所有实名注册的个人和企业用户提供百亿tokens免费配额。

杨元庆：AI PC本月18日在中国面世

联想集团2024/2025财年誓师大会在北京举行，联想集团董事长兼CEO杨元庆称，AI PC将在本月18日在中国面世。

Lanmeih/今日话题

你对OpenAI的语音模型有什么期待？

相关热词： 仅需十五秒即可复制原音 OpenAI 展示全新音

仅需十五秒即可复制原音，OpenAI展示全新音频模型 | 蓝媒GPT
来源：互联网发布日期：2024-04-01 21:38:24 浏览：4071次

相关内容

AiLab云推荐

最新资讯

本月热点

热门排行

推荐内容

在线客服

热门栏目HotCates

关于我们

版权声明

仅需十五秒即可复制原音，OpenAI展示全新音频模型 | 蓝媒GPT 来源：互联网 发布日期：2024-04-01 21:38:24 浏览：4071次