展会信息港展会大全

仅需十五秒即可复制原音,OpenAI展示全新音频模型 | 蓝媒GPT
来源:互联网   发布日期:2024-04-01 21:38:24   浏览:4071次  

导读:OpenAI首次展示音频模型Voice Engine,15秒即可复制原音 3月30日凌晨,OpenAI在官网首次展示了全新自定义音频模型Voice Engine。用户只需要提供15秒左右的参考声音,通过Voice Engine就能生成几乎和原音一模一样的全新音频,在清晰度、语音连贯、音色、自然...

OpenAI首次展示音频模型Voice Engine,15秒即可复制原音

3月30日凌晨,OpenAI在官网首次展示了全新自定义音频模型“Voice Engine”。用户只需要提供15秒左右的参考声音,通过Voice Engine就能生成几乎和原音一模一样的全新音频,在清晰度、语音连贯、音色、自然度等方面比市面上多数产品都强很多。除了能合成音频之外,OpenAI还展示了Voice Engine很多其他际商业用途,例如,一位失去声音表达能力的女孩,在Voice Engine帮助下能像以前一样正常发音说话。

OpenAI据悉将于本月在东京开设首家亚洲办事处

4月1日,据市场消息,OpenAI将于本月在日本东京开设首家亚洲办事处,旨在为企业提供定制化服务,并参与制定AI技术相关道德准则。去年4月,OpenAI首席执行官山姆奥特曼曾在访问日本期间会见日本首相岸田文雄,并暗示将在日本设立办事处。

天工大模型3.0将于4月17日发布,开源4000亿参数MoE超级模型

昆仑万维将于4月17日发布天工大模型3.0,据悉天工3.0采用4千亿级参数MoE混合专家模型,并将同步选择开源,是全球模型参数最大、性能最强的MoE模型之一。

相较于上一代天工2.0MoE大模型,天工3.0模型技术知识能力提升超过20%,数学/推理/代码/文创能力提升超过30%。同时,天工3.0也将是全球首个多模态“超级模型”(Super Model),其集成AI语音合成、AI音乐生成、AI代码写作、AI表格生成等多项能力。其中,天工3.0 AI音乐生成大模型SkyMusic还将在4月2日(明日)面向社会开启邀测。

彼得蒂尔支持的AI创企Cognition Labs寻求以至多20亿美元估值融资

据报道,开发代码编写AI工具的初创公司Cognition Labs正与投资者洽谈,寻求以至多20亿美元的估值获得融资。如果按照这一估值完成融资,这笔新资金将使该初创公司的估值增至几周前的近六倍。

知情人士透露,Cognition现有股东Founders Fund等硅谷风投公司正洽谈参与本轮融资。据悉,Cognition去年才开始研发自家产品,尚未产生任何有意义的收入。今年早些时候,Founders Fund领投对Cognition的一轮2100万美元的融资,对其估值为3.5亿美元。Founders Fund创始人、科技大鳄彼得蒂尔帮助领导了对Cognition的投资。

无问芯穹发布“无穹Infini-AI”大模型开发与服务平台

3月31日,无问芯穹发布“无穹Infini-AI”大模型开发与服务平台,目前已支持Baichuan2、ChatGLM2、ChatGLM3、ChatGLM3闭源模型、Llama2、Qwen、Qwen1.5系列等共20多个模型,以及AMD、壁仞、寒武纪、燧原、天数智芯、沐曦、摩尔线程、NVIDIA等10余种计算卡,支持多模型与多芯片之间的软硬件联合优化和统一部署。该平台宣布自3月31日起正式开放全量注册,给所有实名注册的个人和企业用户提供百亿tokens免费配额。

杨元庆:AI PC本月18日在中国面世

联想集团2024/2025财年誓师大会在北京举行,联想集团董事长兼CEO杨元庆称,AI PC将在本月18日在中国面世。

Lanmeih/今日话题

你对OpenAI的语音模型有什么期待?

赞助本站

人工智能实验室
相关内容
AiLab云推荐
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港