展会信息港展会大全

当前位置：人工智能实验室> 人工智能动态 > 微软探索音生图 AI 模型，实时视觉化会议演讲者语音讲述的场景

微软探索音生图 AI 模型，实时视觉化会议演讲者语音讲述的场景
来源：互联网发布日期：2024-10-15 18:49:40 浏览：495次

导读：IT之家 10 月 15 日消息，科技媒体 MSPoweruser 昨日（10 月 14 日）发布博文，报道称微软公司获得了一项新的专利，描述了基于用户实时输入的语音来生成图片。根据美国商标和专利局最新公示的清单，该专利共计 20 页，微软于 2023 年 4 月 5 日提交申请，于...

IT之家 10 月 15 日消息，科技媒体 MSPoweruser 昨日（10 月 14 日）发布博文，报道称微软公司获得了一项新的专利，描述了基于用户实时输入的语音来生成图片。

根据美国商标和专利局最新公示的清单，该专利共计 20 页，微软于 2023 年 4 月 5 日提交申请，于 10 月 10 日获批。

根据专利描述，该系统可以在会议或讲座中实时捕捉音频，随后通过语言模型进行总结，并生成相应的 AI 图像。

IT之家援引该媒体报道，该工作会分为 3 个步骤：

捕捉音频：用户通过麦克风发言，系统实时记录并转化为文本。

处理文本：分段记录文本，每段内容通过语言模型进行总结。

生成图像：根据总结生成的提示，系统创建 AI 生成的图像，并在屏幕上实时显示。

预计该功能将主要应用于 Microsoft Teams。随着演讲者话题的变化，实时生成的图像也会随之更新，从而增强视觉沟通的效果。微软表示，这种图像的使用有助于澄清概念，特别适合通过视觉辅助学习的用户。

人工智能实验室

相关热词： 微软探索音生模型实时视觉会议演讲者语音讲述

上一篇：200亿新风口突然爆火，“AI 智能体硬件”概念会否产生泡沫？｜钛媒体AGI

下一篇：字节跳动海外又裁员了：涉及数百人工作将被AI取代

相关内容

AiLab云推荐

最新资讯

本月热点

热门排行

存储芯片年涨七成不算完：AI需求接棒，大厂持续加注

阅读量：17208

美大选逼近！传大陆芯片设计业计划从台积电转单三星

阅读量：13277

美国芯片制造业迎来历史性投资，狂砸资金新建工厂

阅读量：12756

世界首款！清华大学研制出类脑互补视觉芯片，可实现10000帧/秒！

阅读量：11334

马斯克：Neuralink 今年预计完成 10 例脑机接口植入手术

阅读量：11231

黄仁勋对话扎克伯格：新款芯片样品本周发送，AI行业还有5年产品创新期

阅读量：10953

推荐内容

展开

热门栏目HotCates

关于我们

人工智能实验室（AiLab：Artificial Intelligence Laboratory）中国人工智能领域的专业媒体平台，始于2010年的中国AI创业先行者，专注人工智能、机器人、无人驾驶、可穿戴、模式识别、物联网、云计算等新兴技术信息资讯，是人工智能爱好者学习和交流平台，是一群梦想者与实践者的网络家园！

版权声明

本站部分文章来源于互联网以及网友投稿，本站只负责对文章进行整理、排版、编辑，是出于知识传递之目的，并不意味着赞同其观点或证实其内容的真实性。如果您有什么意见或建议，请联系E-mail：kefu#ailab.cn(将#换成@)！

Copyright © 2010-2024 AiLab Team. 人工智能实验室版权所有关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港