展会信息港展会大全

当前位置：人工智能实验室> 人工智能动态 > Meta发布Sapiens视觉模型，让 AI 分析和理解图片/视频中人类动作

Meta发布Sapiens视觉模型，让 AI 分析和理解图片/视频中人类动作
来源：互联网发布日期：2024-08-25 11:58:27 浏览：2357次

导读：IT之家 8 月 24 日消息，Meta Reality 实验室最新推出了名为 Sapiens 的 AI 视觉模型，适用于二维姿势预估、身体部位分割、深度估计和表面法线预测 4 种以人为中心的基本视觉任务。这些模型的参数数量各不相同，从 3 亿到 20 亿不等。它们采用视觉转换器架...

IT之家 8 月 24 日消息，Meta Reality 实验室最新推出了名为 Sapiens 的 AI 视觉模型，适用于二维姿势预估、身体部位分割、深度估计和表面法线预测 4 种以人为中心的基本视觉任务。

这些模型的参数数量各不相同，从 3 亿到 20 亿不等。它们采用视觉转换器架构，任务共享相同的编码器，而每个任务有不同的解码器头。

二维姿势预估：这项任务包括检测和定位二维图像中人体的关键点。这些关键点通常与肘、膝和肩等关节相对应，有助于了解人的姿势和动作。

身体部位分割：这项任务将图像分割成不同的身体部位，如头部、躯干、手臂和腿部。图像中的每个像素都被归类为属于特定的身体部位，这对虚拟试穿和医学成像等应用非常有用。

深度估计：这项任务是估算图像中每个像素与摄像头的距离，从而有效地从二维图像中生成三维图像。这对增强现实和自动驾驶等应用至关重要，因为在这些应用中，了解空间布局非常重要。

表面法线预测：这项任务是预测图像中表面的方向。每个像素都会分配一个法向量，表示表面朝向的方向。这些信息对于三维重建和了解场景中物体的几何形状非常有价值。

Meta 公司表示该模型可原生支持 1K 高分辨率推理，并且非常容易针对个别任务进行调整，只需在超过 3 亿张野生人类图像上对模型进行预训练即可。

即使在标注数据稀缺或完全是合成数据的情况下，所生成的模型也能对野生数据表现出卓越的泛化能力。

IT之家附上参考地址

人工智能实验室

相关热词： Meta 发布 Sapiens 视觉模型分析理解图片

上一篇：专访猎豹移动傅盛：机器人不是要做超级王炸，产品要慢慢生长

下一篇：人形机器人尚处马拉松前半程优必选业务战略这样布局

相关内容

AiLab云推荐

最新资讯

本月热点

热门排行

存储芯片年涨七成不算完：AI需求接棒，大厂持续加注

阅读量：16480

最新！马斯克脑机接口公司：首例人类脑机接口手术后，电极镶钉螺纹发生脱落，设备无法正常工作

阅读量：13368

美大选逼近！传大陆芯片设计业计划从台积电转单三星

阅读量：12469

发布会携M4芯片来袭，苹果AI时代开启？

阅读量：12327

美国芯片制造业迎来历史性投资，狂砸资金新建工厂

阅读量：11882

马斯克的脑机接口公司传来坏消息：首试者植入物出故障了！

阅读量：11381

推荐内容

展开

热门栏目HotCates

关于我们

人工智能实验室（AiLab：Artificial Intelligence Laboratory）中国人工智能领域的专业媒体平台，始于2010年的中国AI创业先行者，专注人工智能、机器人、无人驾驶、可穿戴、模式识别、物联网、云计算等新兴技术信息资讯，是人工智能爱好者学习和交流平台，是一群梦想者与实践者的网络家园！

版权声明

本站部分文章来源于互联网以及网友投稿，本站只负责对文章进行整理、排版、编辑，是出于知识传递之目的，并不意味着赞同其观点或证实其内容的真实性。如果您有什么意见或建议，请联系E-mail：kefu#ailab.cn(将#换成@)！

Copyright © 2010-2024 AiLab Team. 人工智能实验室版权所有关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港