展会信息港展会大全

为解决HoloLens 2手部追踪模型拟合,微软提出全新曲面模型冯氏曲面
来源:互联网   发布日期:2020-08-09 14:28:14   浏览:41890次  

导读:来源:映维网 作者 黄颜 混合现实中的实时感知和交互能力要求资源受限的硬件(如头戴式设备)以低延迟解决一系列的3D追踪问题。实际上,对于HoloLens 2等CPU和GPU可以用于应用程序的设备而言,多个追踪子系统需要在共享一个数字信号处理器的同时实现连续、实...

来源:映维网 作者 黄颜

混合现实中的实时感知和交互能力要求资源受限的硬件(如头戴式设备)以低延迟解决一系列的3D追踪问题。实际上,对于HoloLens 2等CPU和GPU可以用于应用程序的设备而言,多个追踪子系统需要在共享一个数字信号处理器的同时实现连续、实时的运行。

为了解决HoloLens 2手部追踪的模型拟合问题(计算预算大约比iPhone 7小100倍),微软团队提出了一种全新的曲面模型:“Phong Surface(冯氏曲面)”。

为解决HoloLens 2手部追踪模型拟合,微软提出全新曲面模型冯氏曲面

利用计算机图形学的思想,Phong Surface描述了与三角网格模型相同的3D形状,但其具有连续的曲面法线,从而能够使用Lifting-based Optimization优化方法,并比基于ICP的方法提供显著的效率提高。研究人员指出,Phong Surface保留了平滑曲面模型的收敛优势。

微软团队日前在ECCV 2020大会通过视频对所述模型进行了介绍,下面包括具体的字幕整理:

我们提出了一种使用Lifted Optimization来实现有效3D模型拟合的Phone Surface模型。

我们的模型拟合示例通过拟合离散3D数据来追踪人手的28个自由度。在头戴式增强现实系统(如HoloLens 2)中,这可以实现一种比当今所有计算系统都更为自然的交互机制。

HoloLens 2搭载了强大的CPU和GPU,但它们是为了用于应用程序,所以手部追踪必须由数字信号处理器以4GFLOPS的速度完成,亦即只有iPhone 7的1%。

对于之前的研究,效率的关键是使用Smooth Surface模型,Subdivision Surface或b样条曲线(bspline)。Smooth-Surface允许使用名为lifted optimization的优化方法,而所述方法能够大大减少了模型拟合中的迭代次数,并且支持使用更少的数据点。

涉及论文:Efficient and Precise Interactive Hand Tracking Through Joint, Continuous Optimization of Pose and Correspondences

尽管单个服务评估的计算成本要比Polygon Surface高出7倍,但总体的计算成本缩减是一次胜利。然而,要以4GFLOPS实现实时性,我们需要拿回7X的计算成本。所以,我们引入了一个全新的曲面模型:Phong Surface。

它的计算成本几乎与Polygon Mesh一样低,但保留了Lifted Optimization的优点,即快速收敛和更少的数据点。

Phong Surface的灵感来自于计算机图形学中的冯氏着色(phong shading)技术。这个模型使用Polyhedral Surface模型,但插值曲面法线。

下面我们在2D示例中进行详细说明。

我们使用非平滑的Polygon模型,并像Smooth Surface模型一样插值法线。

现在我们来看看当我们尝试将模型拟合到一定的数据时会发生什么。

我们会像往常一样从数据到模型形成对应关系。并且,我们不只是匹配最近的点,而是最小化加权损失,结合到曲面的距离,及曲面法线与数据的一致性。

请注意蓝色箭头。它们表示曲面法线对Lifted Optimization中的对应更新的贡献,而因为曲面法线在每个阶段中的任何位置都是相同,Polygon模型并不存在这种贡献。

这种更新提高了速度和精度。

下面我们展示了两个玩具示例的拟合方法对比:菜豆体和椭球体。我们比较三种类型的曲面:Subdivision Surface;Phong Surface和Triangle Mesh,以及两种优化方法:上面一行的Lifted Optimization和下面一行的ICP(Iterative Closed Point)。

在所有情况下,Lifted Phong的收敛速度与Lifted Subdiv一样快,但计算成本与Triangle Mesh一样(ps:听不清,这里不确定)。

对于菜豆体,Triangle Mesh不仅速度更慢,而且缺少表面法线的插值(ps:听不清,这里不确定)意味着它具有更多的Local Minima(局部极小值)。

回到HoloLens,Lifting意味着我们可以只使用数据的一小部分,例如示例中的绿点,而Phong Surface意味着我们可以以低成本且可靠的方式做到这一点。

综上所述,我们拥有了一个可同时处理双手,并以4Gaflops的速度实时运行的全关节式追踪系统。我们的技术不仅适用于手部追踪,同时适用于任何需要高效曲面拟合的情况,尤其是低功率设备。感谢观看。


赞助本站

相关内容
AiLab云推荐
推荐内容
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港