展会信息港展会大全

谷歌Gemini多模态技术望推动人形机器人加速商业化 产业链公司受关注
来源:互联网   发布日期:2023-12-08 13:33:56   浏览:3030次  

导读:据报道,日前谷歌正式推出大模型Gemini,其最大亮点之一就是设计时就原生支持多模态,可以泛化并无缝理解、操作和组合不同类型的信息,包括文本、代码、音频、图像和视频,远远优于现有(近似)多模态模型,并且它的能力在几乎每个领域都是最强的。谷歌研发...

据报道,日前谷歌正式推出大模型Gemini,其最大亮点之一就是设计时就原生支持多模态,可以泛化并无缝理解、操作和组合不同类型的信息,包括文本、代码、音频、图像和视频,远远优于现有(近似)多模态模型,并且它的能力在几乎每个领域都是最强的。谷歌研发负责人Hassabis透露,谷歌DeepMind已经在研究如何将Gemini与机器人技术结合起来,与世界进行物理交互。他表示,新的多模态模型将成为智能体、规划和推理、游戏甚至物理机器人快速创新的基矗

多模态技术可以提高人机交互的效率和质量,使得用户可以更自然、更直观地与计算机进行交互。作为多模态应用重要场景的机器人领域方面,多模态技术可以帮助机器人实现更加精确、高效、协调的动作控制,从而提高机器人的工作效率和质量。此前,谷歌大模型PaLM-E驱动的机器人可以执行长跨度任务、执行规划任务、在给定图像的情况下讲述笑话等,Gemini望应用于完善机器人任务层的实践当中,推动人形机器人等细分产业加速商用,相关领域公司望迎来机遇。

华泰证券研报指出,机器人大模型的最终目标是提高人形机器人在不同场景和任务下执行的成功率。对于限定的应用场景和任务,从决策层、感知层和执行层三个角度出发,大模型需要具备自主可靠决策能力、多模态感知能力和实时精准运控能力;为了拓展到多样复杂的应用场景和任务,大模型还需要具备泛化能力和涌现能力。目前大模型不断迭代,已出现包含多种能力的“全能选手”,但仍存在感知模态不足、实时性差和泛化能力弱等问题。未来需要不断优化训练模型结构、训练方法和数据集,将多模态感知信息纳入模型,同时提高控制指令的生成速度和大模型的泛化和涌现能力。

中泰证券机械团队表示,考虑到后续大规模降本需求,国产设备替代势在必行。且滚柱丝杠生产过程中需要的螺纹磨床或车磨一体设备弹性较大,密切关注浙海德曼(车床)、日发精机(磨床、车床)、华辰装备(磨床)、海天精工(铣床)、宇环数控(磨床)等公司的研发进展。

国联证券认为,国内人形机器人产业将带动产业链各个环节的发展,一方面建议关注在AI大模型、自动驾驶、算法算力上有优势,并有望形成“数据闭环”的公司,如华为技术、小米科技、小鹏汽车等产业链相关环节公司。另一方面硬件端在视觉系统、传感器、电池、热管理、谐波减速器、丝杠、空心杯电机、无框力矩电机、行星减速器、轴承、精密齿轮箱、机床等环节具备技术优势或者高性价比的公司,重点推荐伟创电气、东华测试、信测标准。 受益标的:汇川技术、禾川科技、步科股份、绿的谐波、贝斯特、五洲新春、柯力传感、奥比中光、奥普光电、鸣志电器、拓邦股份。

赞助本站

人工智能实验室
AiLab云推荐
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港