去年,Facebook 将公司改名为“Meta”,使得元宇宙一度破圈,互联网企业纷纷入局。为了保护隐私,医疗行业、电信以及金融业开始利用合成数据,为数据共享提供更多的机会。在最新的新智者大会和百度ai大会上,业内大佬对对此合成数据和多模态AI领域普遍看好。在脉脉上,合成数据和多模态AI相关岗招聘需求旺盛,存在大量相关帖子。
多模态AI作为新崛起的领域,深受应届毕业生关注。某清华大学的硕士同学,已经发表了视觉语言推理多模态相关论文,目前有意大疆、腾讯、华为、还想了解一下NVIDIA。另一位应届硕士生同学,则向牛人请教视觉方向,应届生去业务部门还是去技术中台好,CV的可扩展赛道应该如何选择,得到了阿里大牛的回答。
(图片来自脉脉)
不仅求职者热情高涨,招聘方也动作频频。阿里巴巴很早就部署了内容AI平台,积极招募JAVA、C++、数据工程等方向的P7、P8工程师,主要服务于淘宝直播、短视频、直播APP等方面。华为等科技巨头也广招算法工程师、软件工程师,涉及人机交互和多模态AI等应用。
(图片来自脉脉)
另据脉友曝光,前微软副总裁,微软全球卓越工程师姚麟回归小冰团队,就任小冰公司首席技术官,帮助其扩大对话式人工智能、多模态交互、超自然语音、人工智能合成等方面的领先优势。
(图片来自脉脉)
巨大的人才需求背后,显示出了多模态AI 广阔的前景。报告显示,2030年,我国虚拟数字人市场规模将快速增长至2700亿。多模态AI助手成为服务型的主要增长动力。
(图片来自脉脉)
脉友在专栏中提到多模态AI应用场景主要包括车载、智能机器人、身份鉴定,具体通过语音识别、人脸识别、表情分析等综合手段识别人的情绪、疲劳状态等,对于更精准、主动和个性化的人机交互十分重要。
(图片来自脉脉)
除了数字人外,针对心理健康治疗,也有公司通过多学科交叉,提出了虚拟现实触发+柔性传感多模态数据采集+大数据AI模型的人工智能治疗方案,帮助预防、治疗心理疾玻而谷歌的NLP模型,衍生出的多模态AI GATO已经完成600多项任务,其中400多项都能达到人类专家的水准,着实令人震惊。
(图片来自脉脉)
当下,多模态技术处于起步阶段,尽管发展迅猛,距离实现人类级别的多模态感知能力还有一段很长的路要走,这也意味着需要更多研发多模态AI应用的企业和人才加入,积极探索更加符合人类认知习惯的前沿多模态技术,帮助AI全面理解真实世界,让AI更好地服务人类,创造更幸福的生活。