近期,中国计算机学会计算机视觉专委会(CCF-CV))年度学术研讨会RACV(Recent Advances on Computer Vision)在大连成功召开。本次会议开幕式由专委会副主任、上海科技大学虞晶怡教授主持,中国计算机学会秘书长唐卫清研究员和大连理工大学卢湖川教授致开幕辞,来自清华大学、北京大学、上海交通大学、中科院等高校、学术机构的研究者们与百度、华为、微软亚洲研究院、航天宏图、合合信息等科技企业的技术专家受邀参与讨论。
RACV2022与会嘉宾合影
中国计算机学会计算机视觉专委会 (下称“专委会”)是直属于中国计算机学会的计算机视觉领域的专业分支机构,其目标是基于计算机视觉学科的专业内容,更好地开展学术/技术交流、发展战略研究,促进国内学者间的了解与合作,推动国内计算机视觉学科发展,提升我国计算机视觉研究在国际领域的影响力。RACV定位为国内计算机视觉领域的小规模精品研讨会,旨在通过务实、开放与平等的对话与讨论,深入发掘相关研究领域潜在的问题,为广大的科研人员提供观察问题的新视角与新观点。
根据专委常委会前期的讨论票选,本次会议设置了3项核心研讨主题。在主题一“视觉基础模型”研讨会上,与会嘉宾对掩码图像建模、自监督表征预训练、语言对视觉基础模型的作用等问题进行了探索;主题二“三维重建和沉浸式渲染”则重点关注神经网络渲染和生成技术、三维重建和沉浸式渲染的学术前沿和发展方向、元宇宙背景下的商业前景和潜在风险;主题三为“具身视觉”,主要讨论具身智能的核心科学问题及在计算机视觉领域的角色、技术路线、评价标准、如何推动智能机器人落地等议题。
主题研讨环节中,各位专家学者就上述主题展开深度交流,合合信息自然语言算法研发总监丁凯博士、图像算法研发总监郭丰俊博士也针对“视觉基础模型”、“三维重建和沉浸式渲染”两个议题发表观点,提出视觉基础模型在与其他模态进行融合时,可关注如何与现有的结构化的知识进行融合,提升视觉基础模型的理解能力。此外,三维重建、沉浸式渲染等技术目前在元宇宙的背景下更聚焦于视觉重建。这些技术如何更好地与人类的常识和知识相结合,以实现虚拟世界人与人之间顺利沟通、互动的愿景,将成为未来商业化前景的新增量。
合合信息是一家人工智能及大数据科技企业,从2006年创立至今,在智能文字识别应用领域有着十余年研究积淀。据悉,合合信息专注于智能文档图像处理、复杂场景文档识别、手写字迹擦除等技术,近三年来先后在ICDAR、ICPR等15项人工智能国际竞赛中斩获冠军,学术成果发表于CVPR、AAAI、ACL等顶会。合合信息运用多项创新技术,显著提升复杂场景下文字识别与理解的性能和效果,相关项目曾获中国图象图形学学会(CSIG)科技进步奖二等奖,并被应用于C端、B端产品以及行业解决方案,为全球百余个国家和地区的亿级用户提供数字化、智能化服务。