科技新闻讯 12月21日,首个具备多模态认知能力的同传系统搜狗同传3.0在极客公园创新大会上使用。搜狗同传3.0以“多模态”和“自主学习“为核心,加入视觉和思维能力,让机器同传不仅会听,还首次具备了会看、能理解会推理的能力。
搜狗在AI同传领域首创“语境引擎”,使得搜狗同传在“能听”的基础上,又解锁了“会看”和“能理解会推理”两项新技能,不仅能够通过“观看”自主学习演讲者的报告内容,更能够通过“理解”和“思考”,做出高质量的识别和翻译,这再次引领了行业的技术进步。
基于搜狗OCR(光学字符识别)技术,搜狗同传可以实时准确“观看”演讲者的PPT内容,将PPT的图像内容转化为语言文字,充分获取到当前演讲的个性化信息。
“能理解会推理”,则意味着同传具备了与人“共情”的能力。这归功于搜狗语境引擎的应用。该技术的原理是基于搜狗知识图谱和百科的知识推理能力,将通过OCR技术获取的演讲内容自动生成核心知识,并通过搜狗领先的知识图谱-搜狗知立方实时推理拓展,获取充分的背景知识,同时基于搜狗百科的中英术语库得到中英双语对照,实时优化同传识别和翻译的效果。
经过多重“感官”的调用,搜狗同传不仅可以做到翻译更加快速和准确,而且会更加自然,更加专业,更加智能。