展会信息港展会大全

借助AR Translate,谷歌翻译已支持图片中的文字
来源:互联网   发布日期:2023-03-14 19:25:05   浏览:7061次  

导读:日前谷歌方面宣布,谷歌翻译网页版已支持直接翻译图片上的文字内容,并且翻译后的文字可直接复制,或是保存翻译后的图片。据悉,这一功能的实现得益于其使用了AR Translate(AR翻译)技术,目前已支持113种源语言与133种目标语言,同时Google Lens同样也是借...

日前谷歌方面宣布,谷歌翻译网页版已支持直接翻译图片上的文字内容,并且翻译后的文字可直接复制,或是保存翻译后的图片。据悉,这一功能的实现得益于其使用了AR Translate(AR翻译)技术,目前已支持113种源语言与133种目标语言,同时Google Lens同样也是借助这项技术服务用户。

经验证发现,更新后的谷歌翻译网页中新增了图片翻译选项,用户选择图片翻译后、可上传图片按需选择语言进行翻译。但翻译后的图片,则有可能会出现版面及字体大小的调整。

据了解,2017年5月发布的Google Lens目前同样也使用了AR Translate技术,这是一款基于图像识别与OCR的人工智能应用,能够借助摄像头识别物体后提供搜索服务,功能也已从最初的物体识别更迭到可货币化搜索。此前在今年2月,谷歌方面在一场人工智能主题的活动中透露,Google Lens每月的搜索量已达100亿次。

此外,近日谷歌相关团队在还联合柏林工业大学推出了一款视觉语言模型PaLM-E,该模型通过PaLM-540B语言模型与Vit-22B视觉Transformer模型结合后的最终参数高达5620亿,不仅能进行简单的问答对话,还能指导机器人完成相对复杂的指令。同时谷歌方面还表示,其公布的通用语音模型USM也已实现升级,目前能检测和翻译包含英语、汉语在内的多种语言。在谷歌官方博客中还透露,与OpenAI的语音模型Whisper相比,USM的数据训练时长更短、错误率更低。

【本文图片来自网络】

赞助本站

人工智能实验室
AiLab云推荐
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港