智东西(公众号:zhidxcom)
作者 |李水青
编辑 |漠影
智东西12月31日三亚报道,昨日,在2020腾讯优图年度媒体沙龙上,优图实验室各业务负责人对优图今年在研发及产业落地中的成果进行了全面而详细的总结分享。
腾讯优图实验室总经理吴运声表示,优图本次沟通会的主题是“再出发”,意指在2020年疫情打乱各行各业节奏的背景下,优图在以全新姿态重启整个组织和团体。
腾讯优图实验室副总经理黄飞跃表示,在当下产业互联网时代,优图实验室的定位是Π型实验室。2020年,优图实现了多项场景化AI技术的突破和研究层面的全面自动化,其中模型自动化生成能使算法调优耗时降低90%。
谈到当下优图AI产业落地面临的难点,黄飞跃明确表示是AI需求的碎片化、场景化,并对优图已有的思考和应对方案进行了以点带面的解读。
黄飞跃报告到,目前,优图实验室已经在全球获得超过800项专利,有超过50余项专业比赛、活动中的冠军或刷新世界记录。同时,优图已推出20多个“AI+”解决方案,并达成100多个明星案例。
沟通会最后,智东西等少数媒体对腾讯优图实验室副总经理黄飞跃 、腾讯优图实验室总监任博及总监吴永坚进行了专门提问。
一、吴运声:落地健康码、腾讯会议等,同时促进科技向善
尽管在2020年新冠肺炎疫情令许多行业部署打乱,吴运声称,优图AI技术依然在多个行业取得突破。
比如在疫情中,优图主导的人脸核身为主导的健康码技术,在全国30多个省市、直辖市、区域得到应用,克服了许多困难。
也由于疫情,腾讯会议被许多人熟练使用,其中优图计算机视觉等AI技术也被广泛应用,体现在AI美颜、去除背景、视线矫正、暗光优化等许多智能化功能上。
此外,腾讯还联合腾讯海纳推出了健康申报、人车管理、体温筛查以及智能隔离等功能,并在全国多个小区落地应用。吴运声说,在过去一年疫情比较严重的时期,优图技术依然在工业、教育、文旅等行业取得突破。
除了产业化,吴运声提到优图也在科技向善上做不断的努力。比如推出手语互动、视障人士读图支持等应用,也是在今日,腾讯优图就联合内外发起腾讯Light公益创新挑战赛,发动更多产业人参与到科技公益中来。
二、多模态生物识别、人脸识别反攻击等方面获突破
会上,腾讯优图实验室副总经理黄飞跃进一步具体解读了腾讯优图这一年的发展。黄飞跃认为可以用两个关键词总结突破和自动化。
优图在哪些方面取得了“突破”?
黄飞跃以点带面地谈到了多模态生物识别、泛人脸识别、防Deepfake人脸攻击等具有代表性的领域。
在多模态地生物识别领域,优图的技术目前从早期的光学人脸识别拓展到3D人脸识别,再到近红外、掌纹、超声波、热红外等技术加持,经历了多轮迭代和深度融合。以优图活体检测为例,除了用到人脸识别技术,还加入超声波技术,以防止3D面具等破解AI的操作。
在泛人脸领域,优图从今年开始将真实人脸识别拓宽到动漫卡通人脸识别,比如版权保护、手绘图生成真实图像等技术,能够用于许多切实有需要的新行业场景。
在颇受争议的Deepfake等人脸攻击方面,优图在提供安全技术体系上取得突破,构建立体化防御层。除了针对利用照片、面具等物质介质进行防御,优图还在内容生成方面进行防御,全面覆盖人脸生成、编辑、替换等算法检测,另外还支持数字图像、物理世界对抗攻击防御。
三、自动化模型生成将算法调优耗时降低90%
如果说“突破”还好理解,那么黄飞跃口中的“自动化”又意指什么?
黄飞跃表示,目前优图已能实现研究层面全面地自动化。他同样以点带面地谈到了几个典型方面,包括自动化数据生成、自动化模型生成等。
在自动化数据生产方面,黄飞跃用案例进行了解读。比如自动化数据生成,腾讯优图在疫情期间,通过数字合成3800+万张戴口罩人脸图像,以支持在戴口罩监测场景的视觉AI应用。
还比如在自动化标签生成中,优图在海量车辆无标签数据上自动化生成标签,效率达到1200张图片/天,在某渣土车项目中使得整体效果提升43%。
在自动化模型设计方面,据称优图能够将算法人员的调优耗时降低90%,推理耗时降低93%。如果说这一提升效果能推广到更多的案例中,可以说能够大大提升模型的生产效率。
四、产业落地中,如何面对AI需求的碎片化、场景化?
优图在今年的产业落地中遇到了哪些问题?
对此黄飞跃表示,优图洞察到,当下AI需求整体呈现碎片化、场景化特征。
为应对这一行业问题,团队也制定了应对方案。针对AI需求碎片化特点,优图的解法是构建全面体验化能力;针对需求的场景化特征,优图则采取分布定制化解决方案。
1、构建全面体验化能力,应对需求碎片化问题
如何打造和施展全面体验化能力?黄飞跃首先通过腾讯会议的案例对此进行了解读。
黄飞跃表示,在腾讯会议使用过程中有许多碎片化的需求,为此优图进行了许多技术开发。比如聚焦用户开会背景中有私密性元素的问题,优图提供了基于人像分割技术的虚拟背景,使得边缘分割精度达像素级,并保证视频帧间的稳定处理。比如针对开会视线偏离及走神问题,优图研发并落地了眼神矫正算法。
在疫情中,超5000家政府和相关机构采用了优图提供人脸核身技术,离不开优图此前在腾讯会议、微众银行、腾讯小程序等项目中接触大量客户积累的经验。而除了人脸检测技术,优图的活体检测技术也很重要,也是通过海量用户触达更新技术。
在刷脸支付方面,优图的技术方案已经在100多个场景落地,为大量场景带去便捷支付体验。基于端云协同,方案能够实现秒级刷脸、精准3D识别,并开发出满足戴口罩识别、暗光刷脸等碎片化场景需求的方案。
在OCR识别方面,优图也构建了4大完整的解决方案,具备50项原子能力。当前,优图OCR能力已经从识别进化到理解,助力了金融、财税、法律服务等多个行业,比如在本次全国人口普查中就得以应用。
2、定制化解决方案,应对场景化
面对场景化的需求,优图如何做定制化解决方案?
黄飞跃以零售、工业、媒体业务三个行业为例进行了解读。
在零售方面,前几年行业长期以来关注人、货、场,而优图在此基础上,更注重以人为核心构建数字化连接,缩短人与货的连接路径,让场无处不在。以AI试装应用为例,优图的技术目前支持实时视频流,并大大提高色彩还原度及素材贴合度。
在工业方面, 面对各行各业差异化需求,今年优图联合腾讯云推出工业AI平台,目前已为3C、半导体行业的伙伴提供定制解决方案。
在媒体业务方面,优图推出媒体AI中台,已经在广电媒体行业深入落地,为广电传媒行业提供智能标签、智能编目、智能审核、智能拆条等全流程服务,赋能媒体行业转型。
五、做Π型实验室,不断自进化
黄飞跃表示, ∏型人才是指至少拥有两种专业技能,并能将多门知识融汇贯通的高级复合型人才。而作为一个研究和产业化两手抓的实验室,优图的定位是Π型实验室,是一个持续自进化的实验室。
回顾优图的发展历程,在早期互联网时代,腾讯优图主要专注基础研究;在互联网+时代,优图确立研发和落地两条腿走路;而进入当下的产业互联网时代,优图则更强调合作伙伴良好互动,一起发展AI事业、联结及AI生态。
当智东西问到,在各个阶段腾讯优图克服了或正在克服哪些难点?
黄飞跃表示,在互联网时代,优图1.0时期更聚焦于人脸技术的研发及视觉AI技术拓展,支持内部业务。当时的难点更多是挖掘重要的技术,让别的部门对团队有信心,达到深度合作。比如,2014年当时和微众银行合作时,就面临能否满足需求、符合金融标准等怀疑。
在互联网+时代,优图2.0一方面发力AI技术,另一方面在思考怎么更好地给外部客户实现实际价值。2.0初期优图还是独立实验室,这时候的难点聚焦于怎么了解外部客户的需求,做出更多有价值的事情。
而到了产业互联网时代,优图3.0已经加入腾讯云与智慧产业大事业群(CSIG),而当下AI落地已经非常普及。面临的新问题是AI需求非常碎片化、发散,因此需要专业解决方案的定制,比如优图推出了工业、传媒等AI平台。另一方面,面对长尾化、场景化的需求,优图也推出了自动化AI平台。
六、不为了开源而开源,生态构建是自然而然的事
在会议最后的采访环节,当智东西问到,优图在今年6月开源的AI框架TNN有什么亮点和最新反馈?优图又如何看待开源生态?
腾讯优图实验室总监吴永坚表示,优图早在2016年就开源了专注移动端的推理框架ncnn,而今年开源的TNN是对ncnn框架进行了重构升级。TNN是针对手机端的高性能、轻量级移动端推理框架,更支持跨平台能力,另外和算法有更好的结合,大大降低了开发门槛。
在技术生态方面,吴永坚认为生态构建是一个自然而然的过程。它谈到了优图开源AI框架的初衷:优图对于开源,不为开源而开源,还是希望自身先用起来,然后本着程序员的情怀,把优质的框架开放共享。
结语:头部玩家打磨差异化,推动AI落地行业
时至年关,个人、企业都在对自身一年的得失功过进行总结回顾。对于腾讯优图来说,2020年的疫情危机也为AI技术产业化带来了转机。相比于2019年,优图今年在展示AI技术突破的同时,显然更关注产业落地进展。2021年,平衡好研发和产业化的关系,对优图来说依然尤为重要。
随着新基建的推进和产业AI化的深入发展,具有AI基础能力的头部科技企业在产业中的势能和影响力逐渐变大,相信行业不久后会迎来新的洗牌。
在当下视觉AI赛道上,各大头部玩家进入打磨差异化的阶段,谁能够在下一步将AI落地的小旗子插到更多的山头,我们拭目以待。