近日,国际计算机视觉领域顶级会议ICCV 2021举办的VIPriors挑战赛落下帷幕,赛事聚焦前沿的AI神经网络学习等问题展开,试图探索在少量训练样本情况下,如何提升AI模型学习效率。随着神经网络和视觉转换器的发展,给海量数据打标,已成为打造智能AI的基础,但对数据的收集和打标都需要高昂的成本,尤其是对海量的数据进行训练会消耗大量的计算资源,还会大幅增加“碳排放”。
来自清华大学、复旦大学、北京邮电大学以及南洋理工大学、中佛罗里达等国内外知名高校和阿里巴巴、海康威视、字节跳动、网易、松下电器等国内外研究AI技术的知名企业一同参赛。
最终,阿里安全团队通过“数据增强”“动态网络结构”“伪标签方法”等方式结合解题,赢得了图像分类赛道和工业检测赛道的双料冠军。阿里团队通过该方法,不仅降低了超过30%的AI模型算力成本,实现更低碳的AI计算,同时还提升了检测模型的检测精度。
参赛选手阿里安全算法工程师慧明介绍,工业检测赛道要求参赛者利用AI在1万辆涉及多种型号的破损自行车中,定位到每辆自行车丢失的零部件,按每辆自行车标注22个关键零部件来算,1万辆意味着总计有22万个零部件的检测量。
“主办方要求不能使用任何额外数据训练AI算法模型,只能用这1万张标注的自行车图训练出一个检测性能最好的AI。”慧明表示,这对现实应用中,AI模型遇到不同的问题场景或新风险,具有非常强的少样本训练实践参考意义。
ICCV2021 VIPriors使用的部分自行车赛题图片
最终,阿里安全算法专家们精心设计的检测算法模型以均值平均准确率30.4%的成绩获得工业检测赛道冠军。慧明介绍称,该新一代安全架构核心AI技术已应用在阿里的图片安全业务场景,并进行了商业化输出,帮助更多用户规避多变的内容风险。在“图像分类”赛道上,阿里安全设计的动态网络技术则实现了在少量样本且不需要预训练模型的前提下,提升了模型效果,这一“分类AI”也已经投入使用,帮助阿里多个业务线节约超过30%的成本。
上述技术对解决工业检测问题也有广阔想象空间,比如列车零部件缺失检测。为保障列车运行安全,检测工人依靠熟练的经验来检查列车的零部件是否缺失,但人力终究有限,遗漏的可能性很高,未来有望通过AI算法实现排查检测。
阿里安全人工智能治理与可持续发展实验室(AAIG)资深算法专家薛晖表示,AI等技术创新在保障网络安全和工业安全上有很大的想象空间。每一次学术界和工业界的携手试炼,是对未来依靠科技进步解决更多关系国计民生问题的开垦。