人工智能的发展已进入一个全新阶段,开源开放已成为推动技术持续进步的行业共识和重要驱动力量。
在9月1日举行的2022世界人工智能大会(WAIC)科学前沿全体会议上,上海人工智能实验室(下称“实验室”)发布了“OpenXLab浦源”人工智能开源开放体系,该体系九大开源项目,覆盖从感知到决策,从平面到立体,从数据到计算,从技术到人文教育的各个方面。
“‘OpenXLab浦源’代表着上海人工智能实验室在人工智能探索道路上到达了新的里程碑。”上海人工智能实验室教授林达华表示,“X代表着未知、开放与成长,而’浦源’意味着上海人工智能实验室立足黄浦江畔,以上海为策源地,面向全球,面向未来,以原创的人工智能开源技术,携手合作伙伴共同打造人工智能开源开放生态。”
OpenMMLab百万开发者使用
据介绍,“OpenXLab浦源”人工智能开源开放体系包含OpenMMLab 2.0浦视视觉算法开源体系,OpenGVLab书生通用视觉开放体系,OpenDILab 1.0浦策决策智能开源平台,以及首次亮相的OpenXDLab浦画高质量数字内容平台、OpenDataLab浦数人工智能开放数据平台、 OpenComputeLab浦算人工智能开放计算体系等6个平台。
作为深度学习时代最具影响力的视觉算法开源体系,OpenMMLab 1.0自2021年7月发布至今,已被全球100多个国家和地区的百万开发者使用。
此次全新升级的OpenMMLab浦视2.0视觉算法开源体系引入全新训练架构MMEngine,实现了不同代码库的接口统一,使新算法的拓展更加灵活和高效。同时围绕自监督学习等前沿方向新建6个算法库,实现从模型训练、部署到推理无缝衔接,打通了AI落地的最后一公里,并对训练和推理芯片进行广泛适配,促进了软硬件生态共同发展。
举一反三的“书生”模型
发展更为通用的AI技术是人工智能的科技前沿和核心焦点问题。
在OpenXLab浦源中,OpenGVLab书生通用视觉开源开放平台面向学术界和产业界发布了高效预训练模型,实现分类、目标检测、语义分割及深度估计四大任务26个场景性能显著提升,仅用10%的数据便可超越OpenAI的CLIP模型。目前,OpenGVLab书生 2.0正在打造涵盖数据、模型、评测、标准和应用等的通用视觉技术体系,帮助开发者快速降低通用视觉模型开发门槛。
去年11月,上海人工智能实验室发布“书生”,一个模型即可全面覆盖分类、目标检测、语义分割、深度估计四大视觉核心任务。将通用视觉技术体系命名为“书生”,意在体现其如同书生一般的特质,可通过持续学习,举一反三,逐步实现通用视觉领域的融会贯通,最终实现灵活高效的模型部署。
2022WAIC首日发布的人工智能模型“书生2.0”,则可以更加精准地识别图像,在图像标杆任务上性能取得显著提升,并在三十多种视频任务上取得了领先的性能,还可实现以中文为核心的百种语音翻译。
“实验室正在打造以视觉和自然语言为核心的通用模型技术体系,包括基础理论方法、数据集、模型集、下游任务和应用生态等。”上海人工智能实验室领军科学家乔宇表示,“面向未来,‘书生’期望实现以一个模型谱系完成上千种任务,体系化解决人工智能发展中的诸多瓶颈问题。推动人工智能从单任务单模态可用到多任务多模态安全易用,从感知智能到认知智能的跃迁。”
此外,“书生2.0”通用视频模型探索掩码学习和对比学习相结合的训练范式,突破视频自监督学习的性能瓶颈,构建了首个具有体系化动态感知能力的视频大模型,全面覆盖基础视频识别、开放视频感知、时空语义解析三大核心领域。在视频识别、视频时空检测、视频时序定位、视频检索等三十多种视频任务上精度世界领先,在视频识别标杆基准库Kinetics 400上首次取得超越90%的Top1准确率,达到91%。同时实现了使用成本更低、更低碳、更环保的目标。相比达到谷歌的CoCa和微软的SwinV2-G的相似效果,“书生”使用的计算量远远小于前两者,据测算可累计减少碳排放量31余吨。
从科学技术到人文教育
人工智能技术的突飞猛进,离不开数据和算力两个重要的基石。
全新的OpenDataLab浦数人工智能开放数据平台汇聚了海量的数据资源,包括覆盖800多种任务类型的3000多个数据集,并提供便捷检索和快速下载服务。OpenDataLab还和OpenXLab的各个开源算法体系紧密衔接,通过一个简单的命令行工具,即可实现一键部署、开箱即用。
随着算法的快速演进,各种架构芯片层出不穷,算法与芯片的适配成为了当今人工智能计算领域最重要的挑战之一。OpenComputeLab浦算人工智能开放计算体系旨在让AI计算更开放、更高效、更简单。其率先推出了“算子图谱”,从算法应用的视角出发,体系化梳理深度学习相关的数以百计的算子,形成分类分级体系,并构建了一个开放式评测框架,可对计算性能进行全面深入的分析,为上下游的协同演进提供有价值的参考指引。
不只是技术领域,本次发布的开源开放体系涵盖了人文教育领域。实验室协同清华大学和复旦大学共同打造了OpenEGLab蒲公英人工智能治理开放创新平台。以“蒲公英”寓意希望、温暖和友谊,该平台旨在构建系统、实用的人工智能治理基础设施,探索“规则-技术-场景-评测”一体协同的治理创新体系,推动多学科交叉、多元主体共享共建,促进人工智能可信、可持续发展。而OpenInnoLab浦育青少年人工智能开放创新平台,则可为从事AI教育的教师以及对AI科创感兴趣的学生提供前沿、多元、易用、连通的学习创作工具,并配以丰富的课程与实践案例,在普及推广人工智能科学技术的同时,鼓励青少年应用AI工具进行科学探究与创新。