在发布会上,旷视正式发起了Detection In the Wild 2019(DIW 2019)挑战赛,旷视首席科学家兼研究院院长孙剑作为竞赛专家委员会的成员,就竞赛相关问题进行了详细介绍。
图:旷视首席科学家兼研究院院长孙剑对DIW 2019挑战赛进行介绍
旷视举办DIW 2019挑战赛,探讨检测问题的瓶颈及优化方向
据孙剑介绍,DIW 2019挑战赛由旷视研究院联合北京智源人工智能研究院举办,同时已经申请到2019 CVPR Workshop,其目的是希望通过挑战赛的形式,邀请顶级团队一同分享算法,运用更大规模的数据来突破目前的算法瓶颈,改善现有目标检测数据集的类别覆盖不全、标注精度不高、密集场景缺少等问题,一起使人工智能行业更有价值。
旷视DIW 2019挑战赛分为三个赛道,分别是Objects365赛道、Objects365小赛道和CrowdHuman赛道。其中,为探索目标检测系统的瓶颈,参加Objects365赛道的选手将利用公开的365种类别,60万张图片超过1000万个框的完整训练集对检测模型进行训练;在3万张图片构成的验证集上调试算法,并在10万张图片构成的测试集上进行最终的挑战。
为了降低参赛门槛,加快算法迭代速度,研究长尾类别检测问题,Objects365小赛道将从Objects365数据集中挑选出65个类别,选手可以用1万张图片进行模型的训练。
CrowdHuman赛道则是为了解决现实生活中的在密集、遮挡条件下的人群检测问题问题,其算法的提升将会推动人体检测算法落地。届时,选手将基于专门为了密集场景人体检测设计的CrowdHuman数据集进行训练,数据集包含有丰富标注信息和多种场景。
主办方为每个赛道的冠军队伍准备了10000美元的奖励。同时,挑战赛赛程共分为四个阶段:即日起进入第一阶段,开放注册并同步发布训练集和验证集;第二阶段(5月初)发布测试集数据;第三阶段(6月初)终止提交结果;最后阶段将于CVPR 2019 Workshop期间公布比赛结果,并邀请优胜队在研讨会中介绍比赛经验,共同探讨检测问题的瓶颈及优化方向。
挑战赛启用旷视Objects365数据集,旷视持续推动行业协同创新发展
值得一提的是,挑战赛中采用的数据集是旷视最新发布的最大通用物体检测数据集旷视Objects365以及之前发布的大规模拥挤场景数据集CrowdHuman。
其中,旷视Objects365数据集是目前全球最大的物体检测数据集,也是新一代通用物体检测数据集,具有规模大、质量高、泛化能力强的特点。在规模方面,旷视Objects365数据集定义了生活中常见的365个类别,第一批开放63万张图像,1000万的标注框。开放图片数是微软COCO的5倍,标注框超过微软COCO的11倍。
在孙剑看来,当前我国人工智能虽然发展迅猛,但目前仍有大量的高校、研究院所、创新创业人员和行业客户,苦于没有数据,算力或算法等资源,无法参与到人工智能的创新工作中。因此,旷视Objects365 数据集的发布将缓解这一痛点,让研究社区得以开展更多实验,这势必会推动通用物体检测技术发展新一波浪潮的到来。
事实上,除了举办DIW 2019挑战赛并提供数据支持之外,旷视还通过赞助业内比赛等方式持续推动行业创新发展。如在2018年11月,旷视就决定在未来 5 年将继续成为 CCPC 竞赛的总赞助,让组委会能在无后顾之忧的情况下继续扩大赛事影响力,为参赛选手们提供成长的平台和发挥才能的空间,发掘更多具有潜力的人工智能人才。
随着人工智能的不断发展,在最前沿的高新技术研究上,仅凭一家之力显然无法更加高效地取得研究成果,顶尖团队的共同努力,才能更快突破行业研究瓶颈。如今,旷视举办的DIW 2019挑战赛将行业顶尖团队的最新研发成果汇聚一堂,集中头部力量共同解决人工智能行业难题,为推动人工智能产业落地,持续创造更大价值提供重要动力。