国内计算机视觉与人工智能创业企业图森互联宣布,图森互联研发的计算机视觉与深度学习算法在KITTI和Cityscapes评测数据集上获得多项世界第一。其中,KITTI数据集中,目标检测三个单项、目标追踪两个单项、道路分割四个单项,共计九个单项全部排名第一。
据了解,KITTI由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创办,是目前国际上最大的自动驾驶场景下的计算机视觉算法评测数据集。用于评测目标(机动车、非机动车、行人等)检测、目标跟踪、路面分割等计算机视觉技术在车载环境下的性能。KITTI包含市区、乡村和高速公路等场景采集的真实图像数据,每张图像中多达15辆车和30个行人,还有各种程度的遮挡。
KITTI数据集中,目标检测包括了车辆检测、行人检测、自行车等三个单项,目标追踪包括车辆追踪、行人追踪等两个单项,道路分割包括urban unmarked、urban marked、urban multiple marked三个场景及前三个场景的平均值urban road等四个单项。图森互联在KITTI排行榜的这九个单项中全部位列第一。
Cityscapes数据集则是由奔驰主推,提供无人驾驶环境下的图像分割数据集。用于评估视觉算法在城区场景语义理解方面的性能。Cityscapes包含50个城市不同场景、不同背景、不同季节的街景,提供5000张精细标注的图像、20000张粗略标注的图像、30类标注物体。用PASCAL VOC标准的intersection-over-union (IoU)得分来对算法性能进行评价。
除自动驾驶评测数据集KITTI和Cityscapes外,图森互联在人脸关键点定位的两个评测数据集300W和AFLW上也排名第一。该技术主要用于驾驶员监控系统中,用于定位驾驶员面部关键点,以及时发现疲劳驾驶或违规驾驶。
据悉,北京图森互联科技有限责任公司是一家计算机视觉与人工智能算法技术提供商,主要帮助国内企业定制图像识别、自动驾驶、高级辅助驾驶、驾驶员监控系统等所需要的计算机视觉和深度学习算法。图森互联CTO侯晓迪是加州理工学院计算与神经系统博士,创立了基于频域的视觉注意机制理论;首席科学家王乃岩则是香港科技大学博士、2014 Google PhD Fellow计划入选者。两人分别在圣地亚哥和北京各带了一支算法团队。
据介绍,图森互联此项技术已应用到公司产品和demo中,目前已有自动驾驶试验车可用于上路演示demo,该自动驾驶试验车同时用于北京城区及城际高速的道路数据采集。
在自动驾驶领域,图森互联主要与运营车辆企业合作,为其定制摄像头配合毫米波雷达的低成本自动驾驶算法和解决方案。图森互联的模式与国外自动驾驶卡车公司Otto相似,后者为高速公路、矿区卡车提供自动驾驶系统。