导航菜单

旷视启动DIW 2019挑战赛 探讨行业检测瓶颈及优化方向

4月16日,领先的人工智能企业师旷与北京致远人工智能研究所在北京联合举办了“致远学者项目启动暨联合实验室会议”。北京市科委副主任张广联、海淀区委员会常委、副区长黎俊杰等致远研究所相关资助单位的领导和代表出席了会议。

在新闻发布会上,师旷正式启动了2019年野外探测(DIW 2019)挑战赛。作为竞争专家委员会的成员,师旷首席科学家兼研究所所长孙健详细介绍了与竞争有关的问题。

照片:师旷首席科学家兼研究所所长孙健介绍了DIW 2019挑战赛

师旷举办了DIW 2019挑战赛,讨论检测问题的瓶颈和优化方向

据孙健介绍,DIW 2019挑战赛由师旷研究所联合北京致远人工智能研究所举办,已经申请到2019年CVPR研讨会。目的是邀请顶级团队以挑战的形式分享算法,利用更大规模的数据突破当前算法的瓶颈,改善现有目标检测数据集类别覆盖不全、标注准确率低、场景缺乏密集等问题,共同让人工智能产业更有价值。

开放视野DIW 2019挑战赛分为三个轨道,即对象335、对象335和人群。其中,为了探索目标检测系统的瓶颈,参加目标365轨道的运动员将训练一套完整的365类、60万张图片、1000多万帧的检测模型。该算法在30,000张图片的验证集上调试,最后的挑战在100,000张图片的测试集上执行。

为了降低进入阈值,加快算法迭代,研究长尾类别检测问题,对象365小轨迹将从对象365数据集中选择65个类别,玩家可以使用10,000张图片来训练模型。

CrowdHuman滚道是为了解决现实生活中密集遮挡条件下的人群检测问题。其算法的改进将把人体检测算法推向地面。届时,参赛者将根据专为密集场景中的人类探测而设计的人类数据集(CrowdHuman data set)进行训练。数据集包含丰富的注释信息和各种场景。

组织者为每支田径冠军队准备了1万美元的奖励。同时,竞赛日程分为四个阶段:从现在开始,进入第一阶段,开放注册,同时发布训练集和验证集;第二阶段(5月初)发布测试集数据;第三阶段(6月初)终止提交结果;在最后阶段,比赛结果将在CVPR 2019研讨会上公布,并将邀请获胜团队在研讨会上介绍比赛经验,共同讨论检测问题的瓶颈和优化方向。

挑战使用开放视觉对象365数据集,该数据集继续促进行业内的协作创新和发展。

值得一提的是,《挑战赛》中使用的数据集是最新发布的最大通用对象检测数据集开放视觉对象365(Open Vision Objects)和之前发布的大规模拥挤场景数据集克劳迪休曼(CrowdHuman)。

其中,开放视图对象365数据集是目前世界上最大的对象检测数据集,也是新一代通用对象检测数据集,具有规模大、质量高、泛化能力强的特点。就规模而言,开放对象365数据集定义了生活中常见的365个类别,第一批开放了630,000幅图像和1,000万个标签盒。打开的图片数量是微软COCO的5倍,标签盒是微软COCO的11倍。

在孙健看来,虽然人工智能目前在我国发展迅速,但仍有大量的大学、研究所、创新企业家和行业客户,他们遭受着数据、计算能力或算法等资源的匮乏,无法参与人工智能的创新。因此,对象335数据集的发布将减轻这一痛苦点,并允许研究团体进行更多的实验

随着人工智能的不断发展,在高科技研究的前沿,很明显仅靠一个人无法更有效地获得研究成果。只有通过顶尖团队的共同努力,才能更快地突破行业研究的瓶颈。如今,师旷的DIW 2019挑战赛汇集了业界顶尖团队的最新研发成果,专注于解决人工智能行业的难题,为推动人工智能行业登陆并不断创造更大价值提供了重要动力。