2月24日,全球首个基于真实场景的车路协同自动驾驶数据集DAIR-V2X正式发布,向境内用户提供下载使用。该数据集由清华大学智能产业研究院(AIR)联合北京市高级别自动驾驶示范区、北京车网科技发展有限公司、百度Apollo、北京智源人工智能研究院共同发布。此次发布的数据集,首次实现在相同时空下,车端与路端联合视角的2D、3D标注方法创新,作为业界、学界首个开源车路协同数据集,将有效服务科研、产业、政府机构,有效协同各方进行车路协同的学术研究和产业落地,促进我国车路协同发展。
(发布会现场)
此次发布的数据集来自北京市高级别自动驾驶示范区10公里真实城市道路、10公里高速公路、以及28个路口范围,包含来自车端、路端相机和车端、路端激光雷达等多类型传感器的71254帧图像数据和71254帧点云数据,涵盖晴天、雨天、雾天、白天和夜晚、城市道路与高速公路等丰富场景。与仅包含单车端或单路端的数据集相比,该数据集提供了相同时空下车端与路端联合视角的多模态数据,并提供了不同传感器联合视角下的融合标注结果,用于更好地服务车路协同算法研究和评估。此外,数据集通过半自动自学习车路协同3D融合标注方法等创新,有效地减少了数据集构建成本。
(北京经济技术开发区管委会副主任、北京市高级别自动驾驶示范区工作办公室主任孔磊)
高质量数据是车路协同自动驾驶技术的关键,能够持续优化车路协同的算法,助力自动驾驶系统迭代升级,为高级别自动驾驶的大规模推广做好安全保障。当前,北京市抢抓车路协同发展新机遇,以前瞻性战略眼光,高标准建设全球首个网联云控式高级别自动驾驶示范区和国内首个智能网联汽车政策先行区,为自动驾驶技术研发科研机构、科技企业打造试验技术沙盒,并提供政策、法规、技术规范支持。本次数据集的发布,为业界学界带来海量、多模态、多视角的真实场景数据,对数据进行标注、脱敏和安全加密等处理后发布,促进学术界和产业界共同推进数据驱动的车路协同自动驾驶。北京经济技术开发区管委会副主任、北京市高级别自动驾驶示范区工作办公室主任孔磊表示,“未来将及时利用数据转化制定一批车路协同数据标准,推动行业数据要素、接口、格式等标准统一,为示范区建设和行业发展提供参考和指导;通过数据开放,为高校和科研机构提供基础数据,为企业产品研发测试提供支持,有效加速产学研用协同,同时继续开展数据开放和共享服务模式探索,推动数字经济发展。”
(清华大学国强教授、智能产业研究院研究员 聂再清 现场讲解)
2020年2月,国家发改委联合相关部委出台《智能汽车创新发展战略》,将“推进智能化道路基础设置规划建设”作为重要的国家战略任务,明确了“单车智能+车路协同”的中国特色自动驾驶路线,车路协同成为各界研究重点。基于此,清华大学智能产业研究院(AIR)院长张亚勤给出了自己的判断,他认为建设高等级智能网联道路是智能驾驶及智能交通的一大趋势,既保证了智能车量产的可能性,又保障了高级别自动驾驶基于场景驱动落地的可行性。在智能交通领域,清华大学智能产业研究院(AIR)已与多家企业开展校企合作,包括车路协同自动驾驶、垂直行业、小车物流、Robotaxi等应用场景。面对相关数据集的缺乏,不能满足各界实现数据驱动车路协同的现实问题,清华大学智能产业研究院(AIR)发起数据集建设,并将数据集对高校、科研院所、产业用户开放,可以更好地支撑科研机构进行科学研究;同时示范区真实的数据采集、多样的场景覆盖、海量的数据样本,也可以解决企业在产品开发中的切实需求。
百度副总裁、智能交通事业部总经理尚国斌在发言中表示:“数据是自动驾驶、车路协同和智能交通等领域取得突破发展的原动力。数据的有效积累,不仅可以对同等级的算法、算力条件下的效果做质的提升,还可以自动化地识别难题、解决难题,形成人工智能‘见多识广、越用越聪明’的正向循环。”百度作为车路协同数据集建设的技术支持方,将持续致力于建设完善的车路协同生态,后续将逐步支持发布便于用户上手和基准复现的相关工具和代码,并开展数据集相关使用培训,以支持学术界开展车路协同相关研究。
此次发布的全球首个自动驾驶车路协同数据集DAIR-V2X,对于促进我国高级别自动驾驶技术的研发具有重要意义。目前,该数据集已纳入到智源平台上,后续将依托智源社区等智源学术生态网络,面向产学研用各方加快数据集的开放、推广及应用。
在新基建、交通强国战略指引下,“单车智能+车路协同”的中国特色自动驾驶路线以其领先性,逐步得到国际认可。未来,在产学研各界基于车路协同自动驾驶数据集的有效协作下,将继续推动车路协同自动驾驶的应用落地,助力我国自动驾驶和智能交通产业的快速发展。