Waymo开源用于自动驾驶的多模态传感器数据集,加速推动产业成熟_风闻
TechEdge科技边界-2019-08-23 22:46
近日,Waymo开源了其应用于自动驾驶的传感器数据集Waymo Open Dataset。
作为支持其自动驾驶核心逻辑的关键数据,Waymo已经在道路上测试了超过1000万英里,已经是目前上路测试的自动驾驶技术中历时最久,且技术积累最丰富的自动驾驶方案之一。
理论上,利用这些数据集来训练自己的自动驾驶模型,可以取得等同于1000万英里以上的路测经验积累。
这个开放数据集收集了Waymo自驾车在凤凰城、旧金山等地总和上千万英里的行驶过程传感数据,包含白天、夜晚、黄昏、黎明,以及各种天气状况下的行驶记录。每个数据样本包含了1000个驱动分段,每个分段包含了持续20秒以上的传感器数据捕获。
这些传感器的组合内容包含了5个定制的激光雷达,以及5个前置与侧置的摄像头。
而数据集内容则是包含了经过标记的激光雷达图像,以及带有车辆、行人、自行车与号志牌的各种图像,总共有超过1200万个3D标签与120万个2D批注。Waymo表示,摄像头图像已经和激光雷达的图像感知模型以特定的算法进行融合与同步,模型本身都已经经过对齐,无须再经过手动调整。
当然,Waymo肯定不是纯粹基于好心释放这些数据集。在今年年初,Waymo就传出要贩卖其定制的激光雷达产品,若Waymo要改变其商务模式,转而贩卖自动驾驶需要的感测方案,那么在路上的自动驾驶汽车当然就越多越好。而能够和Waymo数据集百分之百配合的传感器,当然就是Waymo推出的定制架构。这些数据集越被广为人用,就越能够帮助推广来自Waymo的传感器方案。
虽然Waymo开源的目的可能并不是那么纯粹,但从结果论,依然能够带给产业相当大的震撼与革新,尤其不少号称推出自有驾驶方案系统的厂商,总路测距离可能仅不到Waymo的十分之一,且测试环境的多样化也不足,若通过使用这套数据集,可以节省相当庞大的训练时间,加速推动相关自动驾驶方案的成熟。
而与Waymo合作Lyft也同样走向开源,其不仅公布了自动驾驶汽车开发源代码库,也同样对其收集的相关感测数据进行了开放。该公司的数据集提供了超过55000个经过人工标记的3D注释交通图像外,更提供了高达7个摄像头与3个激光雷达的传感数据汇流,并且提供了道路特征的高清空间图像,包含车道段、人行道、停车标志、停车区识别以及减速带特征等等。
其他类似的数据集还有来自Mapillary Vistas的街道图像数据集、KITTI移动机器人和自动驾驶研究系列,以及由Daimler,Max Planck信息学研究所和TU Darmstadt视觉推理开发和维护的Cityscapes数据集。
Waymo在半年前推出Waymo One无人驾驶出租车,总数已经达到600辆,虽然仍须配备安全驾驶员,但人类介入的机会已经极少,而该公司也表示,该出租车队已经服务超过1000名乘客,并都顺利达成任务。Waymo也透露,该公司的自动驾驶汽车不仅实际道路测试已经超过1000万英里,在虚拟环境中的模拟驾驶更是在无人干预的状况下行驶超过100亿英里。
而近来该公司也宣布要在密歇根州投入生产L4自动驾驶汽车,而公司也将在传统汽车工业成底特律落地。
不过Waymo面临的竞争并不小,包含Yandex,Tesla,Zoox,Aptiv,May Mobility,Pronto.ai,Aurora,Nuro以及GM的Cruise Automation等公司都已经在自动驾驶领域耕耘已久。 戴姆勒去年夏天获得了中国政府的许可,允许在中国的公路上测试由百度阿波罗平台驱动的自动驾驶汽车。4月初,总部位于北京的Pony.AI已经筹集了2.14亿美元的风险投资,在广州推出了无人驾驶出租车试点。本月启动的Optimus Ride更让自动驾驶飞上了天,在纽约市建立了一个全球首创的小型自主航天飞机机队。
竞争非常激烈,而市场前景看来也相当乐观。根据调研机构的数据,2025年将有多达800万辆自动驾驶汽车进入道路行驶,另外也有数据预期,光是美国,在2030年就会有约2000万辆自动驾驶汽车会进入市场。