尚未公开讨论其自动驾驶汽车平台架构的优步今天发表了一篇文章,解释了先进技术集团(ATG)的工程师能够在汽车上测试、验证和部署人工智能模型的技术。它对自动驾驶汽车开发的复杂性有一个大致的了解,也许更重要的是,它是优步无人驾驶努力的标尺,该努力在2018年5月亚利桑那州坦佩发生事故后遭遇挫折。
根据优步的说法,ATG工作流最重要的组成部分是VerCD,这是一套专门为自动驾驶汽车原型开发的工具和微服务。它跟踪正在开发的各种代码库、数据集和AI模型之间的依赖关系,确保工作流从数据集提取阶段开始,然后是数据验证、模型训练、模型评估和模型服务阶段。
优步写道:“VerCD……已经成为优步data自动驾驶传感器训练数据的可靠来源。”“通过将数据集构建工作流程纳入VerCD,我们将新数据集构建的频率提高了10倍以上,从而显著提高了效率。维护一个常用数据集的列表也提高了[机器学习]工程师的迭代速度,因为开发人员可以立即继续实验,而无需等待几天来构建新的数据集。此外,我们还为自动驾驶汽车旗舰目标检测和路径预测模型提供每日和每周的培训。这种频繁的训练节奏会把发现和修正一些错误的时间减少到几天。
优步说,VerCD背后的大部分工程工作都花在了增加公司特定的集成上,以使现有系统能够与ATG完整的端到端机器学习工作流进行交互。为此,VerCD最新的Orchestrator服务可以调用各种数据原语来构建自动驾驶汽车的运行时进行测试,或者与代码库进行交互,同时使用深度学习库在数据中心之间来回创建图像和复制数据集。云(模型培训应在这些地点进行)。
VerCD管理的大部分数据集来自ATG自动驾驶汽车收集的日志。日志数据——来自摄像头、激光雷达点和雷达信息的图像、车辆状态(位置、速度、加速度、航向)和地图数据(例如车辆使用的路线和车道)——分为训练数据、测试数据和验证数据,例如75%用于训练,15%用于测试,10%用于验证。一个名为GeoSplit的专有工具用于选择日志,并根据其地理位置在列车、测试和验证之间进行划分。
标签: