基于学习的机器人技术

基于学习的机器人技术是我们利用数据驱动和基于学习的方法来开发、训练和验证机器人系统的服务。除了经典的模仿学习和强化学习之外,我们还支持对基础模型(包括视觉-语言-动作 (VLA)模型和其他开源模型)进行适配和微调,以适应特定的环境和应用。

该服务以仿真优先开发为基础,涵盖了完整的学习生命周期——从数据生成和模型调整基准测试和在真实机器人上部署——并着重关注稳健性、可重复性和实际应用性。

数据生成与收集

  • 高保真数据集生成( pxRobotLearning
    支持在仿真和物理机器人上生成大规模数据集,确保合成数据和真实世界数据分布的一致性。
  • 远程操作和人机交互数据采集( pxTeleopForceXR
    通过远程操作界面、可穿戴设备和交互式控制实现数据收集,使人类能够在任务执行过程中进行指导、纠正和干预。
  • 多模态数据支持
    收集同步的视觉、点云、本体感觉、力和任务级信号,用于基于学习的机器人技术。
  • 结构化和版本化的数据集
    提供带有元数据的标准化数据集格式,从而实现可重复的训练、基准测试和长期评估。

学习与模型适应

  • 集成式IL和RL管道
    提供端到端的模仿学习和强化学习工作流程,支持演示驱动学习和交互驱动学习。
  • 基础模型的微调
    将预训练的基础模型适配到机器人特定任务、约束和传感器模式。
  • 视觉-语言-动作模型适应
    根据客户特定环境、任务语义和操作工作流程对 VLA 模型进行微调。
  • 开放式一体化
    支持在统一的训练框架内集成和扩展开源学习和感知模型。

基准测试与验证

  • 基于仿真的性能基准测试
    在受控、可重复的模拟场景下评估学习效果。
  • 仿真到实际验证和仿真到仿真验证
    评估策略在不同模拟器中以及转移到真实硬件过程中的稳健性。
  • 压力测试和极端情况评估
    验证在干扰、传感噪声、动态障碍物和罕见故障情况下的行为。
  • 定量指标和日志记录
    提供对政策稳定性、任务成功率和安全约束的系统性评估指标。

部署与推理

  • 模型导出和优化
    支持模型转换、压缩和优化,以便在边缘和嵌入式平台上部署。
  • 基于 ROS 2 的系统集成
    将训练好的模型无缝集成到 ROS 2 感知、规划和控制流程中。
  • 机器人加速推理
    能够在配备 GPU 或加速器的机器人硬件上进行实时推理,并实现确定性执行。

典型应用案例

  • 基于学习的操作和导航
    制定抓取、操作、运动和自主导航策略。
  • 人机交互与辅助
    利用人类输入、语言指令和反馈来训练交互式行为。
  • 算法基准测试与评估
    在标准化条件下对学习算法进行比较评价。
  • 研究和工业研发项目
    工业机器人应用(例如WPT 项目)的应用研究、原型开发和技术验证。