图表内容
MindVLA核心技术优势
V一空间智能模块
L一语言智能模块
A一动作策略模块
动作输出
强化学习模块
融合时空信息
(物体运动轨迹等)
处理流程
3D特征
整合
输出
MindGPT(LLM)
扩散解码器
驾驶轨迹
世界模型
3D环
解析语言指令
境特
信息处理
语音指令
对驾驶行为
优化灵活性
输入
优化策略
语音控制与交互
模块
噪音
奖励模型
摸型实现快思考
基于扩散模型的核
通过构建“仿真生成
简单场景快速决
从头训练大语言模
基于高斯预训练的
型,适配车端高效
3D标注,提升空间
司时具备空间&语言
心技术,用于优化
通过人类反馈优化
策略执行-反馈优化”
与慢思考(复
的处理与响应能力
车辆在复杂交通环
模型决策行为
的闭环,模型得以在动
场景推理后决策)
推理
理解能力
境中的驾驶决策
态的环境中学习更具当
话性的决策逻辑






