在技术层面,2025年1月,理想汽车通过OTA 7.0推送的Mind GPT-3o采用端到端架构,实现了语音、视觉和文本的融合处理,响应速度达百毫秒级别,支持情感陪伴与用户偏好记忆,并可调用美团、日历等300余种外部工具。
该模型基于10万亿Token的预训练数据,采用TaskFormer神经网络架构,并持续通过监督微调(SFT)和人类反馈强化学习(RLHF)进行优化。此外,Mind GPT实现了跨终端部署,从车机扩展至手机App和网页版,支持多端对话同步与服务协同。
搭载Mind GPT的“理想同学”已从车载语音助手演进为一款跨终端人工智能应用。在车内场景中,其支持免唤醒交互、多种方言识别与复杂多模态指令;在移动场景下,手机端的“理想同学”提供“知识问答”和“视觉识别”功能。其Agent化能力进一步体现出系统智能的提升:能够对模糊指令进行任务规划与拆解,并通过协调车载功能与外部API完成执行。
在智能辅助驾驶方面,理想规划了基于端到端模型的双系统发展路径。在L3阶段,预计2025年,公司将通过端到端模型和视觉语言模型(VLM)实现高速场景下每500公里仅需一次接管的有监督自动驾驶。
而在L4阶段,目标2028年前后,将引入视觉-语言-行动模型(VLA),使车辆具备三维空间认知与自主决策能力,最终实现无人驾驶。据理想汽车透露,VLA司机大模型计划将在9月份大规模上车,并且在11月份迎来重磅更新。
该模型的实现得益于自研辅助驾驶芯片等自研硬件的强力支撑,该芯片于今年年初成功流片,计划于明年正式交付,目前正在实车路测阶段。
在智能制造领域,理想构建了全栈自研的工业AI体系,通过Li-MOS生产管理系统、连山质量预警平台和MESS系统等,打造出“智能制造超级大脑”,横向覆盖从研发到交付的全链路数据闭环,纵向实现多层供应链与整车制造的高效协同。
在资源投入方面,理想汽车年度研发投入已超过100亿元,其中近一半集中于人工智能相关领域。公司成立了四支AI团队,分别专注于智能驾驶、理想同学、智能商业及智能工业的研发。
