上海汽车报电子报

2025年1月5星期日
国内统一刊号:CN31-0035

上海汽车报政策与技术 小米汽车接入VLM视觉语言大模型 新势力车企快速采用CTP/CTB

按日期检索

12 2017
3
4

上海汽车报

电子报刊阅读器
放大 缩小 默认

小米汽车接入VLM视觉语言大模型

2024年12月23日,小米汽车官方发布,小米SU7 1.4.5 OTA已开始推送,共有13项新增功能、26项体验优化。此次更新,小米SU7正式接入VLM视觉语言大模型,系统可识别复杂道路环境和特殊交通规则区域,并通过文字和语音提示。

具体来看,接入VLM视觉语言大模型,对于复杂道路环境中应对能力有所提升。据小米汽车介绍,系统能识别施工区域、昏暗小路、大面积的积水路段等复杂道路环境和公交车道等特殊交通规则区域,并通过文字和语音提示。

为进一步提升端到端系统决策的准确性和灵活性,目前,行业内流行的做法是“端到端+VLM架构”。

因为驾驶时需要多模态的感知交互系统,用户的视觉、听觉,以及周围环境的变化,甚至个人情感的波动都与驾驶行为密切相关,所以在“端到端+VLM”的技术架构中,端到端系统负责处理感知、决策和执行的全过程,VLM则作为辅助系统,提供对复杂交通场景的理解和语义解析。

在这种架构中,两个模型相对独立工作,VLM主要在特定情况,为端到端系统提供建议或补充信息。

此外,此次小米SU7的OTA在城市领航辅助方面,对车辆、行人速度与轨迹检测,改善纵向加减速体验并提升整体安全性,以及对红绿灯检测稳定性、路口车道选择逻辑、正逆车道判别、临停车与排队车判别逻辑等方面做了进一步的优化。小米SU7还新增了转向灯自动关闭功能,帮助驾驶员在车辆完成变道动作后,自动关闭转向灯。

在小米澎湃智能座舱方面,其中的亮点是小米SU7充电地图焕新升级。小米汽车与蔚来、小鹏、理想达成充电补能网络合作,搜索充电时可展示合作场站动态数据。(李莉)

放大 缩小 默认
关于我们 | 企业公示 | 手机版
主办单位:上海汽车报社有限公司 备案号:沪ICP备16052313号-2