首页  >  资讯  >  正文

小米汽车发布一体化世界模型框架

时间: 2026-05-26 阅读: 102
欧易交易所
欧易交易所

全球三大交易所之一,注册领50 USDT数币盲盒!

自动驾驶技术正在进入新的演进阶段,而支撑这一轮升级的核心能力已经不再局限于感知算法或单点算力,而是开始向更复杂的“世界理解能力”延伸。近日,小米汽车正式发布重建生成一体化世界模型框架,并首次在内部实现三维重建与视频生成模块的深度结合。这项技术被用于自动驾驶仿真、数据生成和用户交互等多个场景,也意味着行业在构建虚拟驾驶世界方面迈出了新的步骤。对于自动驾驶产业来说,这不仅是一项单独的技术突破,更反映出智能汽车研发逻辑正从“识别现实”走向“构建现实”。

此次公布的技术框架中,有几个细节值得重点关注。首先,传统自动驾驶仿真技术长期存在一个问题,即场景重建与内容生成往往分属不同流程。简单来说,一部分系统负责恢复真实世界的三维结构,另一部分系统负责生成视觉画面,两者通常是独立运行。这种方式虽然能够完成基本任务,但容易产生场景真实性不足、动态预测不稳定等问题。小米提出的jointwm架构则试图解决这一割裂问题,通过将三维几何结构作为整个场景的物理基础,再利用生成模块补足视觉细节,甚至对摄像头无法观察到的区域进行预测。

第二个值得注意的地方在于生成效率。根据公开信息,该架构在H20 GPU平台上,单视角生成速度达到0.19秒,三视角达到0.46秒,并支持最长一分钟的视频内容生成。这意味着系统不仅能够构建静态场景,还能够连续模拟复杂动态环境。对于自动驾驶训练而言,时间连续性非常重要,因为车辆在真实道路上的判断往往依赖于连续行为,而不是单帧图像。

第三个细节则是实际落地能力。技术突破最终需要转化成实际应用价值,而小米已经在三个方向展开部署。一方面,系统已经生成超过十万段高质量合成数据,用于感知模型训练;另一方面,它能够构建高逼真的闭环仿真环境,用来复现极端驾驶情况和长尾场景;此外,该技术还被应用于辅助驾驶教学,通过生成式视频帮助用户理解功能使用方式。

值得注意的是,长尾问题一直被视为自动驾驶产业的重要难点。所谓长尾场景,通常指极少发生但可能影响安全的特殊情况,例如突然冲出的行人、异常天气环境、复杂道路施工或特殊交通行为。真实世界收集这类数据不仅成本极高,而且很多情况难以重复出现。过去行业普遍依赖人工采集和标注,但随着自动驾驶能力提高,这种方式开始暴露效率瓶颈。

这也是世界模型受到关注的重要原因之一。原因分析来看,自动驾驶发展已经进入数据驱动阶段,而数据质量和覆盖范围决定了模型能力上限。相比传统方法,世界模型最大的优势在于,它不仅可以“记录”现实,更能够“创造”现实。系统可以在虚拟环境中主动生成大量不同场景,甚至模拟未来可能发生但现实尚未大量出现的驾驶情况。

一个明显变化是,汽车行业对人工智能的应用正从感知识别逐渐向认知推理延伸。过去AI更多承担识别车辆、行人、车道线等任务,现在则开始承担预测行为、构建环境乃至推演未来状态的职责。未来自动驾驶系统需要的不仅是一双“眼睛”,更像是一套具备想象和推演能力的大脑。

如果放到行业背景下观察,小米并不是唯一布局世界模型技术的企业。近年来,包括特斯拉、Waymo以及多家国内智能驾驶企业,都在强化仿真训练体系建设。尤其在大模型技术快速发展之后,行业开始尝试将生成式AI与自动驾驶结合,希望通过更接近真实世界的模拟训练提升模型泛化能力。

此前,许多自动驾驶训练系统依赖真实道路采集数据,但这种模式面临规模和成本限制。一辆测试车即使每天运行数百公里,获取的数据量也存在上限。而生成式技术可以在较短时间内创造大量训练样本,并且能够灵活调整天气、光线、交通密度等变量,大幅提升训练效率。

与此同时,仿真系统的重要性也在提升。传统车辆测试需要大量实车验证,而仿真环境能够提前发现潜在问题,减少道路测试风险。行业机构曾估算,一部分自动驾驶场景在虚拟环境中的测试效率可达到现实道路数百倍以上。因此,世界模型未来很可能成为智能汽车基础设施的重要组成部分。

小米此次发布重建生成一体化世界模型框架,其意义不仅在于刷新多个基准测试成绩,更在于提供了一种新的自动驾驶研发思路。技术重心正在从单纯优化感知能力,转向构建更完整的数字世界表达体系。未来竞争的关键,可能不再是谁拥有更多真实数据,而是谁拥有更强的世界模拟能力。

随着生成式人工智能和自动驾驶进一步融合,智能汽车研发流程有可能发生深层变化。未来几年,虚拟世界训练占比预计将持续提升,而世界模型技术也可能从自动驾驶领域逐步扩展到机器人、智能制造甚至数字城市等更多应用场景。对于整个行业来说,这场变化或许才刚刚开始。

上一篇:英矽智能拓展合作布局AI抗衰老药物研发 下一篇:稳定币规模突破3220亿美元 全球支付格局出现新变化
币安
币安

币安,全球顶级数字货币交易平台,手机即可买卖BTC等!