在大模型竞赛逐渐从“发布频率”转向“算力密度”的阶段,Meta内部的一次信息披露,把这条竞争曲线又往前推了一步。超级智能实验室负责人 Alexandr Wang在内部员工大会上提到,正在训练的下一代模型已经在部分基准测试中追平 OpenAI的GPT-5.5,这个结果本身并不属于正式发布,但在行业语境里已经足够引发重新定价预期。
这个代号“西瓜”(Watermelon)的模型,并不是从零开始的尝试,而是上一代 Muse Spark(内部代号“鳄梨”Avocado)的延续版本。结构上更像一次放大版迭代:训练算力直接上调一个数量级。这个变化比模型名称更关键,它意味着性能提升不再主要依赖算法微调,而是更多依赖计算资源堆叠。
在大模型发展到这一阶段,这种路线其实并不意外。参数规模增长的边际收益正在下降,真正还能拉开差距的,越来越集中在算力投入与训练数据组织方式上。换句话说,模型能力的上限开始和基础设施绑定,而不是单纯算法创新。
Alexandr Wang在社交平台X上的补充也延续了这种节奏感。他提到Muse Spark即将更新,重点方向放在编程能力与智能体能力上,同时在回应关于 Anthropic Claude Opus 的追赶问题时,只给了一个相对模糊的“很快”。这种表达方式在AI行业其实并不罕见,更像是在释放研发进度信号,而不是技术承诺。
如果把这几条信息放在一起看,会出现一个比较清晰的结构:Meta正在把模型竞争从“单点能力对比”转向“系统能力竞争”。编程能力、智能体能力,以及训练规模的提升,被放在同一个迭代周期里推进,而不是拆分成独立产品线。
一个明显变化是,模型迭代周期正在被压缩,但成本曲线却在上升。训练算力提升一个数量级,这种动作在早期大模型阶段几乎等同于重新开一轮基础设施竞赛。它不只是算法优化问题,更像是在重新分配GPU资源与数据中心能力。
从行业背景来看,这一轮竞争已经不再局限于模型本身。OpenAI、Anthropic、Meta之间的差异越来越体现在“系统栈完整度”上,包括训练架构、推理效率以及多任务能力整合。这也解释了为什么编程与智能体能力被反复提及,它们直接对应企业级应用落地路径。
过去一段时间,大模型能力提升更多体现为“回答更好”,但现在开始转向“执行能力更强”。智能体方向的强化,意味着模型正在从信息生成工具逐步向任务执行层延伸,而这部分能力对算力和训练方式的要求明显更高。
放到更长周期来看,这类内部基准追平的信号并不意味着市场格局已经变化,但它通常是技术拐点前的典型阶段。模型能力差距在缩小,但基础设施投入差距在扩大,这种结构往往会把竞争从算法层推向资本与算力层。
西瓜模型目前仍处于训练阶段,但它释放出的信息比较明确:大模型竞争已经进入“重资产阶段”。算法差异还在,但越来越多的边际优势,正在由算力规模决定。