网络安全行业对大模型的态度,一直在“兴奋”和“克制”之间摇摆。Mythos的出现,把这种矛盾推得更直白了一些。
Anthropic专为网络安全场景训练的模型Mythos,在早期企业测试中表现得相当激进。Palo Alto Networks的测试结果显示,它在三周内从源码中识别出20多个关键漏洞,效率大约是传统安全工具的5倍。放在安全行业,这种提升几乎等同于一次代际跃迁。
但问题也随之浮出水面,而且来得很直接——成本。
同一轮测试周期内,Mythos消耗的token费用超过100万美元,另一家参与测试的企业给出的估算更夸张,两周运行就可能推高到数百万美元级别。这已经不是“昂贵”,更像是一种持续烧算力的安全扫描引擎。
成本结构并不复杂。Mythos的API单token定价约为旗舰模型Opus的6倍,这在大模型体系里属于明显的高溢价区间。原因也不神秘:它被设计为更高强度推理、更深层代码分析工具,而不是通用对话模型。
但在真实企业环境中,这种设计会迅速触发一个现实问题——安全收益是否能覆盖推理成本。
网络安全本质上是一个“边际风险递减”的行业。漏洞越往后越难找,单位收益越高,但单位成本也在指数上升。Mythos把这个曲线进一步拉高了。
更微妙的是应用场景的双重属性。一方面,它被用来做合法安全测试、代码审计、红队模拟;另一方面,企业担忧它可能被用于攻击侧的自动化漏洞挖掘。模型能力越强,这种边界越模糊。
也正因为这种不确定性,Anthropic过去对Mythos采取了较为保守的开放策略,仅限少数企业测试环境接入。控制变量、控制风险,也控制外溢。
但局势正在变化。
英国AI安全测试机构的评估显示,Mythos在特定网络安全任务上的表现已经略优于OpenAI尚未公开的竞争模型GPT-5.5-Cyber。这种“领先但未完全公开”的状态,往往会推动商业策略提前转向市场化。
于是开放API成了下一步。Anthropic计划在未来几周向更广泛客户放开接口权限,某种程度上意味着:从封闭测试进入规模化商业阶段。
只是成本问题不会因为开放而消失。
现实情况更像是另一种分层正在形成。早期测试企业已经开始通过工程方式优化调用策略,比如分阶段调用模型、缩小上下文窗口、在规则引擎与大模型之间做任务拆分。这些做法本质上是在“驯化”高成本智能体。
大模型在安全行业的角色正在变化。从工具箱里的一个插件,逐渐变成一个独立的分析层,但代价是账单结构也同步重写。
如果说传统安全软件的成本是“订阅制”,Mythos更像“算力计时器”。你每多发现一个漏洞,就多支付一轮推理费用。
这个结构在商业上并不稳定,但在能力上却异常诱人。于是行业陷入一种典型的技术早期状态:没人怀疑它的价值,但每个人都在计算它的账单。
Mythos只是一个开始。真正的问题并不是它值不值,而是整个网络安全行业是否准备好为“AI级漏洞发现能力”支付对应的算力价格。标题里的100万美元,更像是一个测试样本,而不是终点数字。