首页  >  资讯  >  正文

Fable 5安全争议升级:白宫与AI厂商的技术边界

时间: 2026-06-18 阅读: 104
欧易交易所
欧易交易所

全球三大交易所之一,注册领50 USDT数币盲盒!

一条来自X平台的转述,让原本偏技术讨论的AI安全问题,突然带上了一点政策张力。

媒体WIRED发文称,有特朗普政府官员表示,如果Anthropic希望重新发布其模型 Fable 5,就必须确保安全防护“无法被绕过”。但这一要求几乎在提出的同时,就被安全研究人员直接否定——他们的判断很简单,这种绝对级别的防护并不存在。

问题不在于是否要加强安全,而在于“无法被绕过”这个前提,本身更像一种政策语言,而不是工程描述。

在AI模型的实际运行链路里,从训练到部署,再到API调用、插件接口、第三方集成,每一层都存在攻击面。哪怕模型本体再封闭,只要外围系统存在交互,就意味着存在绕过路径。这也是过去几年红队测试反复验证的现实:安全不是一个状态,而是一种持续对抗过程。

所以当安全专家直接回应“无法实现”时,其实并不是在争论态度,而是在纠正语义边界。

但事情之所以被放大,并不只是技术层面的分歧。

Fable 5本身并不是一个普通模型迭代。外界普遍将其视为Anthropic在下一代对齐模型路线上的关键节点,涉及更复杂的推理能力与工具调用机制。模型能力越强,意味着可被滥用的路径也越多,这种结构性矛盾在当前大模型行业几乎是共识。

问题是,当模型能力进入“通用智能工具”区间后,监管语言往往跟不上技术演进速度。

“无法被绕过”的表述,更像是一种政治或政策层面的理想状态,而不是工程验收标准。它试图把一个概率问题,变成一个确定性要求。

但AI安全工程恰恰是建立在概率之上的。

无论是对抗样本、提示注入,还是模型越狱,本质都是攻击者与防御者之间不断迭代的博弈。即使是目前最严格的系统,也只能做到“显著提高攻击成本”,而不是“彻底消除风险”。

这也是安全专家反应强烈的原因。

如果把“绝对安全”作为发布条件,那么几乎所有前沿模型都会被卡在门外。

从产业角度看,这种冲突并不陌生。

在过去的加密技术、云计算甚至移动操作系统发展过程中,都出现过类似的张力:监管希望明确边界,工程系统却只能提供连续风险管理。最终的结果往往是折中——允许发布,但附带责任框架与持续审计机制。

AI行业现在正走到同一个节点,只是速度更快。

Anthropic一直强调“对齐优先”的技术路线,这使得它在行业内被视为相对保守的一方。但即便如此,它也很难承诺一个绝对封闭的安全系统。模型一旦开放调用能力,就必然进入外部环境,而外部环境是不受控的。

问题也因此变得更现实:不是能不能做到,而是如果不能做到“完全不可绕过”,是否就意味着不能发布?

这个问题目前没有标准答案。

但可以确定的是,行业正在逐渐从“发布模型”转向“持续治理模型”。模型发布只是起点,后续的监控、修复、限制、再训练,构成一个长期循环。安全不再是上线前的门槛,而是运行过程中的常态。

从这个角度看,这次争议更像一次语义冲突:政策语言追求终点式安全,工程体系只能提供过程式安全。

两者之间的落差,正是当前大模型产业最难被忽略的裂缝之一。

上一篇:Satori关停:1000万美元融资也没撑过DEX寒冬 下一篇:沃什首秀震动债市:市场开始重新定价加息风险
币安
币安

币安,全球顶级数字货币交易平台,手机即可买卖BTC等!