首页 > 资讯 > 正文

Fable 5安全争议升级：白宫与AI厂商的技术边界

时间： 2026-06-18 阅读： 104

欧易交易所

全球三大交易所之一，注册领50 USDT数币盲盒！

官网注册 APP下载

一条来自X平台的转述，让原本偏技术讨论的AI安全问题，突然带上了一点政策张力。

媒体WIRED发文称，有特朗普政府官员表示，如果Anthropic希望重新发布其模型 Fable 5，就必须确保安全防护“无法被绕过”。但这一要求几乎在提出的同时，就被安全研究人员直接否定——他们的判断很简单，这种绝对级别的防护并不存在。

问题不在于是否要加强安全，而在于“无法被绕过”这个前提，本身更像一种政策语言，而不是工程描述。

在AI模型的实际运行链路里，从训练到部署，再到API调用、插件接口、第三方集成，每一层都存在攻击面。哪怕模型本体再封闭，只要外围系统存在交互，就意味着存在绕过路径。这也是过去几年红队测试反复验证的现实：安全不是一个状态，而是一种持续对抗过程。

所以当安全专家直接回应“无法实现”时，其实并不是在争论态度，而是在纠正语义边界。

但事情之所以被放大，并不只是技术层面的分歧。

Fable 5本身并不是一个普通模型迭代。外界普遍将其视为Anthropic在下一代对齐模型路线上的关键节点，涉及更复杂的推理能力与工具调用机制。模型能力越强，意味着可被滥用的路径也越多，这种结构性矛盾在当前大模型行业几乎是共识。

问题是，当模型能力进入“通用智能工具”区间后，监管语言往往跟不上技术演进速度。

“无法被绕过”的表述，更像是一种政治或政策层面的理想状态，而不是工程验收标准。它试图把一个概率问题，变成一个确定性要求。

但AI安全工程恰恰是建立在概率之上的。

无论是对抗样本、提示注入，还是模型越狱，本质都是攻击者与防御者之间不断迭代的博弈。即使是目前最严格的系统，也只能做到“显著提高攻击成本”，而不是“彻底消除风险”。

这也是安全专家反应强烈的原因。

如果把“绝对安全”作为发布条件，那么几乎所有前沿模型都会被卡在门外。

从产业角度看，这种冲突并不陌生。

在过去的加密技术、云计算甚至移动操作系统发展过程中，都出现过类似的张力：监管希望明确边界，工程系统却只能提供连续风险管理。最终的结果往往是折中——允许发布，但附带责任框架与持续审计机制。

AI行业现在正走到同一个节点，只是速度更快。

Anthropic一直强调“对齐优先”的技术路线，这使得它在行业内被视为相对保守的一方。但即便如此，它也很难承诺一个绝对封闭的安全系统。模型一旦开放调用能力，就必然进入外部环境，而外部环境是不受控的。

问题也因此变得更现实：不是能不能做到，而是如果不能做到“完全不可绕过”，是否就意味着不能发布？

这个问题目前没有标准答案。

但可以确定的是，行业正在逐渐从“发布模型”转向“持续治理模型”。模型发布只是起点，后续的监控、修复、限制、再训练，构成一个长期循环。安全不再是上线前的门槛，而是运行过程中的常态。

从这个角度看，这次争议更像一次语义冲突：政策语言追求终点式安全，工程体系只能提供过程式安全。

两者之间的落差，正是当前大模型产业最难被忽略的裂缝之一。

上一篇：Satori关停：1000万美元融资也没撑过DEX寒冬下一篇：沃什首秀震动债市：市场开始重新定价加息风险

币安

币安，全球顶级数字货币交易平台，手机即可买卖BTC等！

注册链接下载链接