亚马逊首席执行官安迪·贾西向美国官员报告了人类人工智能漏洞

Gwenda

关闭 Anthropic 的两个最先进的人工智能模型,一系列事件见证了该公司最大的投资者在背后将终止开关交给了华盛顿。

据报道,贾西本周直接向财政部长斯科特·贝森特和特朗普政府其他高级官员提出了担忧。亚马逊自己的研究人员找到了一种使用“一系列提示”来越狱 Anthropic 的 Claude Fable 5 的方法,提取有助于网络攻击的信息。动态导出控制中的对话迫使 Anthropic 对全球所有用户禁用《神鬼寓言 5》和《神话 5》。

商务部长霍华德·卢特尼克 (Howard Lutnick) 于 6 月 12 日下午 5:21 向 Anthropic 首席执行官达里奥·阿莫迪 (Dario Amodei) 发送了该指令。东。该命令要求阻止所有外国人访问这些模型,包括 Anthropic 自己的非美国员工。

由于无法实时按公民身份进行过滤,Anthropic 为所有人关闭了这两种模型。从发射到死亡:72小时。 Anthropic 于 6 月 9 日发行了《神鬼寓言 5》和《神话 5》。

背叛的角度让这一切变得非凡。亚马逊已向 Anthropic 投资了数十亿美元,计划投资总额超过 250 亿美元。 AWS 是 Anthropic 的主要云提供商。 Claude 在 Amazon Bedrock 上运行。亚马逊拥有董事会席位。贾西仍然去了华盛顿,并有效地称他自己的投资组合公司的产品太危险而无法存在。

特朗普的前人工智能沙皇、现任总统科学技术顾问委员会联合主席戴维·萨克斯 (David Sacks) 提出了自己的说法。萨克斯声称“Anthropic 和 USG 的一个高度可信、值得信赖的合作伙伴提供了有关越狱的[信息]。”他补充道:“管理员要求 [Anthropic 首席执行官 Dario Amodei] 修复越狱问题或取消部署模型。Dario 拒绝了。”

Anthropic 的官方回应淡化了这一发现。该公司表示,亚马逊发现的漏洞“以前已知”且“较小”,并指出其他公开可用的模型“也可以发现它们,而无需绕过”。该公司声称,经过 1,000 多个小时的发布前红队测试,发现“没有通用越狱”,并通过名为 Project Glasswing 的计划将 Mythos 5 限制为经过审查的合作伙伴。

一切都不重要。亚马逊发言人告诉《华尔街日报》,虽然“政府就潜在安全风险寻求我们的建议并不罕见”,但该公司并未“分享这些讨论的细节”。亚马逊与人类关系的影响是立竿见影的。

贾西在去找财政部长之前没有警告人类或私下提出这个问题。据报道,该公司正计划首次公开募股。在潜在的 IPO 文书工作之前一周取消两款旗舰机型是灾难性的时机。

更广泛的先例也同样明显:任何拥有华盛顿权限的主要人工智能投资者现在都可以有效地触发政府对某个模型的终止开关。 Anthropic 多年来一直将其定位为安全第一的人工智能公司,呼吁加强监管,并向公众警告人工智能风险。

事实证明,危险来自于它自己的商业伙伴。