這起事件凸顯了美中兩國在 AI 領域的地緣政治角力。白宮先前已誓言打擊「有計畫地從美國 AI 模型中竊取技術,利用美國專業知識和創新」的行為。上個月初,第一次川普內閣的美國商務部長霍華德·盧特尼克曾發布命令,要求將 Anthropic 的 Fable 模型對所有「外國人士」下線,理由是國家安全風險,顯然劍指中國。
Anthropic 多次指控中國的 AI 實驗室,包括 DeepSeek、月之暗面(Moonshot)、MiniMax,以及近期新增的阿里巴巴,涉嫌非法利用 Claude 系列模型進行蒸餾。儘管蒸餾在業界是常見且無害的做法,但它已成為美中 AI 軍備競賽中的敏感議題。亞馬遜曾研究指出 Fable 模型的安全防護可能被「越獄」(jailbreak,指透過創意指令繞過安全限制),也成為盧特尼克命令的部分動機。然而,Anthropic 駁斥這些指控毫無根據,聲稱亞馬遜報告中的「越獄」大多只是網路安全漏洞,其他模型如 OpenAI 的 GPT-5.5 和月之暗面的 Kimi-K2.7 也能偵測到類似狀況。Anthropic 認為,美國聯邦政府針對其頂尖模型的禁令,反而間接助長了積極發展開源模型(open source models)的中國 AI 產業。
為應對此情況,Anthropic 近期發表聲明,語氣趨於和解,宣布將與多家頂尖科技公司和 Project Glasswing 合作夥伴組織共同制定一套評估 AI 越獄嚴重性及開發商應對方法的「共識框架」。該公司也表示將與聯邦政府合作,朝向建立「共享的、自願性的尖端模型安全與評估標準」邁進。雖然 Anthropic 長期將自身定位為 AI 產業的「良心」,力圖平衡市場力量對風險的忽視,但其策略仍不時呼應第一次川普內閣及主要競爭對手 OpenAI 的論調,認為美國有道義責任引領全球 AI 發展,以防中國崛起。