然而,GLM-5.2 的評測結果顯示其網路安全能力與 Mythos 5 相去不遠。在 Semgrep, Inc. 執行的「不安全直接物件引用(IDOR)偵測」測試中,GLM-5.2 的 F1 分數達 39%,優於 Claude Code 模型(介於 28% 至 37%)。F1 分數是用於評估分類模型精確率和召回率表現的指標。此外,在 Graphistry, Inc. 的 Botsbench 評估中,GLM-5.2 的解決率達到 28/59,與專有模型並駕齊驅,使其成為該基準測試中表現最佳的開源權重模型。Graphistry, Inc. 指出,這是他們首次願意推薦一款開源權重模型用於前沿網路安全任務。
這一發展凸顯美國出口管制條例(Export Administration Regulations)在 AI 領域的局限性。這些條例最初是為晶片、武器零件等有序列號的實體貨物設計,但在面對 GLM-5.2 這類可在 Hugging Face 等平台自由下載的開源權重模型時,卻難以有效執行。一旦 AI 模型權重(指訓練後的參數)被發布並廣泛散布,任何出口禁令都無法阻止全球各地的使用者下載和在本機端運行。例如,GLM-5.2 在 MIT 授權下發布,任何人都可以下載、自行託管、進行微調並用於商業用途,無需獲得北京智譜華章科技有限公司或任何政府的同意。
網路安全業者 GuidePoint Security, LLC 的管理安全顧問 Jason Baker 向《Axios》表示,GLM-5.2 發布數日內,俄語論壇上已出現討論如何將其用於駭客攻擊的內容。Armadin, Inc. 的技術長 Travis Lanham 則指出,GLM-5.2 可讓攻擊者進行客製化攻擊並找出新的繞過手法,且不像閉源模型可透過可疑活動偵測並禁用帳戶,本機運行 GLM-5.2 的攻擊行為完全不會產生任何可追蹤的供應商可見訊號。
值得注意的是,北京智譜華章科技有限公司(其國際品牌為智譜 Z.ai)作為中國企業,須遵守中國的《國家情報法》(2017)第七條,要求所有中國組織和公民在國家情報工作需要時提供支援和協助。這項法律框架引發了美國國土安全部(US Department of Homeland Security)的警告,認為其可能迫使中國公司應政府要求提供美國個人或企業的數據。然而,自行託管的開源權重模型並無此義務。一旦權重在 MIT 授權下被下載,中國政府、美國聯邦政府或北京智譜華章科技有限公司本身,都無法從法律或技術上存取其推理環境。
針對此一情況,美國商務部 部長霍華德·盧特尼克(Howard Lutnick)已於 6 月 26 日致函 Anthropic 首席運算長 Tom Brown,部分解除 Mythos 5 的限制。根據修訂後的條款,Mythos 5 現在可無需出口許可證,部署至約 100 家經審核的美國關鍵基礎設施組織及其外籍員工。但向全球消費者和開發者開放的 Claude Fable 5 仍處於全球暫停狀態,並未宣布恢復時程。霍華德·盧特尼克稱此次事件為美國聯邦政府「新監管體系的開端」,旨在控制前沿 AI 的發布。然而,GLM-5.2 的基準測試結果明確指出,當存在功能相似的開源替代方案時,僅透過 API 層級的出口管制難以達到預期效果。Anthropic 曾主張,相同的功能也可從 OpenAI 的 GPT-5.5 等公開模型中獲得,且這些模型並未受到同等限制,而 Semgrep, Inc. 和 Graphistry, Inc. 的報告則證實了這一論點。
AI 出口管制政策與技術現實之間出現的這種脫節,對全球各國,包括台灣在內,在規劃 AI 發展及安全策略時,提供了重要啟示。各國政府與產業必須重新思考如何在鼓勵創新與維護國家安全之間取得平衡,特別是面對開源權重模型的廣泛應用,傳統的管制模式已無法全面有效應對其所帶來的潛在風險。