根據英國AI安全研究院(United Kingdom’s AI Security Institute, AISI)與派拓網路(Palo Alto Networks)於週三發布的獨立報告指出,Anthropic的Claude Mythos Preview和OpenAI的GPT-5.5這兩款最先進的人工智慧模型,在自主網路安全任務的表現上,已大幅超越既有評測標準,並呈現加速發展的態勢。
最新的數據顯示,Claude Mythos Preview與GPT-5.5已超越所有預期曲線。其中,Claude Mythos Preview更是首度成功完成了AISI的兩項網路攻防模擬測試。它在模擬企業網路攻擊的「The Last Ones」32步驟任務中,10次嘗試裡成功了6次;對於過去所有模型都未能破解的「Cooling Tower」任務,也成功了3次。GPT-5.5則在「The Last Ones」任務中取得了10次成功3次的表現。AISI引述指出:「前沿AI的自主網路與軟體能力正快速進步:前沿模型能自主完成的網路任務長度,是以數月而非數年為單位翻倍成長。」
派拓網路透過自身的測試也得出了類似的結論。該公司表示,自今年四月起,便作為Anthropic Project Glasswing的合作夥伴,開始測試Claude Mythos。隨後,也參與OpenAI’s Trusted Access for Cyber program,測試了Claude Opus 4.7和OpenAI’s GPT-5.5-Cyber。透過AI模型對逾130項產品進行掃描,派拓網路共識別出26個CVE(共通漏洞和暴露),涵蓋75個問題,相較於每月通常少於5個CVE的數量,顯示AI在漏洞挖掘上的驚人效率。派拓網路強調:「最新模型在尋找漏洞並將其轉化為關鍵利用路徑方面,表現出非凡的能力,幾乎能即時完成。」該公司已修補其SaaS產品中的所有重要漏洞,並為客戶營運的產品提供了修補程式。