AI新創公司Anthropic於今日(17日)正式推出其最新大型語言模型Claude Opus 4.7,該模型為Anthropic向公眾發布的最智能版本。新模型在程式編碼、推理及視覺智能等方面均有顯著提升,並在關鍵基準測試中,其效能超越了Google及OpenAI的部分頂級模型。
Anthropic指出,Claude Opus 4.7系列模型以其多步驟推理及先進編碼能力著稱。新版本除了能更有效地處理複雜且耗時的任務,同時也能精準遵循指令,甚至在回報結果前自行驗證輸出內容。此外,Opus 4.7在專業任務處理上更具品味與創意,能夠產出更高品質的介面、投影片及文件。
在視覺能力方面,Claude Opus 4.7能夠處理更高解析度的視覺內容,並執行像素級精確的任務,例如從密集截圖中提取數據,以及改進文件製作、簡報和設計輸出。Anthropic強調,開發者回報稱,他們能夠放心地將過去需要密切監督的艱鉅編碼工作交由Opus 4.7執行。
根據Anthropic發布的模型卡,Claude Opus 4.7在「人類終極考試」(Humanity's Last Exam)這項基準測試中展現出色。在未輔助工具的情況下,Opus 4.7得分為46.9%,超越了Google的Gemini 3.1 Pro(44.4%)與OpenAI的GPT-5-4 Pro(42.7%)。若允許使用工具,Opus 4.7的得分則提升至54.7%。