亞馬遜網路服務(AWS)近日推出 Strands Evals SDK,這套軟體開發工具包旨在自動化人工智慧(AI)代理的故障偵測與根本原因分析。此工具可望將開發者診斷問題的時間從數小時大幅縮短至數分鐘,對於需要快速迭代與維護複雜 AI 系統的台灣 AI 開發者與 IT 管理者而言,提供了一項效率利器。
傳統上,當 AI 代理發生故障時,開發者必須手動審查執行軌跡,才能理解問題癥結。例如,一個代理的目標達成率從 85% 下降到 70% 時,要找出具體行為、區分根本原因與表面症狀、判斷修復位置(如系統提示或工具定義),並依影響程度排序,往往需要資深工程師耗費大量時間進行人工檢視。