分析進一步指出,AI 掃描工具本質上具有非確定性。對一份 5 萬行程式碼進行三次掃描,其自身發現的重複性僅約 17%。即使發現一致,其判斷的嚴重性分數也可能不同。即使使用 Claude Security(基於 Claude Opus 4.7)等模型,在相同程式碼庫上,其結果的重現性也僅有 25%。多模型分析(包含 Claude Opus 4.7、谷歌 Gemini 2.5 Flash 及 OpenAI 的 GPT-5.5)針對 523 個發現進行比對後,僅有 14.9% 為實際存在的漏洞,而約半數的其餘標記都是誤報(False Positive)。
Contrast Security 資訊長 David Lindner 批評 AI 掃描器的非確定性,指出同一份程式碼執行多次卻無法產生一致結果,導致難以建立可重複的安全計畫。他強調,需要確定性工具提供一致結果和運行時情境,才能真正信任風險評級。ULTRA RED 執行長 Eran Shtauber 也認為,AI 降低了產生資安工作的成本,但未能自動降低證明工作價值的成本。他建議,AI 最佳的投資報酬率來自於其推理能力能創造價值,而非取代既有的確定性系統。
為有效管理 AI 安全成本,專家建議將 AI 應用範圍限制在新程式碼或高風險變更上,並結合靜態應用程式安全測試(SAST)、互動式應用程式安全測試(IAST)等確定性工具,同時納入運行時可見性。此策略能將 AI 產生的假設,在成為實際營運發現前進行驗證,確保其效益與可信度。