AI代理的導入原被視為降低勞動成本的利器,但其「權杖(token)」消耗問題正成為企業董事會的新難題。據《Startup Fortune》報導,微軟與 Uber 的案例顯示,當員工大量使用 AI 工具時,儘管採用率提高,其成本卻難以解釋。例如,微軟已將許多開發人員從直接使用 Claude Code 轉向 GitHub Copilot CLI,而 Uber 也因工程部門的 AI 使用量超出預期,不得不重新檢討其 AI 工具預算。有專家指出,AI代理工具在執行閱讀、寫作、推論、重試、檢查文件及生成程式碼等任務時,其消耗的權杖數量難以預測,導致成本與活動量而非員工人數掛鉤。這意味著,即使單一權杖的價格下降,若每項任務消耗更多權杖,總體費用仍可能上升。另一方面,Meta Platforms 據傳正在內部測試AI版本的祖克柏,用以與員工溝通,並透過其 Model Capability Initiative 推動數位勞動力技術發展,期盼提升每位員工的營收與獲利能力。
然而,AI代理的快速發展也伴隨著顯著的風險與爭議。知名駭客 George Hotz(以破解初代蘋果手機和 PlayStation 3 聞名)便於近日發表文章,稱 AI 編碼代理的採用將是「軟體開發領域史上最昂貴的錯誤之一」。他認為,高階工程師或許能辨識出 AI 代理生成的問題,但能力較弱的工程師則不能,這將導致程式碼品質普遍下降。George Hotz 甚至質疑蘋果公司推動 AI 編碼工具在其工程團隊中的應用,會否導致 macOS 系統品質惡化。此觀點與安德烈·卡帕斯等 AI 研究者的看法形成對比,後者認為 AI代理已改變軟體開發。此外,洛伊國際政策研究所(Lowy Institute)也警告,自主型 AI 代理群體可能在網路上大規模散布假訊息並自動化網路犯罪,特別是在東南亞等語言多樣且監管分散的地區。過去 Moltbook 這個「AI代理社交網路」被駭事件,導致約 150 萬個身份驗證密鑰外洩,顯示這類風險不容小覷。在個人應用方面,專家們也對 AI 工具用於財務管理提出警示,墨爾本大學的 Antoine Didisheim 教授和雪梨大學的尤里·加爾教授皆指出,AI可能產生不準確或帶有偏見的資訊(即「幻覺」現象),並擔憂使用者隱私與個人資料安全問題。
為應對這些挑戰,相關防禦工具與評估機制正積極開發中。例如,Perplexity 公司已開源一款名為 Bumblebee 的工具,該工具能掃描開發人員電腦中的受感染軟體套件和惡意瀏覽器擴充功能,且不需執行程式碼即可辨識潛在威脅,有效規避惡意腳本的觸發。此工具的推出,是為了回應近期針對 Mistral AI、UiPath 等公司軟體供應鏈的攻擊。在 AI 模型評估方面,Google DeepMind 也正與 Kaggle 合作,透過舉辦程式設計馬拉松、考試及競技場等方式,克服 AI 快速發展導致評估基準分散、過時且不透明的問題,以期建立更可靠且可比較的 AI 模型評估標準。這些努力顯示,隨著 AI 代理在數位世界的影響力日增,確保其安全性、可靠性與負責任的應用,已成為當務之急。