隨著生成式 AI 熱潮席捲全球,維基百科龐大的資料庫已成為訓練先進 AI 模型不可或缺的關鍵素材。該平台擁有跨越 300 多種語言的 6,500 萬篇文章,是科技大廠開發 AI 聊天機器人和智慧助理時重要的訓練數據來源。然而,這些科技公司大量抓取免費提供的維基百科知識用於 AI 訓練,導致伺服器需求激增,進而大幅推高了營運成本。對於主要依賴公眾小額捐款維持運作的維基媒體基金會而言,這構成了財務壓力。
除了微軟、Meta 和亞馬遜之外,維基媒體基金會表示,在過去一年當中,還與炙手可熱的 AI 新創公司 Perplexity 和法國的 Mistral AI 等企業簽署合約。在這波合作浪潮之前,Alphabet 旗下的 Google 早於 2022 年就已宣布與維基百科建立類似的協議。
維基媒體企業(Wikimedia Enterprise)總裁 Lane Becker 接受《路透》採訪時強調:「維基百科是這些科技公司工作中不可或缺的關鍵組成部分,他們需要找出如何在財務上支持它。」 Lane Becker 指出,要將這些公司從免費平台轉移到商業平台,需要花費一些時間來理解並提供正確的功能組合,但令人欣慰的是,所有科技合作夥伴都深刻意識到,他們必須承諾以維持維基百科的持續運作。
微軟公司副總裁 Tim Frank 也對此表示肯定,他認為獲取高品質、值得信賴的資訊是微軟思考 AI 未來的核心;透過與維基媒體的合作,他們正在協助為 AI 互聯網建立一個可持續的內容生態系統,讓貢獻者的價值得到重視。值得注意的是,維基百科的內容目前是由全球約 25 萬名志願編輯所創建和維護,他們負責撰寫、編輯和進行事實查核。