Bednarski 指出:「雖然我們並未完全依賴大型語言模型,但它們確實顯著影響了我們的研究。」他續稱,大型語言模型會從不同論文與領域中選取統計數據,並以看似合理的方式將其拼湊組合。最終,Waterline Development 耗費了四個月時間及約二十萬美元(約新台幣六百四十萬元),才證實碳布材料無法擴展至試點規模以外的應用,而鑄造碳電極才是更優的選擇。
Waterline Development 認為,商用大型語言模型不適用於跨學科研究,因為這類研究需要整合多個領域的專業知識。該公司在一份白皮書中解釋,現有的人工智慧模型難以可靠地達成此目標,它們在多步驟的複雜推理下容易產生「幻覺」(hallucinate),並在問題跨越不同領域界限時,給出看似合理但實際上錯誤的答案,這不僅浪費時間,更可能毒害關鍵決策。
為了解決此一問題,Waterline Development 開發出 Rozum,一個多模型推理系統。Rozum 的名稱源自斯拉夫語中的「理性」,目前已成為 Bednarski 旗下的一家獨立 AI 新創公司。這個系統的運作方式是平行操作多種人工智慧模型,並透過一個驗證層來整合及驗證其答案。Rozum 綜合運用商業模型、開源模型及領域專用模型,每個模型處理查詢時,會使用可執行驗證並產生確定性結果的工具,為答案提供依據。