人工智慧公司 Cohere AI 今日宣布推出其最新的自動語音辨識(ASR)模型「Cohere Transcribe」,旨在將非結構化語音轉換為具洞察力的文字,進而推動企業語音智慧的發展。該模型一經發布,便以平均 5.42% 的詞錯誤率(WER)榮登 Hugging Face 開放 ASR 排行榜榜首,展現出領先業界的精準度。
MarkTechPost 指出,Cohere Transcribe 在多項基準測試中表現優異,例如在 AMI 測試中獲得 8.13 分,在 LibriSpeech clean 數據集上僅錄得 1.25% 的錯誤率。這項成績超越了包括 Whisper Large v3(平均 WER 7.44%)、ElevenLabs Scribe v2(5.83%)及 Qwen3-ASR-1.7B(5.76%)等多個市場主要競爭者。在人為偏好測試中,Transcribe 更在與 IBM Granite 4.0 及 NVIDIA Canary Qwen 2.5B 的比較中,分別獲得 78% 與 67% 的青睞度。