
【ivendor編輯中心 / 2025年7月3日】聯發科技集團旗下前瞻技術研究單位「聯發創新基地」(MediaTek Research),宣布推出專為台灣本地語言與口音優化的AI語音辨識開源模型「MediaTek Research Breeze ASR 25」(MR Breeze ASR 25),並已在全球知名AI模型平台HuggingFace上架。此模型以OpenAI Whisper為基礎開發,針對台灣用語、口音及中英混用語境進行強化,提供更高辨識準確度。
聯發創新基地指出,隨著AI語音辨識技術持續發展,現有國際開源模型雖已能廣泛應用於各領域,但在台灣在地語言、口音辨識以及中英夾雜的日常對話上,仍時常出現誤判情況。例如,「發生什麼事」常被誤辨為「花生什麼事」,不僅影響使用者體驗,也限制AI應用於本土產業的發展。
對此,聯發創新基地負責人許大山博士表示,語音辨識是驅動AI應用落地的基礎技術。MR Breeze ASR 25特別強化對台灣常見語料及口音的識別能力,整體精準度相較於OpenAI Whisper提升近10%。在台灣常見的中英語轉換(Code-switching)情境下,辨識表現更提升達56%。這不僅有助於提升AI服務在台灣市場的可用性,也促進產業數位轉型與本土AI技術的創新應用。
MR Breeze ASR 25採用Apache 2.0開源授權條款,開放給各界開發者、產業應用、教育與學術研究自由運用。聯發創新基地強調,期望透過開源共享精神,促進台灣AI生態系多元發展,協助百工百業在各類語音互動及創意應用上發揮更多可能。
此次發表的MR Breeze ASR 25為MR Breeze系列第二代語音辨識開源模型。除可即時將語音內容轉換為文字,亦針對台灣市場需求導入本地語料與口音訓練,大幅提升辨識率。聯發創新基地自2025年起,已陸續開源多項繁體中文AI模型,包括整合視覺功能的語言模型(Visual Large Language Models, V-LLM)、針對台灣口音調整的文字轉語音模型(Text to Speech, TTS)、以及支援外部資訊調用的Function Calling模型。這一系列開源成果,持續推進繁體中文AI技術的創新發展與普及。
展望未來,聯發創新基地將持續以完整的繁體中文AI技術鏈,強化台灣本地AI應用的基礎,協助產業、開發者與學界共同拓展更多元的智慧語音應用場景。更多MR Breeze ASR 25及相關AI開源資源,歡迎至HuggingFace平台或聯發創新基地官方網站查詢。