韓國人工智慧(AI)新創公司 Upstage 日前宣布,將擴展其主力 AI 模型 Solar Open 的規模與能力。目前已通過一項AI模型評估第一階段的 Solar Open 100B 模型,計畫將參數規模逐步提升至 200B 乃至 300B,同時擴增語言支援,從現有的韓語、英語、日語進一步支援東南亞國協(ASEAN)語言。
Solar Open 100B 模型在訓練上展現卓越效率,學習了多達 20 兆個多語種及專業數據。儘管其模型體積僅為全球通用模型 DeepSeek-R1 的 15%,但在韓語和英語的表現上卻分別達到 110% 和 103% 的優異成績。Upstage 強調,這得益於其自主開發的「深度擴展縮放」(DUS)技術與「自強化學習框架」(SnapPO),這些技術能在提升 AI 思考能力的同時,縮短學習時間並降低成本。相關研究論文也已獲國際自然語言處理學術會議北美計算語言學協會分會(NAACL)採納,獲得國際認可。
Solar Open 100B 模型採用了 MOE(Mixture of Experts,專家混合模型)架構,這是一種讓 AI 在不同任務上調用不同「專家」子網路的設計,能有效提升效率與性能。未來,Upstage 計畫將其高效的 MOE 架構擴展至大型模型,並整合自主研發的文件處理 AI 技術,讓模型進化為 VLM(Visual Language Model,視覺語言模型),使其能理解及處理文件中的複雜表格、圖表和數學公式等多元資訊。
此外,Upstage 的商用模型 Solar Pro Series 已廣泛應用於 Law & Company、Mathpresso, Inc.、Shinhan Investment & Securities Co., Ltd.、ConnectWave、英特爾(Intel)、Hancom、韓國食品醫藥品安全處等國內外重要企業及公共機構,並持續擴大其影響力。Upstage 相關人士表示:「Solar 證明了新創公司對抗大型資本的高效率技術實力。未來將透過 VLM 擴展與產業專用 AI 普及,在全球舞台上證明新創的價值。」