DeepSeek V4-Pro 在 SWE-Verified 測試中獲得80.6%的成績,表現與 Anthropic 的 Claude Opus 4.6(80.8%)具高度競爭力。DeepSeek V4-Pro 的鍵值快取(KV cache)大小僅為其前身模型的10%,單一 token 推論的運算成本也僅為原來的27%。這使得該模型比 GPT-5.5 Pro 便宜98%。
今年第二季,中美兩國尖端AI模型之間的成本差距已擴大至15到30倍,且這尚未計入快取折扣。5月初,中國市場在短短12天內推出了四款尖端模型,其每 token 成本均低於 Claude Opus 4.7 的三分之一。例如,月之暗面(Moonshot AI)的 Kimi K2.5 模型在 SWE-bench Verified 上達到76.8%的成績,輸入和輸出成本分別為0.60美元和2.50美元。MiniMax M2.7 的輸出成本甚至僅為 Opus 4.7 的5%。