儘管現行的多核心中央處理器(CPU)與圖形處理器(GPU)未能充分利用稀疏性,但產業內已有多家公司致力於加速稀疏機器學習的硬體開發。例如,蘋果公司(Apple)在其A14與M1晶片中,已透過支援陣列指標存取模式,加速了非連續記憶體查找。Cerebras也展示其Cerebras’s Wafer Scale Engine能在LLM上達到高達70%的稀疏性。Meta的Meta’s Training and Inference Accelerator (MTIA) v2版本,則宣稱在稀疏計算效能上較v1提升了七倍。