首頁 News > DeepSeek的負擔能力是一個神話:革命性的AI實際上花費了16億美元

DeepSeek的負擔能力是一個神話:革命性的AI實際上花費了16億美元

by Madison Mar 21,2025

DeepSeek的新聊天機器人擁有令人印象深刻的介紹:“嗨,我被創建了,您可以問任何東西,並得到一個甚至可能讓您感到驚訝的答案。”這種AI是中國初創公司DeepSeek的產物,已迅速成為主要參與者,甚至導致Nvidia的股價大幅下降。

DeepSeek測試

DeepSeek的競爭優勢在於其創新的建築和培訓方法。關鍵技術包括:

  • 多語預測(MTP): MTP不是單獨預測單詞,而是同時預測多個單詞,從而提高準確性和效率。
  • 專家的混合物(MOE):該體系結構使用多個神經網絡(在DeepSeek V3中為256,每個令牌激活了8個),加速培訓和增強性能。
  • 多頭潛在註意力(MLA): MLA反复專注於關鍵句子部分,從而最大程度地減少了忽視關鍵信息的風險。
DeepSeek V3

DeepSeek最初僅使用2048 GPU的DeepSeek V3的培訓成本僅為600萬美元,這受到了挑戰。半分析顯示,基礎設施更為廣泛,包括大約50,000個NVIDIA HOPPER GPU(包括10,000 H800,10,000 H100和其他H20),分佈在多個數據中心。這意味著服務器投資約為16億美元,運營費用估計為9.44億美元。

DeepSeek

DeepSeek是中國對沖基金High-Flyer的子公司,擁有其數據中心,促進了控制和創新。它的自資助性質允許快速決策。此外,該公司吸引了頂尖人才,一些研究人員每年收入超過130萬美元,主要來自中國大學。

儘管DeepSeek的600萬美元培訓成本索賠誤導了(僅反映了培訓前的GPU使用情況,不包括研究,改進,數據處理和基礎設施),但該公司已在AI開發方面投資了超過5億美元。它的精益結構有助於有效的創新。

DeepSeek

DeepSeek的成功表明了一家資金充足,獨立的AI公司與行業巨頭競爭的潛力。但是,它的成就是建立在實質性投資,技術進步和強大團隊基礎上的,這使“革命性預算”的敘述變得過於簡化。即便如此,DeepSeek的成本仍大大低於競爭對手。例如,DeepSeek的R1型號的培訓成本為500萬美元,而Chatgpt4的1億美元。