DeepSeek的負擔能力是一個神話:革命性的AI實際上花費了16億美元
DeepSeek的新聊天機器人擁有令人印象深刻的介紹:“嗨,我被創建了,您可以問任何東西,並得到一個甚至可能讓您感到驚訝的答案。”這種AI是中國初創公司DeepSeek的產物,已迅速成為主要參與者,甚至導致Nvidia的股價大幅下降。

DeepSeek的競爭優勢在於其創新的建築和培訓方法。關鍵技術包括:
- 多語預測(MTP): MTP不是單獨預測單詞,而是同時預測多個單詞,從而提高準確性和效率。
- 專家的混合物(MOE):該體系結構使用多個神經網絡(在DeepSeek V3中為256,每個令牌激活了8個),加速培訓和增強性能。
- 多頭潛在註意力(MLA): MLA反复專注於關鍵句子部分,從而最大程度地減少了忽視關鍵信息的風險。

DeepSeek最初僅使用2048 GPU的DeepSeek V3的培訓成本僅為600萬美元,這受到了挑戰。半分析顯示,基礎設施更為廣泛,包括大約50,000個NVIDIA HOPPER GPU(包括10,000 H800,10,000 H100和其他H20),分佈在多個數據中心。這意味著服務器投資約為16億美元,運營費用估計為9.44億美元。

DeepSeek是中國對沖基金High-Flyer的子公司,擁有其數據中心,促進了控制和創新。它的自資助性質允許快速決策。此外,該公司吸引了頂尖人才,一些研究人員每年收入超過130萬美元,主要來自中國大學。
儘管DeepSeek的600萬美元培訓成本索賠誤導了(僅反映了培訓前的GPU使用情況,不包括研究,改進,數據處理和基礎設施),但該公司已在AI開發方面投資了超過5億美元。它的精益結構有助於有效的創新。

DeepSeek的成功表明了一家資金充足,獨立的AI公司與行業巨頭競爭的潛力。但是,它的成就是建立在實質性投資,技術進步和強大團隊基礎上的,這使“革命性預算”的敘述變得過於簡化。即便如此,DeepSeek的成本仍大大低於競爭對手。例如,DeepSeek的R1型號的培訓成本為500萬美元,而Chatgpt4的1億美元。
- 1 “在刺客信條陰影 - 劇透指南中發現所有聖殿騎士地點” Apr 04,2025
- 2 流亡之路2:塞克馬斯試煉指南 Feb 12,2025
- 3 Polity 是一款新的 MMORPG,可讓您在共享服務器中與在線好友互動,現已推出 Feb 10,2025
- 4 天界守護者雷金萊夫加入 放置七騎士 Jan 16,2025
- 5 Roblox:1 月 25 日最新的子彈地下城代碼 Feb 12,2025
- 6 頂級 Android 遊戲機:綜合指南 Jan 16,2025
- 7 籃球零:官方Trello和Discord Link揭示了 Mar 26,2025
- 8 刺客的信條陰影:最大級別和排名帽揭示了 Mar 27,2025
-
手機上癮的街機遊戲
總共 10
-
熱門街機經典和新熱門
總共 10
-
史詩般的冒險遊戲:探索未知的世界
總共 10