News > Deepseekの手頃な価格は神話です。革新的なAIは実際には16億ドルの費用がかかります。

Deepseekの手頃な価格は神話です。革新的なAIは実際には16億ドルの費用がかかります。

by Madison Mar 21,2025

Deepseekの新しいチャットボットには、印象的な紹介があります。中国のスタートアップDeepSeekの製品であるこのAIは、急速に主要なプレーヤーになり、Nvidiaの株価の大幅な低下さえも引き起こしています。

DeepSeekテスト

Deepseekの競争力は、革新的なアーキテクチャとトレーニング方法にあります。重要なテクノロジーには次のものがあります。

  • マルチトークン予測(MTP):単語を個別に予測する代わりに、MTPは複数の単語を同時に予測し、精度と効率を高めます。
  • 専門家の混合(MOE):このアーキテクチャは、複数のニューラルネットワーク(ディープシークV3で256、トークンごとに8つのアクティブ化)を使用し、トレーニングを加速し、パフォーマンスを向上させます。
  • マルチヘッドの潜在的注意(MLA): MLAは、重要な情報を見落とすリスクを最小限に抑え、キー文の部分に繰り返し焦点を当てています。
Deepseek V3

Deepseekの最初の主張は、2048 GPUのみを使用して、Deepseek V3の600万ドルのトレーニングコストが挑戦されています。セミアン癒合により、はるかに広範なインフラストラクチャが明らかになり、複数のデータセンターに広がる約50,000個のNVIDIAホッパーGPU(10,000 H800、10,000 H100、および追加のH20を含む)が含まれています。これは、サーバー投資が約16億ドルで、運用費用は9億4,400万ドルと推定されます。

deepseek

中国のヘッジファンドであるHigh-Flyerの子会社であるDeepseekは、データセンターを所有し、管理と革新を促進しています。その自己資金による性質は、迅速な意思決定を可能にします。さらに、同社はトップの才能を集めており、一部の研究者は主に中国の大学から年間130万ドル以上を稼いでいます。

DeepSeekの600万ドルのトレーニングコスト請求は誤解を招くものです(研究、改良、データ処理、インフラストラクチャを除く、トレーニング前のGPU使用のみを反映しています)、同社はAI開発に5億ドル以上を投資しています。その無駄のない構造は、効率的なイノベーションを促進します。

deepseek

Deepseekの成功は、資金提供された独立したAI企業が業界の巨人と競争する可能性を示しています。しかし、その成果は、実質的な投資、技術的進歩、強力なチームに基づいて構築されており、「革新的な予算」の物語を単純化しすぎたものにしています。それでも、Deepseekのコストは競合他社よりも大幅に低いままです。たとえば、DeepseekのR1モデルは、ChatGPT4の1億ドルと比較して、500万ドルのトレーニングにかかります。

トレンドのゲーム