Casa News > L'accessibilità economica di DeepSeek è un mito: l'intelligenza artificiale rivoluzionaria in realtà costa $ 1,6 miliardi per lo sviluppo

L'accessibilità economica di DeepSeek è un mito: l'intelligenza artificiale rivoluzionaria in realtà costa $ 1,6 miliardi per lo sviluppo

by Madison Mar 21,2025

Il nuovo chatbot di Deepseek vanta un'impressionante introduzione: "Ciao, sono stato creato in modo da poter chiedere qualsiasi cosa e ottenere una risposta che potrebbe persino sorprenderti." Questa intelligenza artificiale, un prodotto della startup cinese Deepseek, è rapidamente diventata un attore importante, causando anche calo significativi del prezzo delle azioni di Nvidia.

Test di DeepSeek

Il bordo competitivo di Deepseek risiede nella sua architettura innovativa e metodi di formazione. Le tecnologie chiave includono:

  • Multi-token Prediction (MTP): Invece di prevedere le parole individualmente, MTP prevede contemporaneamente più parole, aumentando l'accuratezza ed efficienza.
  • Miscela di esperti (MOE): questa architettura utilizza più reti neurali (256 in DeepSeek V3, con otto attivate per token), accelerando la formazione e migliorando le prestazioni.
  • Attenzione latente multi-testa (MLA): MLA si concentra ripetutamente su parti di frasi chiave, minimizzando il rischio di trascurare le informazioni cruciali.
DeepSeek V3

La pretesa iniziale di Deepseek su un costo di allenamento di soli $ 6 milioni per Deepseek V3, utilizzando solo 2048 GPU, è stata contestata. La semianalisi ha rivelato un'infrastruttura molto più ampia, che comprende circa 50.000 GPU della tramoggia Nvidia (inclusi 10.000 H800, 10.000 H100 e ulteriori H20) diffusi su più data center. Ciò si traduce in un investimento server di circa $ 1,6 miliardi e le spese operative stimate in $ 944 milioni.

Deep -Week

Deepseek, una consociata di High-Flyer, un hedge fund cinese, possiede i suoi data center, promuovendo il controllo e l'innovazione. La sua natura autofinanziata consente un rapido processo decisionale. Inoltre, la società attira i migliori talenti, con alcuni ricercatori che guadagnano oltre $ 1,3 milioni all'anno, principalmente dalle università cinesi.

Mentre l'affermazione dei costi di formazione da $ 6 milioni di DeepSeek è fuorviante (riflettendo solo l'utilizzo della GPU pre-allenamento, escluso la ricerca, il perfezionamento, l'elaborazione dei dati e le infrastrutture), la società ha investito oltre 500 milioni di dollari nello sviluppo dell'IA. La sua struttura magra facilita l'innovazione efficiente.

Deep -Week

Il successo di Deepseek dimostra il potenziale di un'azienda di intelligenza artificiale indipendente ben finanziata per competere con i giganti del settore. Tuttavia, i suoi risultati sono costruiti su investimenti sostanziali, progressi tecnici e un team forte, rendendo la narrazione del "bilancio rivoluzionario" una semplificazione eccessiva. Anche così, i costi di Deepseek rimangono significativamente più bassi rispetto ai concorrenti. Ad esempio, il modello R1 di Deepseek è costato $ 5 milioni per l'allenamento, rispetto ai $ 100 milioni di CHATGPT4.

Giochi di tendenza