L'accessibilità economica di DeepSeek è un mito: l'intelligenza artificiale rivoluzionaria in realtà costa $ 1,6 miliardi per lo sviluppo
Il nuovo chatbot di Deepseek vanta un'impressionante introduzione: "Ciao, sono stato creato in modo da poter chiedere qualsiasi cosa e ottenere una risposta che potrebbe persino sorprenderti." Questa intelligenza artificiale, un prodotto della startup cinese Deepseek, è rapidamente diventata un attore importante, causando anche calo significativi del prezzo delle azioni di Nvidia.

Il bordo competitivo di Deepseek risiede nella sua architettura innovativa e metodi di formazione. Le tecnologie chiave includono:
- Multi-token Prediction (MTP): Invece di prevedere le parole individualmente, MTP prevede contemporaneamente più parole, aumentando l'accuratezza ed efficienza.
- Miscela di esperti (MOE): questa architettura utilizza più reti neurali (256 in DeepSeek V3, con otto attivate per token), accelerando la formazione e migliorando le prestazioni.
- Attenzione latente multi-testa (MLA): MLA si concentra ripetutamente su parti di frasi chiave, minimizzando il rischio di trascurare le informazioni cruciali.

La pretesa iniziale di Deepseek su un costo di allenamento di soli $ 6 milioni per Deepseek V3, utilizzando solo 2048 GPU, è stata contestata. La semianalisi ha rivelato un'infrastruttura molto più ampia, che comprende circa 50.000 GPU della tramoggia Nvidia (inclusi 10.000 H800, 10.000 H100 e ulteriori H20) diffusi su più data center. Ciò si traduce in un investimento server di circa $ 1,6 miliardi e le spese operative stimate in $ 944 milioni.

Deepseek, una consociata di High-Flyer, un hedge fund cinese, possiede i suoi data center, promuovendo il controllo e l'innovazione. La sua natura autofinanziata consente un rapido processo decisionale. Inoltre, la società attira i migliori talenti, con alcuni ricercatori che guadagnano oltre $ 1,3 milioni all'anno, principalmente dalle università cinesi.
Mentre l'affermazione dei costi di formazione da $ 6 milioni di DeepSeek è fuorviante (riflettendo solo l'utilizzo della GPU pre-allenamento, escluso la ricerca, il perfezionamento, l'elaborazione dei dati e le infrastrutture), la società ha investito oltre 500 milioni di dollari nello sviluppo dell'IA. La sua struttura magra facilita l'innovazione efficiente.

Il successo di Deepseek dimostra il potenziale di un'azienda di intelligenza artificiale indipendente ben finanziata per competere con i giganti del settore. Tuttavia, i suoi risultati sono costruiti su investimenti sostanziali, progressi tecnici e un team forte, rendendo la narrazione del "bilancio rivoluzionario" una semplificazione eccessiva. Anche così, i costi di Deepseek rimangono significativamente più bassi rispetto ai concorrenti. Ad esempio, il modello R1 di Deepseek è costato $ 5 milioni per l'allenamento, rispetto ai $ 100 milioni di CHATGPT4.
- 1 "Scopri tutte le posizioni templari in Assassin's Creed Shadows - Spoiler Guide" Apr 04,2025
- 2 Path of Exile 2: Prova della Guida Sekhemas Feb 12,2025
- 3 Polity è un nuovo MMORPG che ti consente di interagire con i tuoi amici online in un server condiviso, ora disponibile Feb 10,2025
- 4 Il Guardiano Celeste Reginleif si unisce Seven Knights Idle Adventure Jan 16,2025
- 5 Roblox: Ultimi codici Bullet Dungeon del 25 gennaio Feb 12,2025
- 6 Console di gioco Android più votate: una guida completa Jan 16,2025
- 7 Basketball Zero: I link ufficiali di Trello e Discord sono stati rivelati Mar 26,2025
- 8 Assassin's Creed Shadows: Max Livello e Rank Cap rivelati Mar 27,2025
-
I giochi arcade dipendenti per dispositivi mobili
Un totale di 10
-
I migliori classici arcade e nuovi successi
Un totale di 10
-
Epic Adventure Games: esplora mondi Uncharted
Un totale di 10