Hogar News > La asequibilidad de Deepseek es un mito: la IA revolucionaria en realidad costó $ 1.6 mil millones para desarrollarse

La asequibilidad de Deepseek es un mito: la IA revolucionaria en realidad costó $ 1.6 mil millones para desarrollarse

by Madison Mar 21,2025

El nuevo chatbot de Deepseek cuenta con una introducción impresionante: "Hola, fui creado para que puedas preguntar cualquier cosa y obtener una respuesta que incluso te sorprenda". Esta IA, un producto de la startup china Deepseek, se ha convertido rápidamente en un jugador importante, incluso causando caídas significativas en el precio de las acciones de Nvidia.

Prueba de Speeek

La ventaja competitiva de Deepseek se encuentra en sus innovadores métodos de arquitectura y capacitación. Las tecnologías clave incluyen:

  • Predicción múltiple (MTP): en lugar de predecir palabras individualmente, MTP pronostica múltiples palabras simultáneamente, aumentando la precisión y la eficiencia.
  • Mezcla de expertos (MOE): esta arquitectura utiliza múltiples redes neuronales (256 en Deepseek V3, con ocho activados por token), acelerando el entrenamiento y la mejora del rendimiento.
  • Atención latente de múltiples cabezas (MLA): MLA se enfoca repetidamente en las piezas clave de las oraciones, minimizando el riesgo de pasar por alto la información crucial.
Deepseek v3

El reclamo inicial de Deepseek de solo un costo de capacitación de $ 6 millones para Deepseek V3, utilizando solo 2048 GPU, ha sido desafiado. El semianálisis reveló una infraestructura mucho más extensa, que abarca aproximadamente 50,000 GPU de la tolva nvidia (incluidas 10,000 H800, 10,000 H100 y H20 adicionales) distribuidos en múltiples centros de datos. Esto se traduce en una inversión de servidor de aproximadamente $ 1.6 mil millones y los gastos operativos estimados en $ 944 millones.

Veterano

Deepseek, una subsidiaria de High-Flyer, un fondo de cobertura chino, posee sus centros de datos, fomentando el control y la innovación. Su naturaleza autofinanciada permite una rápida toma de decisiones. Además, la compañía atrae a los mejores talentos, con algunos investigadores ganando más de $ 1.3 millones anuales, principalmente de universidades chinas.

Si bien el reclamo de costos de capacitación de $ 6 millones de Deepseek es engañoso (reflejando solo el uso de GPU previa al entrenamiento, excluyendo la investigación, el refinamiento, el procesamiento de datos e infraestructura), la compañía ha invertido más de $ 500 millones en desarrollo de IA. Su estructura magra facilita la innovación eficiente.

Veterano

El éxito de Deepseek demuestra el potencial de una compañía de IA independiente bien financiada para competir con los gigantes de la industria. Sin embargo, sus logros se basan en una inversión sustancial, avances técnicos y un equipo fuerte, lo que hace que la narrativa del "presupuesto revolucionario" sea una simplificación excesiva. Aun así, los costos de Deepseek siguen siendo significativamente más bajos que los competidores. Por ejemplo, el modelo R1 de Deepseek costó $ 5 millones para entrenar, en comparación con los $ 100 millones de CHATGPT4.

Últimas aplicaciones
Juegos de tendencia