La asequibilidad de Deepseek es un mito: la IA revolucionaria en realidad costó $ 1.6 mil millones para desarrollarse
El nuevo chatbot de Deepseek cuenta con una introducción impresionante: "Hola, fui creado para que puedas preguntar cualquier cosa y obtener una respuesta que incluso te sorprenda". Esta IA, un producto de la startup china Deepseek, se ha convertido rápidamente en un jugador importante, incluso causando caídas significativas en el precio de las acciones de Nvidia.

La ventaja competitiva de Deepseek se encuentra en sus innovadores métodos de arquitectura y capacitación. Las tecnologías clave incluyen:
- Predicción múltiple (MTP): en lugar de predecir palabras individualmente, MTP pronostica múltiples palabras simultáneamente, aumentando la precisión y la eficiencia.
- Mezcla de expertos (MOE): esta arquitectura utiliza múltiples redes neuronales (256 en Deepseek V3, con ocho activados por token), acelerando el entrenamiento y la mejora del rendimiento.
- Atención latente de múltiples cabezas (MLA): MLA se enfoca repetidamente en las piezas clave de las oraciones, minimizando el riesgo de pasar por alto la información crucial.

El reclamo inicial de Deepseek de solo un costo de capacitación de $ 6 millones para Deepseek V3, utilizando solo 2048 GPU, ha sido desafiado. El semianálisis reveló una infraestructura mucho más extensa, que abarca aproximadamente 50,000 GPU de la tolva nvidia (incluidas 10,000 H800, 10,000 H100 y H20 adicionales) distribuidos en múltiples centros de datos. Esto se traduce en una inversión de servidor de aproximadamente $ 1.6 mil millones y los gastos operativos estimados en $ 944 millones.

Deepseek, una subsidiaria de High-Flyer, un fondo de cobertura chino, posee sus centros de datos, fomentando el control y la innovación. Su naturaleza autofinanciada permite una rápida toma de decisiones. Además, la compañía atrae a los mejores talentos, con algunos investigadores ganando más de $ 1.3 millones anuales, principalmente de universidades chinas.
Si bien el reclamo de costos de capacitación de $ 6 millones de Deepseek es engañoso (reflejando solo el uso de GPU previa al entrenamiento, excluyendo la investigación, el refinamiento, el procesamiento de datos e infraestructura), la compañía ha invertido más de $ 500 millones en desarrollo de IA. Su estructura magra facilita la innovación eficiente.

El éxito de Deepseek demuestra el potencial de una compañía de IA independiente bien financiada para competir con los gigantes de la industria. Sin embargo, sus logros se basan en una inversión sustancial, avances técnicos y un equipo fuerte, lo que hace que la narrativa del "presupuesto revolucionario" sea una simplificación excesiva. Aun así, los costos de Deepseek siguen siendo significativamente más bajos que los competidores. Por ejemplo, el modelo R1 de Deepseek costó $ 5 millones para entrenar, en comparación con los $ 100 millones de CHATGPT4.
- 1 "Descubra todas las ubicaciones templarias en Assassin's Creed Shadows - Guía de spoiler" Apr 04,2025
- 2 Path of Exile 2: Prueba de la guía Sekhemas Feb 12,2025
- 3 Polity es un nuevo MMORPG que te permite interactuar con tus amigos en línea en un servidor compartido, ya disponible Feb 10,2025
- 4 El guardián celestial Reginleif se une Seven Knights Idle Adventure Jan 16,2025
- 5 Roblox: Últimos códigos de Bullet Dungeon para el 25 de enero Feb 12,2025
- 6 Consolas de juegos Android mejor valoradas: una guía completa Jan 16,2025
- 7 Baloncesto Zero: revelados los enlaces oficiales de Trello y Discord Mar 26,2025
- 8 Assassin's Creed Shadows: Revelado el nivel máximo y el rango Mar 27,2025
-
Juegos de arcade adictivos para dispositivos móviles
Un total de 10
-
Principales clásicos arcade y nuevos éxitos
Un total de 10
-
Juegos de aventuras épicas: Explore Worlds Uncharted
Un total de 10