A acessibilidade do Deepseek é um mito: a IA revolucionária realmente custou US $ 1,6 bilhão para se desenvolver
O novo chatbot de Deepseek possui uma introdução impressionante: "Oi, fui criado para que você possa perguntar qualquer coisa e obter uma resposta que possa até surpreendê -lo". Essa IA, um produto da startup chinesa Deepseek, tornou -se rapidamente um participante importante, causando quedas significativas no preço das ações da NVIDIA.

A vantagem competitiva da Deepseek está em seus métodos inovadores de arquitetura e treinamento. As principais tecnologias incluem:
- Previsão com vários toques (MTP): Em vez de prever palavras individualmente, o MTP prevê várias palavras simultaneamente, aumentando a precisão e a eficiência.
- Mistura de especialistas (MOE): Esta arquitetura usa várias redes neurais (256 no Deepseek V3, com oito ativados por token), acelerando o treinamento e aprimorando o desempenho.
- Atenção latente de várias cabeças (MLA): O MLA se concentra repetidamente nas principais peças da frase, minimizando o risco de ignorar as informações cruciais.

A reivindicação inicial de Deepseek de meros custos de treinamento de US $ 6 milhões para o Deepseek V3, usando apenas 2048 GPUs, foi contestada. A semiânica revelou uma infraestrutura muito mais extensa, abrangendo aproximadamente 50.000 GPUs NVIDIA Hopper (incluindo 10.000 H800s, 10.000 H100s e H20s adicionais) espalhados por vários data centers. Isso se traduz em um investimento em servidor de aproximadamente US $ 1,6 bilhão e despesas operacionais estimadas em US $ 944 milhões.

A Deepseek, uma subsidiária da High-Flyer, um fundo de hedge chinês, possui seus data centers, promovendo controle e inovação. Sua natureza autofinanciada permite uma rápida tomada de decisão. Além disso, a empresa atrai os melhores talentos, com alguns pesquisadores ganhando mais de US $ 1,3 milhão anualmente, principalmente das universidades chinesas.
Embora a reivindicação de custo de treinamento de US $ 6 milhões da Deepseek seja enganosa (refletindo apenas o uso de GPU pré-treinamento, excluindo pesquisas, refinamento, processamento de dados e infraestrutura), a empresa investiu mais de US $ 500 milhões em desenvolvimento de IA. Sua estrutura enxuta facilita a inovação eficiente.

O sucesso da Deepseek demonstra o potencial de uma empresa de IA independente e bem financiada para competir com os gigantes do setor. No entanto, suas realizações são construídas sobre investimentos substanciais, avanços técnicos e uma equipe forte, tornando a narrativa de "orçamento revolucionário" uma simplificação excessiva. Mesmo assim, os custos da Deepseek permanecem significativamente menores que os concorrentes. Por exemplo, o modelo R1 da Deepseek custou US $ 5 milhões para treinar, em comparação com os US $ 100 milhões do ChatGPT4.
- 1 "Descubra todos os locais dos templários em Assassin's Creed Shadows - Guia de Spoiler" Apr 04,2025
- 2 Path of Exile 2: Guia do Julgamento de Sekhemas Feb 12,2025
- 3 Polity é um novo MMORPG que permite interagir com seus amigos online em um servidor compartilhado, já disponível Feb 10,2025
- 4 Guardião Celestial Reginleif entra Seven Knights Idle Adventure Jan 16,2025
- 5 Roblox: Últimos códigos de Bullet Dungeon para 25 de janeiro Feb 12,2025
- 6 Consoles de jogos Android mais bem avaliados: um guia abrangente Jan 16,2025
- 7 Basquete Zero: Links oficiais de trello e discórdia revelados Mar 26,2025
- 8 Assassin's Creed Shadows: Max Nível e Cap Rank revelados Mar 27,2025
-
Jogos de arcade viciantes para celular
Um total de 10
-
Principais clássicos do arcade e novos sucessos
Um total de 10
-
Jogos de aventura épicos: explorar mundos desconhecidos
Um total de 10