Rumah News > Kemampuan DeepSeek adalah mitos: AI revolusioner sebenarnya berharga $ 1.6 bilion untuk berkembang

Kemampuan DeepSeek adalah mitos: AI revolusioner sebenarnya berharga $ 1.6 bilion untuk berkembang

by Madison Mar 21,2025

Chatbot baru Deepseek mempunyai pengenalan yang mengagumkan: "Hai, saya telah dicipta supaya anda boleh meminta apa -apa dan mendapatkan jawapan yang mungkin mengejutkan anda." AI ini, produk permulaan Cina Deepseek, telah menjadi pemain utama, bahkan menyebabkan penurunan yang ketara dalam harga saham Nvidia.

Ujian DeepSeek

Kelebihan daya saing DeepSeek terletak pada kaedah seni bina dan latihan yang inovatif. Teknologi utama termasuk:

  • Ramalan Multi-Token (MTP): Daripada meramalkan kata-kata secara individu, MTP meramalkan pelbagai perkataan secara serentak, meningkatkan ketepatan dan kecekapan.
  • Campuran Pakar (MOE): Senibina ini menggunakan pelbagai rangkaian saraf (256 dalam DeepSeek V3, dengan lapan di aktifkan per token), mempercepatkan latihan dan meningkatkan prestasi.
  • Perhatian Laten Multi-Head (MLA): MLA berulang kali memberi tumpuan kepada bahagian-bahagian kalimat utama, meminimumkan risiko menghadap maklumat penting.
DeepSeek V3

Tuntutan awal Deepseek hanya kos latihan $ 6 juta untuk DeepSeek V3, menggunakan hanya 2048 GPU, telah dicabar. Semianalysis mendedahkan infrastruktur yang jauh lebih luas, yang merangkumi kira -kira 50,000 NVIDIA Hopper GPU (termasuk 10,000 H800s, 10,000 H100s, dan H20s tambahan) yang tersebar di pelbagai pusat data. Ini diterjemahkan kepada pelaburan pelayan kira -kira $ 1.6 bilion dan perbelanjaan operasi yang dianggarkan sebanyak $ 944 juta.

Deepseek

DeepSeek, anak syarikat High-Flyer, dana lindung nilai Cina, memiliki pusat datanya, memupuk kawalan dan inovasi. Sifat yang dibiayai sendiri membolehkan pengambilan keputusan yang cepat. Selain itu, syarikat itu menarik bakat terbaik, dengan beberapa penyelidik memperoleh lebih dari $ 1.3 juta setiap tahun, terutamanya dari universiti -universiti China.

Walaupun tuntutan kos latihan DeepSeek $ 6 juta adalah mengelirukan (mencerminkan hanya penggunaan GPU pra-latihan, tidak termasuk penyelidikan, penghalusan, pemprosesan data, dan infrastruktur), syarikat itu telah melabur lebih daripada $ 500 juta dalam pembangunan AI. Struktur rampingnya memudahkan inovasi yang cekap.

Deepseek

Kejayaan DeepSeek menunjukkan potensi syarikat AI yang dibiayai dengan baik untuk bersaing dengan gergasi industri. Walau bagaimanapun, pencapaiannya dibina atas pelaburan yang besar, kemajuan teknikal, dan pasukan yang kuat, menjadikan naratif "anggaran revolusioner" sebagai oversimplification. Walau bagaimanapun, kos DeepSeek kekal jauh lebih rendah daripada pesaing. Sebagai contoh, model R1 DeepSeek berharga $ 5 juta untuk melatih, berbanding $ 100 juta ChatGPT4.

Permainan Trend