Kemampuan DeepSeek adalah mitos: AI revolusioner sebenarnya berharga $ 1.6 bilion untuk berkembang
Chatbot baru Deepseek mempunyai pengenalan yang mengagumkan: "Hai, saya telah dicipta supaya anda boleh meminta apa -apa dan mendapatkan jawapan yang mungkin mengejutkan anda." AI ini, produk permulaan Cina Deepseek, telah menjadi pemain utama, bahkan menyebabkan penurunan yang ketara dalam harga saham Nvidia.

Kelebihan daya saing DeepSeek terletak pada kaedah seni bina dan latihan yang inovatif. Teknologi utama termasuk:
- Ramalan Multi-Token (MTP): Daripada meramalkan kata-kata secara individu, MTP meramalkan pelbagai perkataan secara serentak, meningkatkan ketepatan dan kecekapan.
- Campuran Pakar (MOE): Senibina ini menggunakan pelbagai rangkaian saraf (256 dalam DeepSeek V3, dengan lapan di aktifkan per token), mempercepatkan latihan dan meningkatkan prestasi.
- Perhatian Laten Multi-Head (MLA): MLA berulang kali memberi tumpuan kepada bahagian-bahagian kalimat utama, meminimumkan risiko menghadap maklumat penting.

Tuntutan awal Deepseek hanya kos latihan $ 6 juta untuk DeepSeek V3, menggunakan hanya 2048 GPU, telah dicabar. Semianalysis mendedahkan infrastruktur yang jauh lebih luas, yang merangkumi kira -kira 50,000 NVIDIA Hopper GPU (termasuk 10,000 H800s, 10,000 H100s, dan H20s tambahan) yang tersebar di pelbagai pusat data. Ini diterjemahkan kepada pelaburan pelayan kira -kira $ 1.6 bilion dan perbelanjaan operasi yang dianggarkan sebanyak $ 944 juta.

DeepSeek, anak syarikat High-Flyer, dana lindung nilai Cina, memiliki pusat datanya, memupuk kawalan dan inovasi. Sifat yang dibiayai sendiri membolehkan pengambilan keputusan yang cepat. Selain itu, syarikat itu menarik bakat terbaik, dengan beberapa penyelidik memperoleh lebih dari $ 1.3 juta setiap tahun, terutamanya dari universiti -universiti China.
Walaupun tuntutan kos latihan DeepSeek $ 6 juta adalah mengelirukan (mencerminkan hanya penggunaan GPU pra-latihan, tidak termasuk penyelidikan, penghalusan, pemprosesan data, dan infrastruktur), syarikat itu telah melabur lebih daripada $ 500 juta dalam pembangunan AI. Struktur rampingnya memudahkan inovasi yang cekap.

Kejayaan DeepSeek menunjukkan potensi syarikat AI yang dibiayai dengan baik untuk bersaing dengan gergasi industri. Walau bagaimanapun, pencapaiannya dibina atas pelaburan yang besar, kemajuan teknikal, dan pasukan yang kuat, menjadikan naratif "anggaran revolusioner" sebagai oversimplification. Walau bagaimanapun, kos DeepSeek kekal jauh lebih rendah daripada pesaing. Sebagai contoh, model R1 DeepSeek berharga $ 5 juta untuk melatih, berbanding $ 100 juta ChatGPT4.
- 1 "Cari semua lokasi Templar di Assassin's Creed Shadows - Panduan Spoiler" Apr 04,2025
- 2 Laluan Pengasingan 2: Percubaan Panduan Sekhemas Feb 12,2025
- 3 Polity ialah MMORPG baharu yang membolehkan anda berinteraksi dengan rakan dalam talian anda dalam pelayan kongsi, keluar sekarang Feb 10,2025
- 4 Celestial Guardian Reginleif Menyertai Seven Knights Idle Adventure Jan 16,2025
- 5 Roblox: Kod Bullet Dungeon Terkini untuk 25 Januari Feb 12,2025
- 6 Konsol Permainan Android Penarafan Tertinggi: Panduan Komprehensif Jan 16,2025
- 7 Bola Keranjang Zero: Pautan Trello dan Discord Rasmi Terungkap Mar 26,2025
- 8 Assassin's Creed Shadows: Max Level and Rank Cap diturunkan Mar 27,2025
-
Permainan arked ketagihan untuk mudah alih
Sebanyak 10
-
Arked Klasik dan Hit Baharu Teratas
Sebanyak 10