Ang kakayahang magamit ng Deepseek ay isang alamat: ang rebolusyonaryong AI ay talagang nagkakahalaga ng $ 1.6 bilyon upang mabuo
Ipinagmamalaki ng bagong chatbot ng Deepseek ang isang kahanga -hangang pagpapakilala: "Kumusta, nilikha ako upang maaari kang magtanong ng anuman at makakuha ng isang sagot na maaaring sorpresa ka." Ang AI na ito, isang produkto ng China Startup Deepseek, ay mabilis na naging isang pangunahing manlalaro, kahit na nagdudulot ng mga makabuluhang patak sa presyo ng stock ni Nvidia.

Ang mapagkumpitensyang gilid ng DeepSeek ay nakasalalay sa makabagong mga pamamaraan ng arkitektura at pagsasanay. Ang mga pangunahing teknolohiya ay kasama ang:
- Multi-Token Prediction (MTP): Sa halip na mahulaan ang mga salita nang paisa-isa, ang mga pagtataya ng MTP ay maraming mga salita nang sabay-sabay, pagpapalakas ng kawastuhan at kahusayan.
- Paghahalo ng mga eksperto (MOE): Ang arkitektura na ito ay gumagamit ng maraming mga neural network (256 sa Deepseek V3, na may walong na -aktibo bawat token), pabilis na pagsasanay at pagpapahusay ng pagganap.
- Multi-head latent pansin (MLA): Ang MLA ay paulit-ulit na nakatuon sa mga pangunahing bahagi ng pangungusap, na binabawasan ang panganib ng pagtatanaw ng mahahalagang impormasyon.

Ang paunang pag -angkin ng Deepseek ng isang $ 6 milyong gastos sa pagsasanay para sa Deepseek V3, gamit lamang ang 2048 GPUs, ay hinamon. Ang Semianalysis ay nagsiwalat ng isang mas malawak na imprastraktura, na sumasaklaw sa humigit -kumulang na 50,000 nvidia hopper GPUs (kabilang ang 10,000 H800s, 10,000 H100s, at karagdagang mga H20) na kumalat sa maraming mga sentro ng data. Ito ay isinasalin sa isang pamumuhunan ng server na humigit -kumulang na $ 1.6 bilyon at mga gastos sa pagpapatakbo na tinatayang $ 944 milyon.

Ang Deepseek, isang subsidiary ng high-flyer, isang pondo ng hedge ng Tsino, ay nagmamay-ari ng mga sentro ng data nito, ang pagpapalakas ng kontrol at pagbabago. Ang kalikasan na pinondohan ng sarili ay nagbibigay-daan para sa mabilis na paggawa ng desisyon. Bukod dito, ang kumpanya ay umaakit sa nangungunang talento, na may ilang mga mananaliksik na kumikita ng higit sa $ 1.3 milyon taun -taon, lalo na mula sa mga unibersidad ng Tsino.
Habang ang $ 6 milyong pag-angkin ng gastos sa pagsasanay sa Deepseek ay nakaliligaw (sumasalamin lamang sa paggamit ng pre-training GPU, hindi kasama ang pananaliksik, pagpipino, pagproseso ng data, at imprastraktura), ang kumpanya ay namuhunan ng higit sa $ 500 milyon sa pag-unlad ng AI. Ang sandalan na istraktura nito ay nagpapadali ng mahusay na pagbabago.

Ang tagumpay ng Deepseek ay nagpapakita ng potensyal ng isang mahusay na pondo, independiyenteng kumpanya ng AI upang makipagkumpetensya sa mga higanteng industriya. Gayunpaman, ang mga nakamit nito ay itinayo sa malaking pamumuhunan, mga pagsulong sa teknikal, at isang malakas na koponan, na ginagawa ang "rebolusyonaryong badyet" na nagsasalaysay ng isang labis na pag -iingat. Kahit na, ang mga gastos sa Deepseek ay nananatiling mas mababa kaysa sa mga kakumpitensya. Halimbawa, ang modelo ng R1 ng Deepseek ay nagkakahalaga ng $ 5 milyon upang sanayin, kumpara sa $ 100 milyon ng ChatGPT4.
- 1 Ikonekta ang Asus Rog Ally sa TV o Monitor: Madaling Gabay Apr 06,2025
- 2 Assassin's Creed Shadows: max level at ranggo ng takip na ipinahayag Mar 27,2025
- 3 Path of Exile 2: Trial of the Sekhemas Guide Feb 12,2025
- 4 Ang Pinakamahusay na Listahan ng Kaligtsa ng Marvel ng Champions Tier para sa 2025 Mar 19,2025
- 5 "Tuklasin ang lahat ng mga lokasyon ng Templar sa Assassin's Creed Shadows - Gabay sa Spoiler" Apr 04,2025
- 6 "Rick at Morty Season 8: Manood ng Mga Bagong Episod Online" May 26,2025
- 7 Basketball Zero: Ang opisyal na mga link sa trello at discord ay ipinahayag Mar 26,2025
- 8 Listahan ng Dragon Soul Tier: Ultimate Guide May 12,2025
-
Nakakahumaling na arcade game para sa mobile
Kabuuan ng 10
-
Mga Nangungunang Arcade Classic at Bagong Hit
Kabuuan ng 10
-
Android apps para sa paglikha ng nilalaman ng video
Kabuuan ng 10