Khả năng chi trả của Deepseek là một huyền thoại: AI cách mạng thực sự có giá 1,6 tỷ đô la để phát triển
Chatbot mới của Deepseek tự hào về phần giới thiệu ấn tượng: "Xin chào, tôi được tạo ra để bạn có thể hỏi bất cứ điều gì và nhận được câu trả lời thậm chí có thể làm bạn ngạc nhiên." AI này, một sản phẩm của công ty khởi nghiệp Trung Quốc Deepseek, đã nhanh chóng trở thành một người chơi chính, thậm chí gây ra sự sụt giảm đáng kể về giá cổ phiếu của NVIDIA.

Cạnh tranh cạnh tranh của Deepseek nằm trong kiến trúc và phương pháp đào tạo sáng tạo. Công nghệ chính bao gồm:
- Dự đoán đa điểm (MTP): Thay vì dự đoán các từ riêng lẻ, MTP dự báo đồng thời nhiều từ, tăng độ chính xác và hiệu quả.
- Hỗn hợp các chuyên gia (MOE): Kiến trúc này sử dụng nhiều mạng lưới thần kinh (256 trong Deepseek V3, với tám mã thông báo được kích hoạt), tăng tốc đào tạo và tăng cường hiệu suất.
- Sự chú ý tiềm ẩn đa đầu (MLA): MLA liên tục tập trung vào các phần câu chính, giảm thiểu rủi ro nhìn ra thông tin quan trọng.

Yêu cầu ban đầu của Deepseek về chi phí đào tạo chỉ 6 triệu đô la cho Deepseek V3, chỉ sử dụng 2048 GPU, đã bị thách thức. Phép phân cực cho thấy cơ sở hạ tầng rộng lớn hơn nhiều, bao gồm khoảng 50.000 GPU phễu NVIDIA (bao gồm 10.000 H800, 10.000 H100 và H20 bổ sung) trải rộng trên nhiều trung tâm dữ liệu. Điều này có nghĩa là đầu tư máy chủ khoảng 1,6 tỷ đô la và chi phí hoạt động ước tính là 944 triệu đô la.

Deepseek, một công ty con của High Flyer, một quỹ phòng hộ của Trung Quốc, sở hữu các trung tâm dữ liệu của mình, thúc đẩy kiểm soát và đổi mới. Bản chất tự tài trợ của nó cho phép ra quyết định nhanh chóng. Hơn nữa, công ty thu hút tài năng hàng đầu, với một số nhà nghiên cứu kiếm được hơn 1,3 triệu đô la hàng năm, chủ yếu từ các trường đại học Trung Quốc.
Trong khi yêu cầu chi phí đào tạo trị giá 6 triệu đô la của Deepseek là sai lệch (chỉ phản ánh việc sử dụng GPU trước khi đào tạo, không bao gồm nghiên cứu, sàng lọc, xử lý dữ liệu và cơ sở hạ tầng), công ty đã đầu tư hơn 500 triệu đô la vào phát triển AI. Cấu trúc nạc của nó tạo điều kiện cho sự đổi mới hiệu quả.

Thành công của Deepseek cho thấy tiềm năng của một công ty AI độc lập, được tài trợ tốt để cạnh tranh với những người khổng lồ trong ngành. Tuy nhiên, thành tích của nó được xây dựng dựa trên đầu tư đáng kể, những tiến bộ kỹ thuật và một nhóm mạnh mẽ, làm cho câu chuyện "Ngân sách cách mạng" trở thành sự đơn giản hóa. Mặc dù vậy, chi phí của Deepseek vẫn thấp hơn đáng kể so với các đối thủ cạnh tranh. Ví dụ, mô hình R1 của Deepseek có giá 5 triệu đô la để đào tạo, so với 100 triệu đô la của TATGPT4.
- 1 "Khám phá tất cả các địa điểm của Templar trong Assassin Creed Shadows - Hướng dẫn Spoiler" Apr 04,2025
- 2 Path of Exile 2: Thử nghiệm hướng dẫn Sekhemas Feb 12,2025
- 3 Polity là một game MMORPG mới cho phép bạn tương tác với bạn bè trực tuyến của mình trên một máy chủ dùng chung, hiện đã có Feb 10,2025
- 4 Người bảo vệ thiên thể Reginleif tham gia Seven Knights Idle Adventure Jan 16,2025
- 5 Roblox: Code Bullet Dungeon mới nhất ngày 25/1 Feb 12,2025
- 6 Máy chơi game Android được xếp hạng hàng đầu: Hướng dẫn toàn diện Jan 16,2025
- 7 Bóng rổ số không: Liên kết chính thức Trello và Discord được tiết lộ Mar 26,2025
- 8 Assassin's Creed Shadows: Max Level và Rank Cap được tiết lộ Mar 27,2025
-
Trò chơi arcade gây nghiện cho thiết bị di động
Tổng cộng 10