Trang chủ News > Khả năng chi trả của Deepseek là một huyền thoại: AI cách mạng thực sự có giá 1,6 tỷ đô la để phát triển

Khả năng chi trả của Deepseek là một huyền thoại: AI cách mạng thực sự có giá 1,6 tỷ đô la để phát triển

by Madison Mar 21,2025

Chatbot mới của Deepseek tự hào về phần giới thiệu ấn tượng: "Xin chào, tôi được tạo ra để bạn có thể hỏi bất cứ điều gì và nhận được câu trả lời thậm chí có thể làm bạn ngạc nhiên." AI này, một sản phẩm của công ty khởi nghiệp Trung Quốc Deepseek, đã nhanh chóng trở thành một người chơi chính, thậm chí gây ra sự sụt giảm đáng kể về giá cổ phiếu của NVIDIA.

DeepSeek Test

Cạnh tranh cạnh tranh của Deepseek nằm trong kiến ​​trúc và phương pháp đào tạo sáng tạo. Công nghệ chính bao gồm:

  • Dự đoán đa điểm (MTP): Thay vì dự đoán các từ riêng lẻ, MTP dự báo đồng thời nhiều từ, tăng độ chính xác và hiệu quả.
  • Hỗn hợp các chuyên gia (MOE): Kiến trúc này sử dụng nhiều mạng lưới thần kinh (256 trong Deepseek V3, với tám mã thông báo được kích hoạt), tăng tốc đào tạo và tăng cường hiệu suất.
  • Sự chú ý tiềm ẩn đa đầu (MLA): MLA liên tục tập trung vào các phần câu chính, giảm thiểu rủi ro nhìn ra thông tin quan trọng.
Deepseek v3

Yêu cầu ban đầu của Deepseek về chi phí đào tạo chỉ 6 triệu đô la cho Deepseek V3, chỉ sử dụng 2048 GPU, đã bị thách thức. Phép phân cực cho thấy cơ sở hạ tầng rộng lớn hơn nhiều, bao gồm khoảng 50.000 GPU phễu NVIDIA (bao gồm 10.000 H800, 10.000 H100 và H20 bổ sung) trải rộng trên nhiều trung tâm dữ liệu. Điều này có nghĩa là đầu tư máy chủ khoảng 1,6 tỷ đô la và chi phí hoạt động ước tính là 944 triệu đô la.

Deepseek

Deepseek, một công ty con của High Flyer, một quỹ phòng hộ của Trung Quốc, sở hữu các trung tâm dữ liệu của mình, thúc đẩy kiểm soát và đổi mới. Bản chất tự tài trợ của nó cho phép ra quyết định nhanh chóng. Hơn nữa, công ty thu hút tài năng hàng đầu, với một số nhà nghiên cứu kiếm được hơn 1,3 triệu đô la hàng năm, chủ yếu từ các trường đại học Trung Quốc.

Trong khi yêu cầu chi phí đào tạo trị giá 6 triệu đô la của Deepseek là sai lệch (chỉ phản ánh việc sử dụng GPU trước khi đào tạo, không bao gồm nghiên cứu, sàng lọc, xử lý dữ liệu và cơ sở hạ tầng), công ty đã đầu tư hơn 500 triệu đô la vào phát triển AI. Cấu trúc nạc của nó tạo điều kiện cho sự đổi mới hiệu quả.

Deepseek

Thành công của Deepseek cho thấy tiềm năng của một công ty AI độc lập, được tài trợ tốt để cạnh tranh với những người khổng lồ trong ngành. Tuy nhiên, thành tích của nó được xây dựng dựa trên đầu tư đáng kể, những tiến bộ kỹ thuật và một nhóm mạnh mẽ, làm cho câu chuyện "Ngân sách cách mạng" trở thành sự đơn giản hóa. Mặc dù vậy, chi phí của Deepseek vẫn thấp hơn đáng kể so với các đối thủ cạnh tranh. Ví dụ, mô hình R1 của Deepseek có giá 5 triệu đô la để đào tạo, so với 100 triệu đô la của TATGPT4.

Trò chơi thịnh hành