บ้าน News > ความสามารถในการจ่ายของ Deepseek เป็นตำนาน: AI ปฏิวัติจริง ๆ แล้วมีค่าใช้จ่าย 1.6 พันล้านเหรียญสหรัฐในการพัฒนา

ความสามารถในการจ่ายของ Deepseek เป็นตำนาน: AI ปฏิวัติจริง ๆ แล้วมีค่าใช้จ่าย 1.6 พันล้านเหรียญสหรัฐในการพัฒนา

by Madison Mar 21,2025

Chatbot ใหม่ของ Deepseek มีการแนะนำที่น่าประทับใจ: "สวัสดีฉันถูกสร้างขึ้นเพื่อให้คุณสามารถถามอะไรก็ได้และรับคำตอบที่อาจทำให้คุณประหลาดใจ" AI นี้ซึ่งเป็นผลิตภัณฑ์ของการเริ่มต้นของจีน Deepseek ได้กลายเป็นผู้เล่นหลักอย่างรวดเร็วแม้จะทำให้ราคาหุ้นของ Nvidia ลดลงอย่างมาก

การทดสอบลึก

ความได้เปรียบในการแข่งขันของ Deepseek อยู่ในสถาปัตยกรรมและวิธีการฝึกอบรมที่เป็นนวัตกรรม เทคโนโลยีที่สำคัญ ได้แก่ :

  • การทำนายแบบมัลติเทน (MTP): แทนที่จะทำนายคำแต่ละคำ MTP คาดการณ์หลายคำพร้อมกันเพิ่มความแม่นยำและประสิทธิภาพ
  • ส่วนผสมของผู้เชี่ยวชาญ (MOE): สถาปัตยกรรมนี้ใช้เครือข่ายประสาทหลายแห่ง (256 ใน Deepseek V3 โดยมีแปดเปิดใช้งานต่อโทเค็น) เร่งการฝึกอบรมและเพิ่มประสิทธิภาพ
  • ความสนใจแฝงหลายหัว (MLA): MLA มุ่งเน้นไปที่ชิ้นส่วนประโยคสำคัญซ้ำ ๆ ลดความเสี่ยงของการมองเห็นข้อมูลที่สำคัญ
deepseek v3

การเรียกร้องครั้งแรกของ Deepseek เกี่ยวกับค่าใช้จ่ายในการฝึกอบรมเพียง $ 6 ล้านสำหรับ Deepseek V3 โดยใช้ GPU เพียง 2048 เท่านั้นที่ถูกท้าทาย Semianalysis เปิดเผยโครงสร้างพื้นฐานที่ครอบคลุมมากขึ้นซึ่งครอบคลุม GPU Nvidia Hopper ประมาณ 50,000 Nvidia (รวมถึง 10,000 H800S, 10,000 H100 และ H20s เพิ่มเติม) กระจายไปทั่วศูนย์ข้อมูลหลายแห่ง สิ่งนี้แปลว่าการลงทุนเซิร์ฟเวอร์ประมาณ 1.6 พันล้านเหรียญสหรัฐและค่าใช้จ่ายในการดำเนินงานประมาณ $ 944 ล้าน

ลึกล้ำ

Deepseek ซึ่งเป็น บริษัท ในเครือของ High-Flyer ซึ่งเป็นกองทุนป้องกันความเสี่ยงของจีนเป็นเจ้าของศูนย์ข้อมูลส่งเสริมการควบคุมและนวัตกรรม ธรรมชาติที่ได้รับการสนับสนุนตนเองช่วยให้การตัดสินใจอย่างรวดเร็ว นอกจากนี้ บริษัท ยังดึงดูดความสามารถสูงสุดโดยนักวิจัยบางคนมีรายได้มากกว่า 1.3 ล้านเหรียญสหรัฐต่อปีส่วนใหญ่มาจากมหาวิทยาลัยจีน

ในขณะที่การเรียกร้องค่าใช้จ่ายในการฝึกอบรม $ 6 ล้านของ Deepseek นั้นทำให้เข้าใจผิด (สะท้อนให้เห็นถึงการใช้งาน GPU ก่อนการฝึกอบรมก่อนการวิจัยไม่รวมการวิจัยการปรับแต่งการประมวลผลข้อมูลและโครงสร้างพื้นฐาน) บริษัท ได้ลงทุนกว่า 500 ล้านดอลลาร์ในการพัฒนา AI โครงสร้างแบบลีนช่วยอำนวยความสะดวกในนวัตกรรมที่มีประสิทธิภาพ

ลึกล้ำ

ความสำเร็จของ Deepseek แสดงให้เห็นถึงศักยภาพของ บริษัท AI ที่ได้รับการสนับสนุนและได้รับการสนับสนุนอย่างดีในการแข่งขันกับยักษ์ใหญ่ในอุตสาหกรรม อย่างไรก็ตามความสำเร็จของมันถูกสร้างขึ้นจากการลงทุนที่สำคัญความก้าวหน้าทางเทคนิคและทีมที่แข็งแกร่งทำให้การเล่าเรื่อง "การปฏิวัติงบประมาณ" เป็นเรื่องที่เกินจริง ถึงกระนั้นค่าใช้จ่ายของ Deepseek ยังคงต่ำกว่าคู่แข่งอย่างมีนัยสำคัญ ตัวอย่างเช่นรุ่น R1 ของ Deepseek มีค่าใช้จ่าย 5 ล้านดอลลาร์ในการฝึกอบรมเมื่อเทียบกับ $ 100 ล้านของ ChatGPT4

เกมที่กำลังมาแรง