DeepSeek의 경제성은 신화입니다. 혁명 AI는 실제로 개발하는 데 16 억 달러가 들었습니다.
DeepSeek의 새로운 챗봇은 인상적인 소개를 자랑합니다. "안녕하세요, 나는 당신이 무엇이든 물어보고 당신을 놀라게 할 수있는 답을 얻을 수 있도록 만들어졌습니다." 중국 스타트 업 DeepSeek의 제품인이 AI는 빠르게 주요 선수가되어 Nvidia의 주가가 크게 감소했습니다.

Deepseek의 경쟁 우위는 혁신적인 건축 및 훈련 방법에 있습니다. 주요 기술에는 다음이 포함됩니다.
- MTP (Multi-Token Prediction) : 단어를 개별적으로 예측하는 대신 MTP는 여러 단어를 동시에 예측하여 정확도와 효율성을 높입니다.
- 전문가 (MOE)의 혼합 : 이 아키텍처는 여러 신경망 (Deepseek V3에서 256, 토큰 당 8 개의 활성화 된 활성화)을 사용하여 교육을 가속화하고 성능을 향상시킵니다.
- MLA (Multi-Head Senent Interation) : MLA는 주요 문장 부분에 반복적으로 중점을 두어 중요한 정보를 간과 할 위험을 최소화합니다.

DeepSeek의 초기 청구는 2048 GPU 만 사용하는 DeepSeek V3에 대한 6 백만 달러의 교육 비용에 대한 초기 청구에 도전했습니다. SemiAnalysis는 여러 데이터 센터에 걸쳐 약 50,000 개의 NVIDIA HOPPER GPU (10,000 H800, 10,000 H100 및 추가 H20 포함)를 포함하여 훨씬 더 광범위한 인프라를 보여주었습니다. 이는 약 16 억 달러의 서버 투자와 9 억 9,400 만 달러로 추정되는 운영 비용으로 이어집니다.

중국 헤지 펀드 인 High-Flyer의 자회사 인 Deepseek는 데이터 센터를 소유하여 통제 및 혁신을 장려합니다. 자체 자금을 지원하는 특성은 빠른 의사 결정을 허용합니다. 또한이 회사는 최고의 인재를 유치하며 일부 연구자들은 주로 중국 대학에서 매년 130 만 달러 이상을 벌고 있습니다.
DeepSeek의 6 백만 달러의 교육 비용 청구는 오해의 소지가 있지만 (연구, 개선, 데이터 처리 및 인프라를 제외하고 GPU 사용을 미리 훈련시키는 것만 반영 함) AI 개발에 5 억 달러 이상을 투자했습니다. 린 구조는 효율적인 혁신을 촉진합니다.

Deepseek의 성공은 산업 대기업과 경쟁 할 수있는 잘 자금을 지원하고 독립적 인 AI 회사의 잠재력을 보여줍니다. 그러나 그 성과는 상당한 투자, 기술 발전 및 강력한 팀을 기반으로하여 "혁명 예산"이야기를 지나치게 단순화합니다. 그럼에도 불구하고 DeepSeek의 비용은 경쟁 업체보다 훨씬 저렴합니다. 예를 들어, DeepSeek의 R1 모델은 ChatGPT4의 1 억 달러에 비해 훈련하는 데 5 백만 달러가 들었습니다.
- 1 "Assassin 's Creed Shadows에서 모든 기사단 위치 발견 -Spoiler Guide" Apr 04,2025
- 2 패스 오브 엑자일 2: 세케마스의 시험 가이드 Feb 12,2025
- 3 Polity는 공유 서버에서 온라인 친구들과 상호 작용할 수 있는 새로운 MMORPG입니다. Feb 10,2025
- 4 천상의 수호자 레긴레이프 합류 세븐나이츠 키우기 X 지옥락 콜라보 Jan 16,2025
- 5 Roblox: 1월 25일 최신 불릿 던전 코드 Feb 12,2025
- 6 최고 등급의 Android 게임 콘솔: 종합 가이드 Jan 16,2025
- 7 농구 제로 : 공식 격자 및 불화 링크가 공개되었습니다 Mar 26,2025
- 8 어 ass 신 크리드 그림자 : Max Level과 Rank Cap이 공개되었습니다 Mar 27,2025
-
모바일 용 중독성 아케이드 게임
총 10