首頁 News > Openai指責中國人工智能創業公司的數據盜用

Openai指責中國人工智能創業公司的數據盜用

by Savannah Feb 21,2025

Openai懷疑中國人工智能模型比西方同行的DeepSeek可能已經使用OpenAI的數據進行了培訓。在NVIDIA和其他與AI相關的公司遇到的大量市場價值損失之後,這種啟示引起了美國科技行業的關注。特朗普總統甚至將DeepSeek稱為“喚醒電話”。

與西方模型相比,DeepSeek的R1模型建立在開源DeepSeek-V3基於培訓成本(估計為600萬美元)。盡管這一主張已受到爭議,但它激發了投資者對美國科技巨頭對AI大規模投資的焦慮。 DeepSeek在美國應用程序下載圖表上排名最高的人的知名度進一步強調了這一問題。

Openai和Microsoft現在正在調查DeepSeek是否通過采用“蒸餾”來違反OpenAI的服務條款,這是一種涉及從較大模型中提取數據的技術,以將Openai的AI模型集成到其自己中。 Openai已經確認了它對中國和其他公司複製領導美國AI模型的這種嚐試的認識,並正在積極追求對策,包括與美國政府合作保護其知識產權。

特朗普總統的AI沙皇戴維·薩克斯(David Sacks)證實了Openai的懷疑,這表明證據表明DeepSeek使用蒸餾。他預計,領導AI公司的進一步行動可以防止類似事件。

鑒於先前圍繞自己使用受版權保護的互聯網數據在開發ChatGpt時,這種情況凸顯了Openai指控的諷刺意味。像埃德·齊龍(Ed Zitron)一樣,批評家指出了這一虛偽,提到了Openai在其培訓過程中使用受版權保護的材料的早期理由,聲稱沒有它,創建像Chatgpt這樣的AI模型是“不可能的”。在對英國上議院的提交中,重申了這一立場,並得到了Openai對《紐約時報》的訴訟的辯護,並指控非法使用受版權保護的材料。這項訴訟遵循17位作者提起的類似訴訟,其中包括喬治·R·R·馬丁(George R. Martin)。圍繞AI培訓數據和版權的法律景觀仍然是複雜的,尤其是鑒於2018年美國版權辦公室裁定AI生成的藝術是不可版權保護的。

DeepSeek被指控使用OpenAI模型使用蒸餾來訓練其競爭對手。圖片來源:Andrey Rudakov/彭博通過蓋蒂圖像。