首页 News > Openai指责中国人工智能创业公司的数据盗用

Openai指责中国人工智能创业公司的数据盗用

by Savannah Feb 21,2025

Openai怀疑中国人工智能模型比西方同行的DeepSeek可能已经使用OpenAI的数据进行了培训。在NVIDIA和其他与AI相关的公司遇到的大量市场价值损失之后,这种启示引起了美国科技行业的关注。特朗普总统甚至将DeepSeek称为“唤醒电话”。

与西方模型相比,DeepSeek的R1模型建立在开源DeepSeek-V3基于培训成本(估计为600万美元)。尽管这一主张已受到争议,但它激发了投资者对美国科技巨头对AI大规模投资的焦虑。 DeepSeek在美国应用程序下载图表上排名最高的人的知名度进一步强调了这一问题。

Openai和Microsoft现在正在调查DeepSeek是否通过采用“蒸馏”来违反OpenAI的服务条款,这是一种涉及从较大模型中提取数据的技术,以将Openai的AI模型集成到其自己中。 Openai已经确认了它对中国和其他公司复制领导美国AI模型的这种尝试的认识,并正在积极追求对策,包括与美国政府合作保护其知识产权。

特朗普总统的AI沙皇戴维·萨克斯(David Sacks)证实了Openai的怀疑,这表明证据表明DeepSeek使用蒸馏。他预计,领导AI公司的进一步行动可以防止类似事件。

鉴于先前围绕自己使用受版权保护的互联网数据在开发ChatGpt时,这种情况凸显了Openai指控的讽刺意味。像埃德·齐龙(Ed Zitron)一样,批评家指出了这一虚伪,提到了Openai在其培训过程中使用受版权保护的材料的早期理由,声称没有它,创建像Chatgpt这样的AI模型是“不可能的”。在对英国上议院的提交中,重申了这一立场,并得到了Openai对《纽约时报》的诉讼的辩护,并指控非法使用受版权保护的材料。这项诉讼遵循17位作者提起的类似诉讼,其中包括乔治·R·R·马丁(George R. Martin)。围绕AI培训数据和版权的法律景观仍然是复杂的,尤其是鉴于2018年美国版权办公室裁定AI生成的艺术是不可版权保护的。

DeepSeek被指控使用OpenAI模型使用蒸馏来训练其竞争对手。图片来源:Andrey Rudakov/彭博通过盖蒂图像。