Дом News > OpenAI обвиняет китайский запуск кражи данных китайского искусственного интеллекта

OpenAI обвиняет китайский запуск кражи данных китайского искусственного интеллекта

by Savannah Feb 21,2025

Openai подозревает, что Deepseek, китайская модель искусственного интеллекта, значительно дешевле, чем западные коллеги, возможно, была обучена с использованием данных Openai. Это откровение, после существенных потерь рыночной стоимости, с которыми сталкиваются NVIDIA и другие компании, связанные с искусственным интеллектом, вызвало опасения в индустрии технологий США. Президент Трамп даже назвал Deepseek «пробужденным звонком».

Модель Deepseek R1, построенная на открытом исходном коде, Deepseek-V3 может похвастаться значительно более низкими затратами на обучение (оценивается в 6 миллионов долларов США) по сравнению с западными моделями. Хотя это утверждение было оспорено, оно вызвало беспокойство инвесторов относительно массовых инвестиций в ИИ американскими технологическими гигантами. Популярность DeepSeek, о которой свидетельствует его высший рейтинг в диаграммах загрузки приложений США, еще больше подчеркивает эту проблему.

OpenAI и Microsoft в настоящее время расследуют, нарушает ли DeepSeek условия обслуживания Openai, используя «дистилляцию», методику, включающую извлечение данных из более крупных моделей, для интеграции моделей ИИ OpenAI в свои собственные. OpenAI подтвердил свою осведомленность о таких попытках китайских и других компаний воспроизвести ведущие модели ИИ США и активно преследует контрмеры, включая сотрудничество с правительством США для защиты своей интеллектуальной собственности.

Дэвид Сакс, ИИ Царь президента Трампа, подтвердил подозрения Openai, предполагающие, что доказательства указывают на использование Deepseek дистилляции. Он ожидает дальнейших действий от поведения компаний ИИ, чтобы предотвратить аналогичные инциденты.

Эта ситуация подчеркивает иронию обвинений Openai, учитывая предыдущие противоречия, связанные с его собственным использованием защищенных авторским правом интернет -данных при разработке CHATGPT. Критики, такие как Ed Zitron, указали на это лицемерие, ссылаясь на более раннее оправдание Openai для использования защищенных авторским правом материала в процессе обучения, утверждая, что «невозможно» создавать модели ИИ, такие как CHATGPT без него. Эта позиция была подтверждена в представлении в Дом Великобритании Лорда и дополнительно поддерживается защитой Openai от иска New York Times, в котором говорится о незаконном использовании материалов, защищенных авторским правом. Этот иск последовал за аналогичным, поданным 17 авторами, включая Джорджа Р. Р. Мартина. Юридический ландшафт, связанный с данными обучения ИИ и авторским правом, остается сложным, особенно в свете решения авторского права США в 2018 году, что искусство, созданное ИИ, не является авторским правом.

DeepSeek обвиняется в использовании модели Openai для обучения своего конкурента с использованием дистилляции. Кредит изображения: Андрей Рудаков/Блумберг через Getty Images.