Lar News > Openai acusa a startup chinesa de IA de roubo de dados

Openai acusa a startup chinesa de IA de roubo de dados

by Savannah Feb 21,2025

Openai suspeita que a Deepseek, um modelo de IA chinês significativamente mais barato que os colegas ocidentais, pode ter sido treinado usando os dados do OpenAI. Essa revelação, após as perdas substanciais de valor de mercado experimentadas pela NVIDIA e outras empresas relacionadas à IA, provocou preocupações no setor de tecnologia dos EUA. O presidente Trump até se referiu a Deepseek como um "alerta".

O modelo R1 da Deepseek, construído sobre o Deepseek-V3 de código aberto, possui custos de treinamento significativamente mais baixos (estimados em US $ 6 milhões) em comparação com os modelos ocidentais. Embora essa reivindicação tenha sido contestada, alimentou as ansiedades dos investidores em relação aos investimentos maciços na IA pelos gigantes da tecnologia americana. A popularidade da Deepseek, evidenciada pelo seu principal ranking em gráficos de download de aplicativos dos EUA, ressalta ainda essa preocupação.

O OpenAI e a Microsoft estão agora investigando se a Deepseek violou os termos de serviço da Openai, empregando "destilação", uma técnica que envolve a extração de dados de modelos maiores, para integrar os modelos de IA do OpenAI. A OpenAI confirmou sua conscientização sobre tais tentativas de chineses e outras empresas de replicar os modelos de IA nos EUA e está buscando ativamente contramedidas, incluindo a colaboração com o governo dos EUA para proteger sua propriedade intelectual.

David Sacks, czar da AI do presidente Trump, corroborou as suspeitas do Openai, sugerindo que as evidências apontam para o uso da destilação de Deepseek. Ele antecipa outras ações de liderar as empresas de IA para evitar incidentes semelhantes.

Esta situação destaca a ironia das acusações do OpenAI, dadas as controvérsias anteriores em torno de seu próprio uso de dados da Internet protegidos por direitos autorais no desenvolvimento do ChatGPT. Os críticos, como Ed Zitron, apontaram essa hipocrisia, referenciando a justificativa anterior do Openai para o uso de material protegido por direitos autorais em seu processo de treinamento, alegando que era "impossível" criar modelos de IA como ChatGPT sem ele. Essa postura foi reiterada em uma submissão à Câmara dos Lordes do Reino Unido e é apoiada pela defesa da Openai contra o processo do New York Times, alegando uso ilegal de material protegido por direitos autorais. Este processo segue um semelhante apresentado por 17 autores, incluindo George R. R. Martin. O cenário legal em torno dos dados de treinamento da IA ​​e direitos autorais permanece complexos, particularmente à luz de um escritório de direitos autorais dos EUA em 2018, que decidiu que a arte gerada pela IA não é por direitos autorais.

Deepseek é acusado de usar o modelo do OpenAI para treinar seu concorrente usando a destilação. Crédito da imagem: Andrey Rudakov/Bloomberg via Getty Images.

Jogos populares