Hogar News > OpenAI acusa a la inicio de AI chino del robo de datos

OpenAI acusa a la inicio de AI chino del robo de datos

by Savannah Feb 21,2025

Operai sospecha que Deepseek, un modelo de IA chino significativamente más barato que las contrapartes occidentales, puede haber sido entrenado utilizando los datos de OpenAI. Esta revelación, siguiendo las pérdidas sustanciales de valor de mercado experimentadas por NVIDIA y otras empresas relacionadas con la IA, ha provocado preocupaciones dentro de la industria tecnológica de los Estados Unidos. El presidente Trump incluso se refirió a Deepseek como una "llamada de atención".

El modelo R1 de Deepseek, basado en el Deepseek-V3 de código abierto, cuenta con costos de capacitación significativamente más bajos (estimados en $ 6 millones) en comparación con los modelos occidentales. Si bien este reclamo ha sido disputado, ha alimentado las ansiedades de los inversores con respecto a las inversiones masivas en IA por parte de los gigantes tecnológicos estadounidenses. La popularidad de Deepseek, evidenciada por su mejor rango en la aplicación de la aplicación de EE. UU., Los cuadros de descarga, subraya aún más esta preocupación.

Operai y Microsoft ahora están investigando si Deepseek violó los términos de servicio de OpenAi empleando "destilación", una técnica que involucra la extracción de datos de modelos más grandes, para integrar los modelos de IA de OpenAI en su cuenta. Operai ha confirmado su conciencia de tales intentos de los chinos y otras compañías de replicar los principales modelos de IA de EE. UU. Y está buscando activamente contramedidas, incluida la colaboración con el gobierno de los Estados Unidos para proteger su propiedad intelectual.

David Sacks, el zar Ai del presidente Trump, corroboró las sospechas de OpenAi, lo que sugiere que la evidencia apunta hacia el uso de la destilación de Deepseek. Anticipa más acciones de liderar a las compañías de IA para evitar incidentes similares.

Esta situación destaca la ironía de las acusaciones de OpenAi, dadas las controversias anteriores que rodean su propio uso de datos de Internet con derechos de autor en el desarrollo de ChatGPT. Los críticos, como Ed Zitron, han señalado esta hipocresía, haciendo referencia a la justificación anterior de OpenAI para usar material con derechos de autor en su proceso de entrenamiento, alegando que era "imposible" crear modelos de IA como ChatGPT sin él. Esta postura fue reiterada en una sumisión a la Cámara de los Lores del Reino Unido y cuenta con el apoyo de la defensa de OpenAI contra la demanda del New York Times alegando el uso ilegal de material con derechos de autor. Esta demanda sigue una similar presentada por 17 autores, incluido George R. R. Martin. El paisaje legal que rodea los datos de capacitación y los derechos de autor de la IA sigue siendo complejo, particularmente a la luz de una decisión de la Oficina de Derechos de Autor de los Estados Unidos de 2018 de que el arte generado por IA no es con derechos de autor.

Deepseek está acusado de usar el modelo de OpenAI para capacitar a su competidor utilizando la destilación. Crédito de la imagen: Andrey Rudakov/Bloomberg a través de Getty Images.

Últimas aplicaciones