Maison News > OpenAI accuse le démarrage de l'IA chinois de vol de données

OpenAI accuse le démarrage de l'IA chinois de vol de données

by Savannah Feb 21,2025

Openai soupçonne que Deepseek, un modèle d'IA chinois nettement moins cher que les homologues occidentaux, peut avoir été formé à l'aide des données d'Openai. Cette révélation, suite aux pertes de valeur marchande substantielles subies par NVIDIA et d'autres sociétés liées à l'IA, a suscité des préoccupations au sein de l'industrie de la technologie américaine. Le président Trump a même qualifié Deepseek de «réveil».

Le modèle R1 de Deepseek, construit sur le open source Deepseek-V3, possède des coûts de formation nettement inférieurs (estimés à 6 millions de dollars) par rapport aux modèles occidentaux. Bien que cette réclamation ait été contestée, elle a alimenté les angoisses des investisseurs concernant les investissements massifs dans l'IA par les géants de la technologie américaine. La popularité de Deepseek, attestée par son premier classement sur les graphiques de téléchargement des applications américaines, souligne encore cette préoccupation.

OpenAI et Microsoft examinent maintenant si Deepseek a violé les conditions d'Openai en utilisant la «distillation», une technique impliquant l'extraction de données de modèles plus grands, pour intégrer les modèles d'IA d'OpenAI dans ses propres besoins. OpenAI a confirmé sa conscience de telles tentatives de chinois et d'autres sociétés de reproduire les modèles d'IA en tête et poursuit activement des contre-mesures, notamment en collaboration avec le gouvernement américain pour protéger sa propriété intellectuelle.

David Sacks, le tsar de l'IA du président Trump, a corroboré les soupçons d'Openai, suggérant des preuves indique l'utilisation de la distillation de Deepseek. Il prévoit d'autres actions de la conduite des sociétés d'IA pour prévenir des incidents similaires.

Cette situation met en évidence l'ironie des accusations d'Openai, compte tenu des controverses précédentes entourant sa propre utilisation des données Internet protégées par le droit d'auteur dans le développement de Chatgpt. Les critiques, comme Ed Zitron, ont souligné cette hypocrisie, faisant référence à la justification antérieure d'Openai pour utiliser du matériel protégé par le droit d'auteur dans son processus de formation, affirmant qu'il était "impossible" de créer des modèles d'IA comme Chatgpt sans lui. Cette position a été réitérée dans une soumission à la Chambre des Lords du Royaume-Uni et est en outre soutenue par la défense d'Openai contre le procès du New York Times alléguant une utilisation illégale de matériel protégé par le droit d'auteur. Ce procès fait suite à un similaire déposé par 17 auteurs, dont George R. R. Martin. Le paysage juridique entourant les données de formation de l'IA et le droit d'auteur reste complexe, en particulier à la lumière d'un bureau de droit d'auteur américain de 2018, la décision de 2018 au Copyright a statué que l'art généré par l'AI n'est pas corrigé.

Deepseek est accusé d'utiliser le modèle d'Openai pour former son concurrent en utilisant la distillation. Crédit d'image: Andrey Rudakov/Bloomberg via Getty Images.

Jeux tendance