Casa News > Openai accusa l'avvio cinese AI di furto di dati

Openai accusa l'avvio cinese AI di furto di dati

by Savannah Feb 21,2025

Openai sospetta che DeepSeek, un modello di intelligenza artificiale cinese significativamente più economico delle controparti occidentali, potrebbe essere stato addestrato utilizzando i dati di Openi. Questa rivelazione, a seguito delle sostanziali perdite di valore di mercato subite da NVIDIA e altre società legate all'IA, ha suscitato preoccupazioni nel settore tecnologico statunitense. Il presidente Trump si riferiva persino a DeepSeek come una "sveglia".

Il modello R1 di DeepSeek, basato sull'apertura open source Deepseek-V3, vanta costi di allenamento significativamente più bassi (stimati a $ 6 milioni) rispetto ai modelli occidentali. Sebbene questa affermazione sia stata contestata, ha alimentato le ansie degli investitori in merito agli enormi investimenti nell'intelligenza artificiale da parte dei giganti della tecnologia americana. La popolarità di DeepSeek, evidenziata dalla sua classifica in alto sulle classifiche di download delle app statunitensi, sottolinea ulteriormente questa preoccupazione.

Openai e Microsoft stanno ora studiando se DeepSeek abbia violato i termini di servizio di Openi impiegando "distillazione", una tecnica che prevede l'estrazione di dati da modelli più grandi, per integrare i modelli AI di Openai nei suoi. Openai ha confermato la sua consapevolezza di tali tentativi da parte dei cinesi e di altre società di replicare i principali modelli di intelligenza artificiale statunitense e sta perseguendo attivamente contromisure, compresa la collaborazione con il governo degli Stati Uniti per proteggere la sua proprietà intellettuale.

David Sacks, lo zar AI del presidente Trump, ha confermato i sospetti di Openi, suggerendo che prove indicano l'uso della distillazione da parte di Deepseek. Prevede ulteriori azioni delle principali società di intelligenza artificiale per prevenire incidenti simili.

Questa situazione evidenzia l'ironia delle accuse di Openi, date precedenti controversie relative al proprio uso di dati su Internet protetti da copyright nello sviluppo di CHATGPT. I critici, come Ed Zitron, hanno sottolineato questa ipocrisia, facendo riferimento alla precedente giustificazione di Openi per l'utilizzo di materiale protetto da copyright nel suo processo di formazione, sostenendo che era "impossibile" creare modelli di intelligenza artificiale come CHATGPT senza di essa. Questa posizione è stata ribadita in una sottomissione alla House of Lords del Regno Unito ed è ulteriormente supportata dalla difesa di Openi contro la causa del New York Times, sostenendo l'uso illegale di materiale protetto da copyright. Questa causa segue una simile presentata da 17 autori, tra cui George R. R. Martin. Il panorama legale che circonda i dati di addestramento dell'IA e il copyright rimane complesso, in particolare alla luce di una sentenza dell'ufficio del copyright degli Stati Uniti del 2018 che l'arte generata dall'AI non è protetta da copyright.

DeepSeek è accusato di usare il modello di Openi per addestrare il proprio concorrente usando la distillazione. Credito immagine: Andrey Rudakov/Bloomberg tramite Getty Images.

App più recenti
Giochi di tendenza