DeepSeek, la nuova Intelligenza Artificiale made in China che sta scombussolando il mercato, a detta di OpenAI è stata addestrata da ChatGPT
Mentre si cerca di capire se DeepSeek sia realmente una Intelligenza Artificiale più efficiente e mentre il Garante della Privacy ha chiesto (come fece in maniera più decisa con ChatGPT) informazioni in merito al trattamento dei nostri dati, OpenAI sferra il primo attacco dichiarando di avere delle prove di “distillazione” sospetta che potrebbe indicare come DeekSeek abbia sfruttato ChatGPT per addestrarsi.
Cos’è la distillazione nel campo delle intelligenze artificiali
La distillazione è un metodo di apprendimento usato nel campo delle intelligenze artificiali grazie al quale un nuovo modello impara da uno più grande e più avanzato replicandone il comportamento.
Essa prevede che il modello “affermato” venga configurato come insegnante mentre quello nuovo come studente iniziando a sua volta a fare domande a raffica che permettono allo studente di apprendere e di conseguenza addestrarsi nelle risposte a domande similari.
Secondo OpenAI negli ultimi anni erano stati chiusi diversi account con IP cinese sospettati di compiere attività sospette, ma i modelli IA finora giunti alla ribalta non mostravano segni evidenti di distillazione, questo fino all’arrivo di DeepSeek.
E’ inoltre possibile che ChatGPT non sia stato l’unico modello preso a ruolo di insegnante, ma è da capire se tali accuse porteranno ad azioni più concrete oppure no.
Del resto sembra anche paradossale che proprio OpenAI, fin dagli albori sotto accusa in merito al suo approccio verso la proprietà intellettuale altrui, ora punti il dito verso qualcuno accusato di aver fatto un qualcosa di vagamente similare.
DeepSeek non è comunque ChatGPT
Questo comunque non significa che DeepSeek sia una copia esatta di ChatGPT, perché è verificato ormai come il suo algoritmo lavori in maniera molto differente (e se vogliamo anche in maniera più raffinata) quando deve interfacciarsi con NVIDIA per sfruttarne le GPU: mentre ChatGPT e altri sfruttano CUDA per una questione di semplificazione della programmazione delle GPU, DeepSeek sfrutta un linguaggio di programmazione più a basso livello che permetterebbe quindi di ottenere delle ottimizzazioni.
Se questo permetta poi di sfruttare delle vecchie GPU Nvidia H800 invece è da appurare.