27 Jan, 2025 - 09:49

DeepSeek-R1: l'Intelligenza Artificiale cinese con censura incorporata

DeepSeek-R1: l'Intelligenza Artificiale cinese con censura incorporata

Negli ultimi giorni, il panorama dell'intelligenza artificiale ha visto diverse novità interessanti: Perplexity ha lanciato un assistente per dispositivi Android, mentre l'agente AI Operator di OpenAI è in grado di navigare online per svolgere compiti su richiesta. Meta punta a rafforzare la sua presenza nell’AI con un enorme data center, e Google Gemini ora interagisce in modo più intelligente con i dispositivi delle smart home. Ognuno di questi sviluppi sarebbe rilevante di per sé, ma insieme rappresentano un quadro ancora più significativo. Tuttavia, non sono gli unici protagonisti.

Cos'è DeepSeek-R1?

DeepSeek, un’intelligenza artificiale poco nota proveniente dalla Cina, ha attirato l’attenzione grazie a risultati straordinari che incidono su parametri chiave come i costi di addestramento, la disponibilità di hardware, la capacità e l’accessibilità. Questa realtà emergente ha messo in allarme colossi come OpenAI, Perplexity, Google, Meta e Nvidia, ribadendo che non c’è spazio per pause o rilassamenti, nemmeno per le principali aziende della Silicon Valley. A complicare ulteriormente la competizione, un'altra azienda cinese, Moonshot AI, ha introdotto un chatbot chiamato Kimi Chat, che si dice possa competere con l’ultima generazione di modelli linguistici di OpenAI.

DeepSeek si distingue per un approccio straordinariamente economico: l'addestramento del suo modello V3 è costato solo 5,5 milioni di dollari, una cifra minima rispetto alle centinaia di milioni spese da giganti come Google e OpenAI per ottenere risultati comparabili. Secondo le informazioni tecniche condivise dall’azienda, il modello è stato addestrato su una combinazione di GPU Nvidia A100 e H100, dimostrando una gestione parsimoniosa delle risorse hardware.

Il CEO di DeepSeek, Liang Wenfeng, un miliardario attivo nel settore degli hedge fund, è il principale finanziatore dell’azienda. DeepSeek ha inoltre reclutato esperti di primo piano da altre importanti realtà tecnologiche cinesi, come ByteDance e Tencent, consolidando così una squadra altamente qualificata.

La censura sui temi "scomodi" della Cina

Il tema centrale della censura emerge chiaramente nell'interazione con il chatbot di DeepSeek quando si tratta di informazioni relative alla Cina. Inizialmente, il chatbot non ha esitato a rispondere a domande sui diritti umani, menzionando questioni come il trattamento dei musulmani uiguri nello Xinjiang, la censura su Internet, il divario tra aree urbane e rurali, le complessità del mercato immobiliare e l'invecchiamento della popolazione, tutti argomenti controversi e sfide significative per il paese.

Tuttavia, poco dopo aver fornito queste risposte dettagliate, l'intero contenuto è stato cancellato e sostituito da un messaggio stringato: "Mi dispiace, questo va oltre il mio attuale ambito. Parliamo di qualcos'altro". Questo tipo di reazione non era mai emersa con altre domande prima di quel momento.

Quando si è cercato di approfondire il tema del trattamento degli uiguri nello Xinjiang, la situazione si è ripetuta: la risposta completa è stata eliminata e sostituita dal medesimo messaggio evasivo.

D'altro canto, le domande sulle difficoltà economiche della Cina, citate brevemente nella risposta originale poi rimossa, non sono state soggette allo stesso filtro. Il chatbot ha elencato problematiche come il rallentamento della crescita economica, la crisi immobiliare, la disoccupazione giovanile e l'elevato livello di debito senza alcuna censura. Allo stesso modo, non sono stati applicati filtri a risposte riguardanti sfide economiche e sociali affrontate da altre nazioni, come l'India e gli Stati Uniti.

DeepSeek, un successo a basso costo

L’azienda cinese DeepSeek opera nel settore dell’intelligenza artificiale da tempo, ma fino a poco fa è passata inosservata o ha suscitato scarso interesse. Nel 2023 ha lanciato il DeepSeek Coder e, nel corso del 2024, ha ampliato il suo portfolio con innovazioni significative: il DeepSeek LLM da 67 miliardi di parametri, il DeepSeek V2, una versione avanzata del DeepSeek Coder V2 con 236 miliardi di parametri, il DeepSeek V3 da 671 miliardi di parametri e i modelli R1 da 32 e 70 miliardi di parametri.

"Un risultato degno di una barzelletta", è stato il commento di Andrej Karpathy, fondatore di EurekaLabsAI. Ma non tutti sono così critici. Marc Benioff, CEO di Salesforce, ha scritto in un post su X: "DeepSeek è al primo posto sull'App Store, superando ChatGPT, senza aver bisogno di supercomputer NVIDIA o di investimenti da 100 milioni di dollari. Il vero valore dell’IA non è nell’interfaccia o nei modelli, ormai standardizzati. Il tesoro è nei dati e nei metadati, la linfa vitale che alimenta l’IA."

DeepSeek sta trasformando l’economia dell’intelligenza artificiale. La sua API R1 costa appena $0,55 per milione di token di input e $2,19 per milione di token di output, cifre drasticamente inferiori ai $15 e $60 richiesti da OpenAI per gli stessi servizi. Questo abbattimento dei costi rende l’IA accessibile a consumatori, piccole imprese e sviluppatori.

R1 utilizza un approccio simile al modello o1 di OpenAI, basato sull’apprendimento rinforzato (RL), che consente ai modelli di migliorare continuamente tramite feedback e ricompense algoritmiche. Questo metodo, che imita l’apprendimento umano per tentativi ed errori, sviluppa capacità di ragionamento. Tuttavia, DeepSeek ha introdotto miglioramenti significativi:

  • Compressione dei dati: l’approccio riduce la complessità numerica da 32 a 8 cifre decimali, mantenendo un livello di precisione superiore a GPT-4 e Claude, con una riduzione della memoria necessaria fino al 75%.
  • Sistema multi-token: anziché elaborare i token uno alla volta, il sistema analizza frasi e gruppi di parole simultaneamente, raddoppiando la velocità di risposta.

Il controllo del governo sull'AI

DeepSeek, Moonshot AI e altre aziende tecnologiche cinesi devono affrontare un crescente clima di apprensione, soprattutto in relazione alla loro potenziale connessione, dichiarata o meno, con il governo cinese. La questione della fiducia è particolarmente critica quando si parla di condivisione di dati, siano essi informazioni apparentemente innocue degli utenti o dati sensibili utilizzati da piccole aziende per sfruttare assistenti AI.

Un’altra preoccupazione significativa riguarda l’accesso di queste aziende alle GPU e ai chip AI di ultima generazione. Le restrizioni commerciali imposte dagli Stati Uniti non possono essere ignorate, ma non sembrano aver bloccato completamente il progresso tecnologico. Dylan Patel di SemiAnalysis stima che DeepSeek disponga di circa 50.000 GPU Nvidia, una cifra ben superiore alle 10.000 ipotizzate da alcune indiscrezioni.

Le GPU Nvidia A100, lanciate nel 2020 a circa $16.000 l’una, e le H100, introdotte nel 2022 con un costo di circa $30.000, non rappresentano il top di gamma rispetto a ciò che è disponibile per le aziende della Silicon Valley. Resta il mistero su come DeepSeek abbia acquisito questo quantitativo di hardware e su quante unità siano effettivamente in uso. L’azienda, tuttavia, ha confermato ufficialmente di aver utilizzato 2048 GPU H800 per l’addestramento del modello DeepSeek V3, ma non ha rivelato ulteriori dettagli. Rimane dunque difficile determinare il vero costo di produzione di R1 e dei suoi predecessori.

Le restrizioni commerciali tra Stati Uniti e Cina hanno limitato l’accesso delle aziende cinesi a hardware avanzato prodotto da colossi come Nvidia, Qualcomm e Intel. Tuttavia, aziende come Huawei hanno dimostrato la capacità di adattarsi. Dopo essere stata inserita nella lista nera, Huawei ha affrontato ostacoli nella vendita di smartphone, ma ha reagito con innovazioni significative. Tra queste, l’introduzione del sistema operativo Harmony OS come alternativa ad Android, il lancio dello smartphone tri-fold Mate XT Ultimate Design, la costruzione di un centro di ricerca da 1,4 miliardi di dollari a Shanghai e la fornitura di chip AI alle aziende tecnologiche cinesi. Questi sviluppi mostrano come le restrizioni non abbiano bloccato completamente la crescita tecnologica del paese.

Immagine di copertina: Depositphotos.com

 
AUTORE
foto autore
Daniel Moretti
condividi sui social
condividi su facebook condividi su x condividi su linkedin condividi su whatsapp
ARTICOLI RECENTI
LEGGI ANCHE