Negli ultimi giorni, il panorama dell'intelligenza artificiale ha visto diverse novità interessanti: Perplexity ha lanciato un assistente per dispositivi Android, mentre l'agente AI Operator di OpenAI è in grado di navigare online per svolgere compiti su richiesta. Meta punta a rafforzare la sua presenza nell’AI con un enorme data center, e Google Gemini ora interagisce in modo più intelligente con i dispositivi delle smart home. Ognuno di questi sviluppi sarebbe rilevante di per sé, ma insieme rappresentano un quadro ancora più significativo. Tuttavia, non sono gli unici protagonisti.
DeepSeek, un’intelligenza artificiale poco nota proveniente dalla Cina, ha attirato l’attenzione grazie a risultati straordinari che incidono su parametri chiave come i costi di addestramento, la disponibilità di hardware, la capacità e l’accessibilità. Questa realtà emergente ha messo in allarme colossi come OpenAI, Perplexity, Google, Meta e Nvidia, ribadendo che non c’è spazio per pause o rilassamenti, nemmeno per le principali aziende della Silicon Valley. A complicare ulteriormente la competizione, un'altra azienda cinese, Moonshot AI, ha introdotto un chatbot chiamato Kimi Chat, che si dice possa competere con l’ultima generazione di modelli linguistici di OpenAI.
DeepSeek si distingue per un approccio straordinariamente economico: l'addestramento del suo modello V3 è costato solo 5,5 milioni di dollari, una cifra minima rispetto alle centinaia di milioni spese da giganti come Google e OpenAI per ottenere risultati comparabili. Secondo le informazioni tecniche condivise dall’azienda, il modello è stato addestrato su una combinazione di GPU Nvidia A100 e H100, dimostrando una gestione parsimoniosa delle risorse hardware.
Il CEO di DeepSeek, Liang Wenfeng, un miliardario attivo nel settore degli hedge fund, è il principale finanziatore dell’azienda. DeepSeek ha inoltre reclutato esperti di primo piano da altre importanti realtà tecnologiche cinesi, come ByteDance e Tencent, consolidando così una squadra altamente qualificata.
Il tema centrale della censura emerge chiaramente nell'interazione con il chatbot di DeepSeek quando si tratta di informazioni relative alla Cina. Inizialmente, il chatbot non ha esitato a rispondere a domande sui diritti umani, menzionando questioni come il trattamento dei musulmani uiguri nello Xinjiang, la censura su Internet, il divario tra aree urbane e rurali, le complessità del mercato immobiliare e l'invecchiamento della popolazione, tutti argomenti controversi e sfide significative per il paese.
Tuttavia, poco dopo aver fornito queste risposte dettagliate, l'intero contenuto è stato cancellato e sostituito da un messaggio stringato: "Mi dispiace, questo va oltre il mio attuale ambito. Parliamo di qualcos'altro". Questo tipo di reazione non era mai emersa con altre domande prima di quel momento.
Quando si è cercato di approfondire il tema del trattamento degli uiguri nello Xinjiang, la situazione si è ripetuta: la risposta completa è stata eliminata e sostituita dal medesimo messaggio evasivo.
D'altro canto, le domande sulle difficoltà economiche della Cina, citate brevemente nella risposta originale poi rimossa, non sono state soggette allo stesso filtro. Il chatbot ha elencato problematiche come il rallentamento della crescita economica, la crisi immobiliare, la disoccupazione giovanile e l'elevato livello di debito senza alcuna censura. Allo stesso modo, non sono stati applicati filtri a risposte riguardanti sfide economiche e sociali affrontate da altre nazioni, come l'India e gli Stati Uniti.
L’azienda cinese DeepSeek opera nel settore dell’intelligenza artificiale da tempo, ma fino a poco fa è passata inosservata o ha suscitato scarso interesse. Nel 2023 ha lanciato il DeepSeek Coder e, nel corso del 2024, ha ampliato il suo portfolio con innovazioni significative: il DeepSeek LLM da 67 miliardi di parametri, il DeepSeek V2, una versione avanzata del DeepSeek Coder V2 con 236 miliardi di parametri, il DeepSeek V3 da 671 miliardi di parametri e i modelli R1 da 32 e 70 miliardi di parametri.
"Un risultato degno di una barzelletta", è stato il commento di Andrej Karpathy, fondatore di EurekaLabsAI. Ma non tutti sono così critici. Marc Benioff, CEO di Salesforce, ha scritto in un post su X: "DeepSeek è al primo posto sull'App Store, superando ChatGPT, senza aver bisogno di supercomputer NVIDIA o di investimenti da 100 milioni di dollari. Il vero valore dell’IA non è nell’interfaccia o nei modelli, ormai standardizzati. Il tesoro è nei dati e nei metadati, la linfa vitale che alimenta l’IA."
DeepSeek sta trasformando l’economia dell’intelligenza artificiale. La sua API R1 costa appena $0,55 per milione di token di input e $2,19 per milione di token di output, cifre drasticamente inferiori ai $15 e $60 richiesti da OpenAI per gli stessi servizi. Questo abbattimento dei costi rende l’IA accessibile a consumatori, piccole imprese e sviluppatori.
R1 utilizza un approccio simile al modello o1 di OpenAI, basato sull’apprendimento rinforzato (RL), che consente ai modelli di migliorare continuamente tramite feedback e ricompense algoritmiche. Questo metodo, che imita l’apprendimento umano per tentativi ed errori, sviluppa capacità di ragionamento. Tuttavia, DeepSeek ha introdotto miglioramenti significativi: