Red Hot Cyber, il blog italiano sulla sicurezza informatica
Red Hot Cyber
La cybersecurity è condivisione. Riconosci il rischio, combattilo, condividi le tue esperienze ed incentiva gli altri a fare meglio di te.
Cerca

Lo Tsunami DeepSeek ha Colpito nel Segno: Una AI Più Democratica Bussa Alle Porte

Redazione RHC : 1 Febbraio 2025 09:28

La scorsa settimana, la società cinese DeepSeek ha rilasciato R1, il suo nuovo modello linguistico, scatenando un’ondata di reazioni nel settore dell’intelligenza artificiale. Non solo R1 è paragonabile ai migliori modelli occidentali, ma è stato sviluppato a una frazione del costo.

Anche se ancora oggi molti mettono in dubbio queste informazioni, va da se che DeepSeek è stato uno tsunami nel mondo dell’Intelligenza generativa e il suo modello Open Source ha sconvolto decisamente gli equilibri e le regole del gioco.

DeepSeek ha scelto di renderlo completamente gratuito e open-source, provocando un terremoto nel panorama tecnologico globale.

Il crollo del mercato e le reazioni negli Stati Uniti

Vuoi diventare un esperto del Dark Web e della Cyber Threat Intelligence (CTI)?
Stiamo per avviare il corso intermedio in modalità "Live Class", previsto per febbraio.
A differenza dei corsi in e-learning, disponibili online sulla nostra piattaforma con lezioni pre-registrate, i corsi in Live Class offrono un’esperienza formativa interattiva e coinvolgente.
Condotti dal professor Pietro Melillo, le lezioni si svolgono online in tempo reale, permettendo ai partecipanti di interagire direttamente con il docente e approfondire i contenuti in modo personalizzato. Questi corsi, ideali per aziende, consentono di sviluppare competenze mirate, affrontare casi pratici e personalizzare il percorso formativo in base alle esigenze specifiche del team, garantendo un apprendimento efficace e immediatamente applicabile.
Non perdere i nostri corsi e scrivi subito su WhatsApp al numero
379 163 8765  per richiedere informazioni
"

Supporta RHC attraverso:


Ti piacciono gli articoli di Red Hot Cyber? Non aspettare oltre, iscriviti alla newsletter settimanale per non perdere nessun articolo.

La risposta non si è fatta attendere. Il mercato azionario statunitense ha bruciato 1 trilione di dollari, gli investitori si sono lanciati in previsioni catastrofiche e persino Donald Trump ha definito l’evento un campanello d’allarme per gli Stati Uniti.

Marc Andreessen, uno dei più influenti venture capitalist della Silicon Valley, ha dichiarato: “R1 è una delle innovazioni più sorprendenti e impressionanti, un vero dono per il mondo.”

Ma il vero impatto di DeepSeek non risiede solo nel modello. Rilasciando pubblicamente i dettagli del suo processo di sviluppo, l’azienda ha sfatato il mito che la creazione di IA avanzate richieda investimenti miliardari. Questo ha costretto i competitor a una reazione immediata:

  • Alibaba ha annunciato una nuova versione del suo modello Qwen.
  • AI2, laboratorio di ricerca americano, ha aggiornato Tulu, sostenendo che ora superi R1.
  • OpenAI ha lanciato in tutta fretta ChatGPT Gov, una versione del chatbot per le agenzie governative statunitensi, segnale chiaro della crescente preoccupazione per le tecnologie cinesi.

Come Apprendono normalmente i modelli linguistici

Per capire la portata della svolta, bisogna comprendere il processo di sviluppo delle IA che generalmente avviene in due fasei:

  1. Pre-formazione : La rete neurale viene alimentata con enormi quantità di dati (libri, codice, pagine web) per creare un modello base.
  2. Post-formazione : Il modello viene ottimizzato con due metodi principali:
    • Ottimizzazione supervisionata: esseri umani valutano e migliorano le risposte.
    • Apprendimento per rinforzo con feedback umano (RLHF): il modello impara attraverso giudizi umani.

OpenAI è stata la prima a implementare RLHF, rendendo i suoi modelli più intuitivi. Oggi, quasi tutte le aziende lo adottano.

Il segreto di DeepSeek: meno esseri umani, più automazione

DeepSeek ha tagliato i costi in modo drastico eliminando gran parte del lavoro umano. Invece di affidarsi a valutatori umani costosi, ha sviluppato un sistema automatizzato in cui il computer stesso giudica e migliora le risposte.

  • Vantaggio: Risparmio di milioni di dollari.
  • Limite: Le macchine eccellono in materie esatte (matematica, programmazione) ma faticano con domande creative o filosofiche.

Per la messa a punto finale, DeepSeek ha comunque coinvolto specialisti umani, ma grazie ai bassi costi della manodopera in Cina e all’abbondanza di esperti in matematica e ingegneria, ha mantenuto un vantaggio competitivo enorme.

I trucchi ingegneristici che hanno reso R1 così potente

DeepSeek non si è limitata a ottimizzare i costi: ha introdotto innovazioni tecniche chiave che hanno migliorato le prestazioni di R1.

  1. GRPO: un nuovo approccio al rinforzo
    • I modelli IA standard usano un’intelligenza artificiale separata per valutare le risposte.
    • DeepSeek ha eliminato questa dipendenza, facendo in modo che lo stesso modello stimasse la correttezza delle risposte → riduzione dei costi senza perdita di qualità.
  2. Previsione multi-token
    • I modelli tradizionali prevedono il testo parola per parola.
    • DeepSeek ha sviluppato un metodo per analizzare più parole contemporaneamente, migliorando velocità e precisione.
  3. Ottimizzazione delle GPU Nvidia
    • DeepSeek ha riscritto il codice a basso livello per sfruttare al massimo le schede video esistenti, superando i limiti hardware senza acquistare nuovi chip.
  4. Data mining economico
    • Invece di raccogliere manualmente dati matematici per il modello DeepSeekMath, l’azienda ha semplicemente filtrato i dati dal vasto archivio gratuito Common Crawl.

Il futuro dell’IA: cosa succederà ora?

DeepSeek ha innescato una reazione a catena. Microsoft, poco prima del rilascio di R1, ha annunciato rStar-Math, un modello sviluppato con una metodologia simile. Hugging Face sta già lavorando a OpenR1, un clone open-source del modello cinese.

Ma la vera rivoluzione è un’altra: non servono più miliardi di dollari per creare un’IA avanzata. Ora che il metodo di DeepSeek è pubblico, possiamo aspettarci una nuova ondata di intelligenze artificiali di alta qualità, più accessibili e a basso costo.

“Sembrava che l’IA fosse un lusso per pochi colossi tecnologici. DeepSeek ha dimostrato il contrario. Se è davvero così semplice, ci aspetta un vero boom dell’intelligenza artificiale.” ha detto Lewis Tunstall, ricercatore di Hugging Face

L’Occidente è preoccupato: perché?

La rapidità con cui la Cina sta sviluppando l’IA ha messo in allarme governi ed esperti di sicurezza. Se le aziende cinesi riescono a creare modelli avanzati a costi ridotti, ciò potrebbe ribaltare la supremazia tecnologica degli Stati Uniti in settori chiave come economia e difesa.

  • Sanzioni inefficaci → Gli USA hanno vietato l’export di chip Nvidia H100 in Cina, ma DeepSeek ha aggirato il blocco ottimizzando i chip più vecchi.
  • Preoccupazioni per la sicurezza → OpenAI ha lanciato ChatGPT Gov subito dopo R1, segno che Washington teme fughe di dati attraverso i modelli cinesi.
  • IA militare → La Cina investe attivamente in IA per intelligence, guerra informatica e armi autonome.

Conclusione: Una AI Democratica è alle porte?

Nei prossimi mesi vedremo:

  • Nuovi modelli open-source basati su R1, con Hugging Face in prima linea.
  • Risposte aggressive da OpenAI, Google e Anthropic, che potrebbero accelerare il rilascio di GPT-5 e Gemini 3.
  • Regolamentazioni più severe negli USA e UE per arginare l’adozione di IA cinesi.

Ma il punto cruciale è chiaro: DeepSeek ha infranto il monopolio dello sviluppo IA avanzato.

Non è più una tecnologia esclusiva delle élite di Silicon Valley. L’intelligenza artificiale è ora più accessibile che mai, e il mondo della tecnologia non sarà più lo stesso.

Redazione
La redazione di Red Hot Cyber è composta da un insieme di persone fisiche e fonti anonime che collaborano attivamente fornendo informazioni in anteprima e news sulla sicurezza informatica e sull'informatica in generale.