RoboCat di DeepMind: il robot che impara da solo

Alessia Tomaselli : 27 Giugno 2023 07:22

I robot stanno rapidamente entrando nella nostra cultura, ma le loro capacità sono in genere limitate. Nonostante i potenziali vantaggi derivanti dai recenti progressi dell’intelligenza artificiale nella progettazione dei robot, lo sviluppo di robot generici prosegue in maniera lenta.

Lo sviluppo di robot con la capacità di apprendere più compiti contemporaneamente e di integrare la comprensione dei modelli linguistici con le capacità pratiche è un’area che è stata oggetto di studi approfonditi.

Un robot unico nel suo genere

RoboCat di DeepMind è il primo agente in grado di risolvere e adattarsi a vari compiti su diversi tipi di robot reali. I risultati dimostrano che RoboCat apprende molto più rapidamente di altri modelli all’avanguardia.

Distribuisci i nostri corsi di formazione diventando un nostro Affiliato

Se sei un influencer, gestisci una community, un blog, un profilo social o semplicemente hai tanta voglia di diffondere cultura digitale e cybersecurity, questo è il momento perfetto per collaborare con RHC Academy. Unisciti al nostro Affiliate Program: potrai promuovere i nostri corsi online e guadagnare provvigioni ad ogni corso venduto. Fai parte del cambiamento. Diffondi conoscenza, costruisci fiducia, genera valore.

Contattaci tramite WhatsApp al 375 593 1011 per richiedere ulteriori informazioni oppure scriviti alla casella di posta [email protected]

Supporta RHC attraverso:

L'acquisto del fumetto sul Cybersecurity Awareness

Scarica gratuitamente "Dark Mirror", il report sul ransomware di Dark Lab

Ti piacciono gli articoli di Red Hot Cyber? Non aspettare oltre, iscriviti alla newsletter settimanale per non perdere nessun articolo.

Poiché apprende da un insieme di dati così vasto e vario, può acquisire una nuova abilità con appena 100 dimostrazioni. Questa capacità è fondamentale per lo sviluppo di un robot multifunzionale e accelererà la ricerca robotica riducendo i requisiti di addestramento con supervisione umana.

Come viene “addestrato” RoboCat?

Il modello multimodale Gato (in spagnolo “gatto”) è alla base di RoboCat, in quanto è in grado di elaborare parole, immagini e azioni in ambienti virtuali e reali. DeepMind ha fondato la struttura di Gato con un enorme set di dati di addestramento contenente i dati visivi e di movimento di centinaia di bracci robotici che svolgono lavori diversi.

Dopo questa fase iniziale di addestramento, il team ha sottoposto RoboCat a un ciclo di addestramento di “auto-miglioramento” con una nuova serie di attività. Le cinque fasi di apprendimento sono:

Raccogliere da cento a mille esempi di un nuovo compito o di un robot che viene mostrato con un braccio robotico controllato dall’uomo;
Messa a punto di RoboCat per il nuovo compito/braccio, al fine di produrre un agente con capacità specializzate;
L’agente figlio esegue 10.000 ripetizioni di pratica sul nuovo compito/braccio, aggiungendo al pool di dati di addestramento;

Miscelare i dati del campione con le creazioni dell’utente e i dati della dimostrazione nell’attuale set di dati di RoboCat;
Riaddestramento di RoboCat utilizzando il set di dati aggiornato.

L’ultima versione di RoboCat si basa su un set di dati contenente milioni di bracci robotici reali e simulati, oltre a dati creati dal sistema stesso. I dati basati sulla visione che descrive i lavori che RoboCat eseguirà sono stati raccolti utilizzando quattro tipi di robot distinti e molti bracci robotici.

Cosa può fare RoboCat?

RoboCat può usare diversi bracci robotici in poche ore. Ha imparato a usare un braccio più complesso, con una pinza a tre dita e un numero doppio di input, nonostante sia stato addestrato con bracci con pinze a due punte.

RoboCat ha imparato a controllare questo nuovo braccio in modo abbastanza abile da prendere gli ingranaggi nell’86% dei casi dopo aver assistito a 1.000 dimostrazioni a controllo umano raccolte in poche ore. Lo stesso grado di dimostrazione gli ha permesso di imparare a svolgere compiti che richiedevano sia precisione che conoscenza, come scegliere la frutta giusta da una ciotola e risolvere un puzzle di abbinamento di forme.

L’addestramento di RoboCat funziona nel seguente modo: più impara, più migliora la sua capacità di apprendimento. Il team ha dimostrato che dopo aver appreso da 500 dimostrazioni, la versione originale di RoboCat era solo il 36% più efficace nell’eseguire attività che non aveva mai visto prima. Tuttavia, il RoboCat più recente si è allenato su varie attività e ha ottenuto il doppio dei successi.

Conclusioni

Il team ritiene che questo robot aprirà la strada a una nuova generazione di agenti robotici più utili e generici. Questo perché è in grado di apprendere autonomamente e di sviluppare rapidamente le proprie capacità, soprattutto se applicato a più apparecchiature robotiche.

Alessia Tomaselli
Laureata in Mediazione Linguistica per le lingue inglese e spagnolo, attualmente lavora come copywriter presso s-mart.biz, società leader nella sicurezza informatica.

Lista degli articoli

Articoli in evidenza

Vulnerabilità Critica nel Kernel Linux: Una nuova Escalation di Privilegi

È stata scoperta una vulnerabilità critica di tipo double free nel modulo pipapo set del sottosistema NFT del kernel Linux. Un aggressore senza privilegi può sfruttare questa vulne...

RHC intervista Sector16, uno tra i gruppi hacktivisti più attivi del 2025. “L’infrastruttura italiana è la più vulnerabile”

Negli ultimi mesi, due episodi inquietanti hanno scosso l’opinione pubblica e il settore della sicurezza informatica italiana. Il primo ha riguardato un ospedale italiano, violato nel suo cuore...

Exploit RCE 0day per WinRAR e WinZIP in vendita su exploit.in per email di phishing da urlo

In questi giorni, sul noto forum underground exploit.in, attualmente chiuso e accessibile solo su invito – sono stati messi in vendita degli exploit per una vulnerabilità di tipo 0day che ...

Gli Exploit per Citrix Bleed2 sono online! Aggiornare immediatamente, la caccia è iniziata

Il CERT-AgID recentemente aveva avvertito che molte istanze pubbliche non sono ancora state aggiornate e tra queste 70 sono relative a banche, assicurazioni e pubbliche amministrazioni italiane. Ora l...

La suite Shellter Elite utilizzata dai Red Team per il bypass degli EDR, ora viene usata dal cybercrime

Shellter Project, produttore di un downloader commerciale per bypassare i sistemi antivirus ed EDR, ha segnalato che gli hacker stanno utilizzando il suo prodotto Shellter Elite per gli attacchi. Ques...