Alessia Tomaselli : 27 Giugno 2023 07:22
I robot stanno rapidamente entrando nella nostra cultura, ma le loro capacità sono in genere limitate. Nonostante i potenziali vantaggi derivanti dai recenti progressi dell’intelligenza artificiale nella progettazione dei robot, lo sviluppo di robot generici prosegue in maniera lenta.
Lo sviluppo di robot con la capacità di apprendere più compiti contemporaneamente e di integrare la comprensione dei modelli linguistici con le capacità pratiche è un’area che è stata oggetto di studi approfonditi.
RoboCat di DeepMind è il primo agente in grado di risolvere e adattarsi a vari compiti su diversi tipi di robot reali. I risultati dimostrano che RoboCat apprende molto più rapidamente di altri modelli all’avanguardia.
Sei un Esperto di Formazione?
Entra anche tu nel Partner program!
Accedi alla sezione riservata ai Creator sulla nostra Academy e scopri i vantaggi riservati ai membri del Partner program.
Per ulteriori informazioni, scrivici ad [email protected] oppure su Whatsapp al 379 163 8765
Supporta RHC attraverso:
Poiché apprende da un insieme di dati così vasto e vario, può acquisire una nuova abilità con appena 100 dimostrazioni. Questa capacità è fondamentale per lo sviluppo di un robot multifunzionale e accelererà la ricerca robotica riducendo i requisiti di addestramento con supervisione umana.
Il modello multimodale Gato (in spagnolo “gatto”) è alla base di RoboCat, in quanto è in grado di elaborare parole, immagini e azioni in ambienti virtuali e reali. DeepMind ha fondato la struttura di Gato con un enorme set di dati di addestramento contenente i dati visivi e di movimento di centinaia di bracci robotici che svolgono lavori diversi.
Dopo questa fase iniziale di addestramento, il team ha sottoposto RoboCat a un ciclo di addestramento di “auto-miglioramento” con una nuova serie di attività. Le cinque fasi di apprendimento sono:
L’ultima versione di RoboCat si basa su un set di dati contenente milioni di bracci robotici reali e simulati, oltre a dati creati dal sistema stesso. I dati basati sulla visione che descrive i lavori che RoboCat eseguirà sono stati raccolti utilizzando quattro tipi di robot distinti e molti bracci robotici.
RoboCat può usare diversi bracci robotici in poche ore. Ha imparato a usare un braccio più complesso, con una pinza a tre dita e un numero doppio di input, nonostante sia stato addestrato con bracci con pinze a due punte.
RoboCat ha imparato a controllare questo nuovo braccio in modo abbastanza abile da prendere gli ingranaggi nell’86% dei casi dopo aver assistito a 1.000 dimostrazioni a controllo umano raccolte in poche ore. Lo stesso grado di dimostrazione gli ha permesso di imparare a svolgere compiti che richiedevano sia precisione che conoscenza, come scegliere la frutta giusta da una ciotola e risolvere un puzzle di abbinamento di forme.
L’addestramento di RoboCat funziona nel seguente modo: più impara, più migliora la sua capacità di apprendimento. Il team ha dimostrato che dopo aver appreso da 500 dimostrazioni, la versione originale di RoboCat era solo il 36% più efficace nell’eseguire attività che non aveva mai visto prima. Tuttavia, il RoboCat più recente si è allenato su varie attività e ha ottenuto il doppio dei successi.
Il team ritiene che questo robot aprirà la strada a una nuova generazione di agenti robotici più utili e generici. Questo perché è in grado di apprendere autonomamente e di sviluppare rapidamente le proprie capacità, soprattutto se applicato a più apparecchiature robotiche.