Red Hot Cyber
La cybersecurity è condivisione. Riconosci il rischio, combattilo, condividi le tue esperienze ed incentiva gli altri a fare meglio di te.
Cerca

RoboCat di DeepMind: il robot che impara da solo

Alessia Tomaselli : 27 Giugno 2023 07:22

I robot stanno rapidamente entrando nella nostra cultura, ma le loro capacità sono in genere limitate. Nonostante i potenziali vantaggi derivanti dai recenti progressi dell’intelligenza artificiale nella progettazione dei robot, lo sviluppo di robot generici prosegue in maniera lenta.

Lo sviluppo di robot con la capacità di apprendere più compiti contemporaneamente e di integrare la comprensione dei modelli linguistici con le capacità pratiche è un’area che è stata oggetto di studi approfonditi.

Un robot unico nel suo genere

RoboCat di DeepMind è il primo agente in grado di risolvere e adattarsi a vari compiti su diversi tipi di robot reali. I risultati dimostrano che RoboCat apprende molto più rapidamente di altri modelli all’avanguardia.

FINO AL 31 DICEMBRE, sconti estremi sui corsi Red Hot Cyber

Affrettati!

Fino al 31 dicembre potrai acquistare a prezzi scontati i nostri corsi cliccando sui seguenti coupon:

  • NIS2 : Network and Information system 2 scontato del 25%
  • Dark Web & Cyber Threat Intelligence scontato del 50%

  • Per ulteriori informazioni, scrivi a [email protected] oppure su Whatsapp al 379 163 8765


    Supporta RHC attraverso:


    Ti piacciono gli articoli di Red Hot Cyber? Non aspettare oltre, iscriviti alla newsletter settimanale per non perdere nessun articolo.

    Poiché apprende da un insieme di dati così vasto e vario, può acquisire una nuova abilità con appena 100 dimostrazioni. Questa capacità è fondamentale per lo sviluppo di un robot multifunzionale e accelererà la ricerca robotica riducendo i requisiti di addestramento con supervisione umana.

    RoboCat di DeepMind

    Come viene “addestrato” RoboCat?

    Il modello multimodale Gato (in spagnolo “gatto”) è alla base di RoboCat, in quanto è in grado di elaborare parole, immagini e azioni in ambienti virtuali e reali. DeepMind ha fondato la struttura di Gato con un enorme set di dati di addestramento contenente i dati visivi e di movimento di centinaia di bracci robotici che svolgono lavori diversi.

    Dopo questa fase iniziale di addestramento, il team ha sottoposto RoboCat a un ciclo di addestramento di “auto-miglioramento” con una nuova serie di attività. Le cinque fasi di apprendimento sono:

    • Raccogliere da cento a mille esempi di un nuovo compito o di un robot che viene mostrato con un braccio robotico controllato dall’uomo;
    • Messa a punto di RoboCat per il nuovo compito/braccio, al fine di produrre un agente con capacità specializzate;
    • L’agente figlio esegue 10.000 ripetizioni di pratica sul nuovo compito/braccio, aggiungendo al pool di dati di addestramento;
    • Miscelare i dati del campione con le creazioni dell’utente e i dati della dimostrazione nell’attuale set di dati di RoboCat;
    • Riaddestramento di RoboCat utilizzando il set di dati aggiornato.

    L’ultima versione di RoboCat si basa su un set di dati contenente milioni di bracci robotici reali e simulati, oltre a dati creati dal sistema stesso. I dati basati sulla visione che descrive i lavori che RoboCat eseguirà sono stati raccolti utilizzando quattro tipi di robot distinti e molti bracci robotici.

    Cosa può fare RoboCat?

    RoboCat può usare diversi bracci robotici in poche ore. Ha imparato a usare un braccio più complesso, con una pinza a tre dita e un numero doppio di input, nonostante sia stato addestrato con bracci con pinze a due punte.

    RoboCat ha imparato a controllare questo nuovo braccio in modo abbastanza abile da prendere gli ingranaggi nell’86% dei casi dopo aver assistito a 1.000 dimostrazioni a controllo umano raccolte in poche ore. Lo stesso grado di dimostrazione gli ha permesso di imparare a svolgere compiti che richiedevano sia precisione che conoscenza, come scegliere la frutta giusta da una ciotola e risolvere un puzzle di abbinamento di forme.

    L’addestramento di RoboCat funziona nel seguente modo: più impara, più migliora la sua capacità di apprendimento. Il team ha dimostrato che dopo aver appreso da 500 dimostrazioni, la versione originale di RoboCat era solo il 36% più efficace nell’eseguire attività che non aveva mai visto prima. Tuttavia, il RoboCat più recente si è allenato su varie attività e ha ottenuto il doppio dei successi.

    Conclusioni

    Il team ritiene che questo robot aprirà la strada a una nuova generazione di agenti robotici più utili e generici. Questo perché è in grado di apprendere autonomamente e di sviluppare rapidamente le proprie capacità, soprattutto se applicato a più apparecchiature robotiche.

    Alessia Tomaselli
    Laureata in Mediazione Linguistica per le lingue inglese e spagnolo, attualmente lavora come copywriter presso s-mart.biz, società leader nella sicurezza informatica.