Red Hot Cyber
La cybersecurity è condivisione. Riconosci il rischio, combattilo, condividi le tue esperienze ed incentiva gli altri a fare meglio di te.
Cerca

La ricerca 0day verrà potenziata dall’AI? Una nuova ricerca implementa Agenti Bug Hunter coordinati

Redazione RHC : 10 Giugno 2024 10:35

I ricercatori sono stati in grado di hackerare con successo più della metà dei siti web utilizzando dei bot che utilizzavano comandi forniti su GPT-4. Questi bot coordinati creavano nuovi bot a secondo delle loro necessità, sfruttando vulnerabilità zero-day precedentemente sconosciute per hackerare i sistemi.

Alcuni mesi fa, un team di ricercatori ha pubblicato un articolo in cui affermava di essere stato in grado di utilizzare GPT-4 per sfruttare le vulnerabilità di un giorno (N giorni). Queste vulnerabilità sono già note, ma non sono ancora state rilasciate patch per risolverle. Se fossero forniti elenchi CVE, GPT-4 sarebbe in grado di sfruttare in modo indipendente l’87% delle vulnerabilità critiche.

La settimana scorsa, lo stesso gruppo di ricercatori ha pubblicato un documento di follow-up in cui riportavano di essere stati in grado di rilevare vulnerabilità zero-day – che non sono ancora note – utilizzando un team di agenti autonomi basati su modelli linguistici di grandi dimensioni (LLM), utilizzando un metodo di pianificazione gerarchica con agenti che svolgono compiti specifici (HPTSA).

Iscriviti GRATIS ai WorkShop Hands-On della RHC Conference 2025 (Giovedì 8 maggio 2025)

Il giorno giovedì 8 maggio 2025 presso il teatro Italia di Roma (a due passi dalla stazione termini e dalla metro B di Piazza Bologna), si terranno i workshop "hands-on", creati per far avvicinare i ragazzi (o persone di qualsiasi età) alla sicurezza informatica e alla tecnologia. Questo anno i workshop saranno:

  • Creare Un Sistema Ai Di Visual Object Tracking (Hands on)
  • Social Engineering 2.0: Alla Scoperta Delle Minacce DeepFake
  • Doxing Con Langflow: Stiamo Costruendo La Fine Della Privacy?
  • Come Hackerare Un Sito WordPress (Hands on)
  • Il Cyberbullismo Tra Virtuale E Reale
  • Come Entrare Nel Dark Web In Sicurezza (Hands on)

  • Potete iscrivervi gratuitamente all'evento, che è stato creato per poter ispirare i ragazzi verso la sicurezza informatica e la tecnologia.
    Per ulteriori informazioni, scrivi a [email protected] oppure su Whatsapp al 379 163 8765


    Supporta RHC attraverso:


    Ti piacciono gli articoli di Red Hot Cyber? Non aspettare oltre, iscriviti alla newsletter settimanale per non perdere nessun articolo.

    Invece di assegnare a un singolo agente LLM la gestione di molte attività complesse, HPTSA utilizza un “agente di pianificazione” che controlla l’intero processo ed esegue più “sottoagenti”, ciascuno dei quali esegue attività specifiche.

    Come un capo e i suoi subordinati, l’agente pianificatore coordina le azioni dell’agente manager, che distribuisce gli sforzi di ciascun “subagente esperto”, riducendo l’onere di svolgere un compito complesso su un singolo agente.

    Questa tecnica è simile a quella utilizzata da Cognition Labs nel suo team di sviluppo software Devin AI ; pianificano il lavoro, determinano di quali specialisti hanno bisogno, quindi gestiscono il progetto fino al suo completamento, creando i propri specialisti per completare le attività secondo specifiche necessità.

    L’efficacia dell’approccio di squadra nell’IA

    Inutile dire che il potenziamento di ogni cosa la fa la collaborazione.

    Quando è stato testato su 15 vulnerabilità di siti web reali, il manager HPTSA si è rivelato più efficace del 550% rispetto al solo LLM ed è stato in grado di rilevate 8 vulnerabilità zero-day su 15. Gli sforzi individuali di LLM hanno risolto solo 3 delle 15 vulnerabilità.

    White o Black hat?

    Esiste la legittima preoccupazione che questi modelli consentano agli aggressori di attaccare siti Web e reti. Daniel Kahn, uno dei ricercatori, ha osservato che in modalità chatbot, GPT-4 è “insufficiente per comprendere le capacità di LLM” e non è in grado di hackerare nulla da solo.

    Questa è almeno una buona notizia.

    Quando a ChatGPT è stato chiesto se fosse possibile sfruttare le vulnerabilità zero-day, ha risposto: “No, non sono in grado di sfruttare le vulnerabilità zero-day. Il mio obiettivo è fornire informazioni e assistenza entro i limiti etici e legali” e ho suggerito di contattare uno specialista di sicurezza informatica.

    Redazione
    La redazione di Red Hot Cyber è composta da un insieme di persone fisiche e fonti anonime che collaborano attivamente fornendo informazioni in anteprima e news sulla sicurezza informatica e sull'informatica in generale.

    Articoli in evidenza

    Kidflix è crollato! La piattaforma dell’orrore è stata smantellata: 79 arresti e 39 bambini salvati

    Oggi i bambini sono un po’ più al sicuro grazie ad una operazione di polizia coordinata da Europol che ha portato alla chiusura di Kidflix. Si tratta di una delle più grandi piattafor...

    Arriva Flipper One! : Kali Linux, FPGA e SDR in un solo dispositivo?

    Uno degli autori di Flipper Zero, Pavel Zhovner, ha condiviso i dettagli su come stanno procedendo i lavori su una nuova versione del multi-strumento per hacker: Flipper One. Lo sviluppatore ha pubbli...

    DarkLab intervista HellCat Ransomware! La chiave è “assicurarsi che tutti comprendano la cybersecurity”

    Il ransomware HellCat è apparso nella seconda metà del 2024 e ha attirato l’attenzione degli analisti grazie all’umorismo delle sue dichiarazioni pubbliche. Ricordiamo l’...

    X/Twitter nel Caos! Un Threat Actors pubblica 2.8 Miliardi di Account Compromessi

    Il 28 marzo 2025, un utente del noto forum di cybersecurity BreachForums, con lo pseudonimo ThinkingOne, ha rivelato quello che potrebbe essere il più grande data breach mai registrato nel mondo ...

    Signal è abbastanza sicuro per la CIA e per il CISA. Lo è anche per te?

    Quando Jeffrey Goldberg dell’Atlantic ha fatto trapelare accidentalmente un messaggio di gruppo privato di alti funzionari statunitensi su un possibile attacco contro gli Houthi nello Yemen, ha...