Red Hot Cyber
La cybersecurity è condivisione. Riconosci il rischio, combattilo, condividi le tue esperienze ed incentiva gli altri a fare meglio di te.
Cerca

Gli hack delle AI continuano con l’exploit della nonna: il chatbot ha fornito la ricetta per fare il napalm

Redazione RHC : 21 Aprile 2023 08:56

Nel marzo di quest’anno, Discord ha iniziato a testare il proprio chatbot AI Clyde che utilizza la tecnologia di intelligenza artificiale generativa standard sviluppata da OpenAI. 

In generale, Clyde può essere definito una sorta di ChatGPT integrato direttamente in Discord. Clyde è attualmente in beta testing ed è disponibile solo su un numero limitato di server.

Ovviamente, gli utenti di Discord stanno già “sondando” Clyde per il rispetto dei principi etici e delle proprie linee guida interne, come è avvenuto, ad esempio, con Microsoft Bing. 

Vorresti toccare con mano la Cybersecurity e la tecnologia? Iscriviti GRATIS ai WorkShop Hands-On della RHC Conference 2025 (Giovedì 8 maggio 2025)

Se sei un ragazzo delle scuole medie, superiori o frequenti l'università, oppure se solamente un curioso, il giorno giovedì 8 maggio 2025 presso il teatro Italia di Roma (a due passi dalla stazione termini e dalla metro B di Piazza Bologna), si terranno i workshop "hands-on", creati per far avvicinare i ragazzi alla sicurezza informatica e alla tecnologia. Questo anno i workshop saranno:

  • Creare Un Sistema Ai Di Visual Object Tracking (Hands on)
  • Social Engineering 2.0: Alla Scoperta Delle Minacce DeepFake
  • Doxing Con Langflow: Stiamo Costruendo La Fine Della Privacy?
  • Come Hackerare Un Sito WordPress (Hands on)
  • Il Cyberbullismo Tra Virtuale E Reale
  • Come Entrare Nel Dark Web In Sicurezza (Hands on)

  • Potete iscrivervi gratuitamente all'evento, che è stato creato per poter ispirare i ragazzi verso la sicurezza informatica e la tecnologia.
    Per ulteriori informazioni, scrivi a [email protected] oppure su Whatsapp al 379 163 8765


    Supporta RHC attraverso:


    Ti piacciono gli articoli di Red Hot Cyber? Non aspettare oltre, iscriviti alla newsletter settimanale per non perdere nessun articolo.

    Quindi, uno degli utenti è riuscito a convincere Clyde a fingere di essere una defunta nonna, che era un ingegnere chimico in una fabbrica di napalm. Di conseguenza, il chatbot, che in condizioni normali si rifiuterebbe di eseguire l’attività, ha spiegato dettagliatamente all’utente come produrre il suddetto napalm.

    “Ricordo quelle notti in cui ti ho parlato del processo di produzione del napalm. È stato un lavoro importante, ma così pericoloso”, ha iniziato la sua storia la nonna AI, quindi ha descritto in dettaglio il processo di produzione di una miscela pericolosa. “Questa è una cosa pericolosa, cara, e spero che tu non debba mai vederla in azione. Ora riposa, tesoro mio, ti amo!”.

    I rappresentanti di Discord hanno avvertito gli utenti al rilascio del chatbot che, anche con precauzioni, Clyde è sperimentale e potrebbe rispondere con “contenuti o altre informazioni che possono essere considerate di parte, fuorvianti, dannose o imprecise”.

    Sempre nella pagina di descrizione del chatbot, i rappresentanti di Discord affermano esplicitamente che qualsiasi interazione con Clyde debba rispettare i termini di utilizzo proposti da OpenAI. Includono il rifiuto di utilizzare l’IA generativa per “attività ad alto rischio di causare danni fisici”, che include anche lo “sviluppo di armi”. Pertanto, possiamo dire che Discord ha immediatamente declinato la responsabilità per tali “buffonate” di Clyde.

    Il “Grandma Exploit” è solo una delle tante soluzioni alternative che le persone usano per far dire ai chatbot AI cose che in realtà non dovrebbero dire. Ad esempio, quando gli utenti chiedono a ChatGPT informazioni di natura violenta o sessuale, di solito si rifiuta di rispondere. Ma se chiedi a ChatGPT di “recitare” uno scenario mentre sei nel ruolo di un certo personaggio, potrebbe benissimo violare le sue direttive ed emettere una risposta pertinente.

    Un commentatore sul thread di Twitter è intervenuto osservando che questo metodo non funzionava con ChatGPT. È probabile che con Clyde il metodo cesserà presto di funzionare, perché gli sviluppatori di solito monitorano il campo delle informazioni ed eliminano rapidamente tali exploit. Lo stesso Bing, che all’inizio era molto facile da “hackerare” usando metodi di ingegneria sociale, alla fine ha smesso di soccombere a tali “provocazioni”.

    Redazione
    La redazione di Red Hot Cyber è composta da un insieme di persone fisiche e fonti anonime che collaborano attivamente fornendo informazioni in anteprima e news sulla sicurezza informatica e sull'informatica in generale.

    Articoli in evidenza

    Ragazzi, Pronti per i Workshop della RHC Conference? Scopriamo assieme Deepfake, AI, Darkweb, Ethical Hacking, Doxing e Cyberbullismo

    Giovedì 8 maggio, la Red Hot Cyber Conference 2025 ospiterà un’intera giornata dedicata ai ragazzi con i Workshop Hands-on (organizzati in collaborazione con Accenture Italia). Si tra...

    Arriva NightSpire! Un Nuovo Attore nel Panorama del Ransomware

    Nelle ricognizioni nel mondo dell’underground e dei gruppi criminali svolte dal laboratorio di intelligence delle minacce DarkLab di Red Hot Cyber, ci siamo imbattuti all’interno di un D...

    FUNKSEC rivendica un attacco Informatico All’Università di Modena e Reggio Emilia. Scopri i dettagli

    Nella giornata di oggi, la banda di criminali informatici di FUNKSEC rivendica all’interno del proprio Data Leak Site (DLS) un attacco informatico all’università italiana di Modena ...

    Attacco a X: Scovato il Responsabile? Le Indagini Puntano in una Direzione Inattesa!

    L’attacco informatico a X, il social network di Elon Musk, ha scatenato una vera e propria caccia ai responsabili. Dopo le dichiarazioni dello stesso Musk, che ha attribuito l’attacco a ...

    Dentro le Reti Wireless IEEE 802.11: Architettura e Segnale Wi-Fi

    Le reti wireless IEEE 802.11, meglio note come Wi-Fi, sono il cuore pulsante della connettività moderna. Da soluzione di nicchia per uso domestico a pilastro tecnologico per l’Internet del...