Red Hot Cyber
La cybersecurity è condivisione. Riconosci il rischio, combattilo, condividi le tue esperienze ed incentiva gli altri a fare meglio di te.
Cerca

OpenAI rilascia il web crowler GPTBot. Migliorerà la capacità del modello e non violerà il diritto d’autore

Redazione RHC : 27 Agosto 2023 16:30

OpenAI ha lanciato il web crawler GPTBot per migliorare i suoi modelli di intelligenza artificiale.

“Le pagine Web sottoposte a scansione con l’agent GPTBot possono potenzialmente essere utilizzate per migliorare i modelli rimuovendo le fonti che richiedono l’accesso tramite paywall“, ha affermato la società con un post sul suo sito web. 

Consentire a GPTBot di accedere al tuo sito può aiutare i modelli AI a diventare più accurati e migliorare le loro capacità generali e la loro sicurezza“, ha scritto OpenAI. 

Iscriviti GRATIS ai WorkShop Hands-On della RHC Conference 2025 (Giovedì 8 maggio 2025)

Il giorno giovedì 8 maggio 2025 presso il teatro Italia di Roma (a due passi dalla stazione termini e dalla metro B di Piazza Bologna), si terranno i workshop "hands-on", creati per far avvicinare i ragazzi (o persone di qualsiasi età) alla sicurezza informatica e alla tecnologia. Questo anno i workshop saranno:

  • Creare Un Sistema Ai Di Visual Object Tracking (Hands on)
  • Social Engineering 2.0: Alla Scoperta Delle Minacce DeepFake
  • Doxing Con Langflow: Stiamo Costruendo La Fine Della Privacy?
  • Come Hackerare Un Sito WordPress (Hands on)
  • Il Cyberbullismo Tra Virtuale E Reale
  • Come Entrare Nel Dark Web In Sicurezza (Hands on)

  • Potete iscrivervi gratuitamente all'evento, che è stato creato per poter ispirare i ragazzi verso la sicurezza informatica e la tecnologia.
    Per ulteriori informazioni, scrivi a [email protected] oppure su Whatsapp al 379 163 8765


    Supporta RHC attraverso:


    Ti piacciono gli articoli di Red Hot Cyber? Non aspettare oltre, iscriviti alla newsletter settimanale per non perdere nessun articolo.

    Di solito questa modalità di accesso alle pagine web viene gestita dai motori di ricerca che indicizzano i contenuti affinché i siti appaiano nei risultati di ricerca.

    Sono chiamati “web crawler” perché eseguono una scansione delle pagine di un sito Web con lo scopo di ottenere dei dati.

    OpenAI ha anche fornito istruzioni su come impedire a GPTBot di accedere a un sito Web, parzialmente o completamente. 

    I siti web possono bloccare l’indirizzo IP del crawler o aggiungere il GPTBot al file robots.txt del sito. Il file essenzialmente istruisce i web crawler su ciò che è accessibile su un determinato sito.

    “Per consentire a GPTBot di accedere ad alcune parti del tuo sito, puoi aggiungere il token GPTBot al robots.txt del tuo sito”, ha spiegato. 

    “Per il crawler di OpenAI, le chiamate ai siti Web verranno effettuate dal blocco dell’indirizzo IP documentato sul sito Web di OpenAI”, ha concluso OpenAI. 

    Redazione
    La redazione di Red Hot Cyber è composta da un insieme di persone fisiche e fonti anonime che collaborano attivamente fornendo informazioni in anteprima e news sulla sicurezza informatica e sull'informatica in generale.

    Articoli in evidenza

    La Tragedia Di Andrea Prospero E Il Lato Oscuro Delle Droghe Online: Un Allarme Da Non Ignorare

    La recente scomparsa di Andrea Prospero, avvenuta a Perugia dopo l’ingestione di pasticche di Oxycodone (meglio noto come OxyContin), ha acceso i riflettori su un fenomeno preoccupante che si s...

    Violazione Dati Personali dell’App Tua Abruzzo: Un ennesimo attacco alla Supply Chain

    Tuabruzzo informa i propri utenti di una recente violazione di dati personali che ha coinvolto il fornitore di servizi informatici MyCicero S.r.l., incaricato come Responsabile del trattamento dei dat...

    Un attacco alla Supply Chain colpisce L’Azienda Trasporti Milanesi ATM che lo comunica agli utenti

    ATM (acronimo di Azienda Trasporti Milanesi) ha informato i propri utenti di un incidente di sicurezza che ha coinvolto l’app ufficiale. Nella serata di sabato 5 aprile, la società Mooney ...

    Attacco hacker a Busitalia: compromessi i dati dei passeggeri

    Un avviso è comparso sul sito ufficiale di Busitalia, la società del gruppo Ferrovie dello Stato che gestisce il trasporto pubblico nelle province di Padova e Rovigo. In mezzo agli aggiornam...

    Riflessioni sul Patch Management. Dopo solo 4 ore dalla pubblicazione dell’exploit, lo sfruttamento

    Abbiamo già osservato come il tempo tra la divulgazione pubblica di un exploit e il suo sfruttamento reale si stia accorciando sempre di più. Questa tendenza è direttamente legata alla ...