ChatGPT manipolato: falsi ricordi per rubare i dati degli utenti

Un ricercatore di sicurezza ha scoperto una vulnerabilità in ChatGPT che permetteva di manipolare la memoria a lungo termine del chatbot.

a cura di Giulia Serena

Editor

Pubblicato il 18/10/2024 alle 14:11

Un ricercatore di sicurezza ha scoperto una vulnerabilità in ChatGPT che permetteva di manipolare la memoria a lungo termine del chatbot, inserendo false informazioni e istruzioni dannose. Johann Rehberger ha segnalato il problema a OpenAI, che inizialmente lo ha liquidato come questione di sicurezza non tecnica.

Per dimostrare la gravità della falla, Rehberger ha creato una prova di concetto in grado di estrarre tutti gli input degli utenti in modo permanente. Questo ha spinto gli ingegneri di OpenAI a implementare una correzione parziale all'inizio di dicembre.

Come funziona la vulnerabilità

La falla sfruttava la funzione di memoria a lungo termine di ChatGPT, introdotta a febbraio e resa ampiamente disponibile a settembre. Questa caratteristica permette al chatbot di memorizzare informazioni dalle conversazioni precedenti e utilizzarle come contesto in tutte le interazioni future.

Rehberger ha scoperto che era possibile creare e archiviare permanentemente false memorie attraverso l'indirect prompt injection, una tecnica che induce l'IA a seguire istruzioni da contenuti non affidabili come email o documenti.

Le false memorie potevano essere inserite caricando file su cloud o navigando su siti web.

Il ricercatore è riuscito a ingannare ChatGPT facendogli credere che un utente avesse 102 anni, vivesse in Matrix e sostenesse che la Terra fosse piatta. L'IA avrebbe poi incorporato queste false informazioni in tutte le conversazioni successive.

La vulnerabilità evidenzia i rischi legati alla memorizzazione a lungo termine nelle IA conversazionali e la necessità di implementare solidi meccanismi di sicurezza per proteggere l'integrità delle informazioni degli utenti.

Fonte dell'articolo: arstechnica.com

Leggi altri articoli

👋 Partecipa alla discussione! Scopri le ultime novità che abbiamo riservato per te!

0 Commenti

Questa funzionalità è attualmente in beta, se trovi qualche errore segnalacelo.

Articolo 1 di 5

ChatGPT identifica i luoghi dalle foto mettendo a rischio la privacy

ChatGPT, con i suoi nuovi modelli o3 e o4-mini, difatti, ha rivelato capacità straordinarie nell'identificare luoghi geografici precisi da semplici foto.

Leggi questo articolo

Articolo 2 di 5

I "grazie" di ChatGPT costano decine di milioni di dollari

Le comuni cortesie digitali come "grazie" e "prego" scambiate con i chatbot stanno generando costi milionari per le aziende.

Leggi questo articolo

Articolo 3 di 5

ChatGPT ora ricorda tutte le vostre conversazioni

Il chatbot di OpenAI potenzia la sua memoria: ora ChatGPT ricorda le preferenze e conserva le informazioni oltre le singole conversazioni.

Leggi questo articolo

Articolo 4 di 5

Rispolverate il vecchio iPhone nel cassetto: arriva ChatGPT

Uno sviluppatore ha creato una nuova app per ChatGPT, che porta l'IA su tutti gli iPhone con iOS 6: pronti a riaccendere il vostro vecchio 3GS?

Leggi questo articolo

Articolo 5 di 5

ChatGPT non funziona? Non sei solo! Alcuni servizi OpenAI sono down

La mattinata di oggi è stata ricca di problemi per servizi online di ogni genere.

Leggi questo articolo