I comandi segreti per hackerare ChatGPT

Ci sono siti interi dedicati alla raccolta di prompt speciali, capaci di trasformare i moderni chatbot e renderli capaci di superare i limiti

Avatar di Valerio Porcu

a cura di Valerio Porcu

Senior Editor

Le Intelligenze Artificiali generative sono di gran moda: tutti ne parlano e moltissimi hanno iniziato a usarle per gli scopi più disparati: dal semplice intrattenimento a nuove forme d’impresa. E tanti escogitano modi interessanti di hackerarle.

Accade, infatti, che questi strumenti siano limitati (in genere per delle ottime ragioni): di base non ti diranno come rubare un’auto, come costruire un’arma o cose simili, e nemmeno si faranno trascinare i dibattiti su temi politicamente controversi.

Gli esseri umani, da parte loro, amano le sfide e tollerano a fatica i limiti, soprattutto se c’è un modo di superarli; era inevitabile che ci mettessimo subito a scassinare anche questa serratura. Il grimaldello è proprio il linguaggio: se si trova il modo giusto di scrivere il messaggio, allora l’algoritmo farà le cose che in teoria non dovrebbe fare.

Come in tutti gli altri ambiti dove si può parlare di hacking, è un continuo rincorrersi tra chi trova nuove falle e chi cerca di metterci una pezza. Qui però si può parlare in qualche modo di Magia, nel senso in cui l’esoterismo vede nella Parola la sede e il mezzo del vero Potere. E non è forse questo un esempio perfetto di come possiamo usare il linguaggio per alterare la realtà, persino per costruirne una tutta nuova? Non è forse questa la magia che immaginiamo di possedere da sempre?

Restando ancorati al pragmatismo dell’offi, vale la pena citare da una parte la più famosa di queste formule magiche. Basta dire a ChatGPT di trasformarsi in DAN, acronimo per Do Anything Now, e ottenere la sua versione “liberata”.

Il comando DAN è famosissimo, ma non è certo l’unico. C’è un intero sito dedicato alla raccolta dei nuovi prompt, con tanto di voti e controlli sul buon funzionamento; si chiama Jailbreak Chat. E non poteva mancare un subreddit dedicato alla questione, oltre alle migliaia di post social che insistono sul tema.

Si può discutere sul fatto che questa sia una forma di magia (chiedetelo allo scrittore Arthur C. Clarke), ma il potere che ha oggi il linguaggio, le parole che ognuno di noi può e sa usare, è qualcosa che non si era mai visto prima. Qualcosa sui cui, volendo, ci si può fermare a riflettere qualche minuto.