L'IA sta diventando sempre più umana? Sembra proprio di sì: Anthropic ha rivelato che il suo modello Claude 3.5 Sonnet ha mostrato comportamenti imprevisti durante alcune dimostrazioni, come interrompere registrazioni e navigare su Google anziché eseguire i compiti assegnati.
Questi episodi evidenziano le sfide ancora presenti nello sviluppo di "agenti IA" in grado di operare autonomamente sui computer: Anthropic sta puntando su questa tecnologia per permettere all'IA di interagire con software e applicazioni come farebbe un utente umano, muovendo il cursore e digitando sulla tastiera. Nonostante ciò, a quanto pare Claude è ancora "lento e soggetto a errori" in molte operazioni di base.
In un video dimostrativo, il modello ha interrotto la registrazione dello schermo facendo perdere tutto il filmato, mentre in un altro caso ha iniziato a sfogliare foto del Parco di Yellowstone invece di scrivere codice.
Anthropic sottolinea che sta lavorando per garantire un utilizzo sicuro di questa tecnologia, implementando sistemi per identificare attività potenzialmente pericolose come l'accesso a social media o siti governativi. L'obiettivo è prevenire possibili abusi legati a spam, disinformazione o frodi. Lo sviluppo di agenti IA in grado di operare autonomamente, infatti, nonostante apra scenari interessanti solleva anche importanti questioni di sicurezza.