OpenAI svela Operator: l'AI che lavora da sola e spende soldi per te

OpenAI ha annunciato il lancio di Operator, un agente AI in grado di controllare un browser web ed eseguire autonomamente determinate azioni online. La funzionalità è attualmente disponibile in anteprima per gli utenti statunitensi abbonati al piano ChatGPT Pro da $200.

Operator promette di automatizzare compiti come prenotare viaggi, fare prenotazioni al ristorante e fare acquisti online. Gli utenti possono scegliere tra diverse categorie di attività, tra cui shopping, consegne, ristorazione e viaggi. Quando attivato, Operator utilizza un browser dedicato per completare i task, mostrando all'utente le azioni che sta eseguendo.

La nuova funzionalità è basata su un modello chiamato Computer-Using Agent (CUA), che combina le capacità visive del modello GPT-4o con le abilità di ragionamento dei modelli più avanzati di OpenAI. Il CUA è addestrato a interagire con l'interfaccia utente dei siti web, simulando le azioni di un essere umano.

Nonostante le potenzialità, OpenAI avverte che il CUA non è ancora perfetto e potrebbe non funzionare in modo affidabile in tutti gli scenari. Per motivi di sicurezza, quindi, alcune operazioni sensibili come le transazioni bancarie richiedono ancora la supervisione dell'utente.

Operator presenta alcune limitazioni importanti:

Ci sono limiti di utilizzo giornalieri e per tipo di attività
Al momento non può eseguire compiti come inviare email o eliminare eventi dal calendario
Può bloccarsi di fronte a interfacce troppo complesse o controlli CAPTCHA

OpenAI ha implementato diverse misure di sicurezza per prevenire usi impropri, tra cui strumenti per limitare la vulnerabilità a prompt dannosi e tentativi di phishing, un sistema di monitoraggio che interrompe l'esecuzione in caso di attività sospette e pipeline automatizzate e revisionate da esseri umani per aggiornare continuamente le protezioni

Insomma, Operator rappresenta il tentativo più ambizioso di OpenAI di creare un agente AI in grado di eseguire azioni concrete online. Sebbene ci siano ancora limitazioni, questa tecnologia potrebbe cambiare radicalmente il modo in cui le persone interagiscono con internet e i computer, andando oltre la semplice elaborazione di informazioni.

Con il rilascio di Operator, sarà presto chiaro quanto sia realistica la visione di agenti AI in grado di automatizzare un'ampia gamma di attività online. La sfida per OpenAI sarà, quindi, quella di bilanciare le potenzialità della tecnologia con le necessarie precauzioni di sicurezza e privacy.

Fonte dell'articolo: techcrunch.com