In arrivo la modalità vocale avanzata di ChatGPT

OpenAI ha aperto il programma alpha per advanced Voice Mode, la feature che consente di dialogare in tempo reale con il chatbot.

Avatar di Marina Londei

a cura di Marina Londei

Editor

Anche se con un mese di ritardo, OpenAI ha ufficialmente aperto il programma alpha di advanced Voice Mode, una funzionalità di ChatGPT che consente di avere una conversazione vocale con il chatbot e lo rende in grado di percepire e rispondere alle emozioni dell'utente.

A fine giugno la compagnia aveva rivelato di aver bisogno di più tempo per cominciare la distribuzione della feature; in particolare, OpenAI voleva migliorare la capacità di GPT-4 di comprendere e censurare determinati contenuti, oltre che irrobustire l'infrastruttura per garantire conversazioni real-time a milioni di utenti.

"La modalità vocale avanzata di ChatGPT è in grado di comprendere e rispondere alle emozioni e ai segnali non verbali, avvicinandoci alle conversazioni naturali in tempo reale con l'intelligenza artificiale. La nostra missione è portare a voi queste nuove esperienze in maniera studiata" aveva scritto la compagnia.

OpenAI ha testato le capacità vocali del chatbot con più di 100 red teamer esterni e su 45 lingue diverse. Per proteggere la privacy degli utenti, il modello è stato addestrato per parlare usando solo quattro voci predefinite ed è in grado di bloccare qualsiasi output che differisca tra queste voci.

La compagnia ha specificato anche che, per garantire che il sistema rispetti il diritto d'autore, ci saranno dei nuovi filtri che bloccheranno richieste di generare musica o altri audio protetti da copyright; inoltre, le stesse tecniche di sicurezza verranno applicate alle modalità di testo e vocali. 

La feature attualmente è disponibile solo per un gruppo ristretto di utenti ChatGPT Plus, ma OpenAI ha intenzione di espandere gradualmente l'accesso a tutti gli abbonati Plus entro il prossimo autunno. Nelle prime settimane di agosto, inoltre, la compagnia prevede di rilasciare un report dettagliato sulle capacità, i limiti e le valutazioni di sicurezza della feature. 

Leggi altri articoli