Durante l'evento Spring Update, OpenAI ha presentato, e rilasciato, GPT-4o, una versione più veloce del suo modello GPT-4 che alimenta il suo prodotto principale, ChatGPT.
L'ultima versione "è molto più veloce" e migliora "le capacità nei testi, nella visione e nell'audio", ha detto il CTO di OpenAI, Mira Murati, durante la diretta da poco conclusasi.
L'aspetto più interessante di GPT-4o è che sarà gratuito per tutti gli utenti e che gli abbonati al servizio continueranno ad avere "fino a cinque volte i limiti di capacità" degli utenti gratuiti.
Quello che però si è rivelato davvero sorprendente sono le nuove funzioni offerte dal nuovo modello multimodale realizzato da OpenAI, che spaziano dal riconoscimento di testi e oggetti, attraverso la fotocamera dello smartphone, fino alla traduzione, in maniera praticamente immediata, delle conversazioni in lingue diverse fra due individui.
Durante la presentazione, difatti, sono state mostrate numerose demo del nuovo applicativo, mostrando come ChatGpt abbia assunto i connotati di un assistente virtuale, capace non solo di eseguire compiti impartiti per via testuale, ma rispondendo in maniera naturale alla voce dell'utente.
Le dimostrazioni dell'evento hanno presentato diverse funzionalità decisamente impressionanti, con GPT-4o che, oltre a dialogare in maniera molto naturale con gli interlocutori, cambiava tono di voce su richiesta, eseguiva calcoli scritti su un foglio di carta, dopo averli visionati attraverso la camera dello smartphone, e traduceva i tempo reale (vestendo i panni di un interprete virtuale) le conversazioni fra due interlocutori che parlavano, rispettivamente, in italiano e in inglese.
GPT-4o, come accennavamo in apertura, è gratuito per tutti gli utenti di ChatGPT, i quali ora avranno accesso a funzionalità come:
- Ottenere risposte sia dal modello che dal web
- Colloquiare in maniera naturale con l'assistente vocale
- Analizzare dati e creare grafici
- Ottenere risposte, o semplicemente dialogare, sulle foto che vengono scattate
- Caricare file per assistenza nella sintesi, scrittura o analisi
- Tradurre conversazioni in tempo reale.