Nell’ultimo molti di noi si sono abituati a ChatGPT, considerandolo come il migliore chatbot disponibile. Da oggi però Google riaccende la competizione con l'introduzione di Gemini, una nuova IA che sarà integrata anche nel chatbot Google Bard.
La novità è interessante per più di una ragione, ma quella più importante è che Google Bard promette di fare gratuitamente ciò che ChatGPT fa a pagamento, e ciò potrebbe essere una cattiva notizia per OpenAI e Microsoft.
Anche se è importante ricordare che in questi casi è meglio dire “gratuito” tra virgolette, perché il prezzo da pagare è sempre un pezzettino (o un pezzo bello grosso) di privacy. E questo è forse particolarmente vero quando si tratta di Google.
Detto questo, Google Bard finora si è dimostrato uno strumento un po’ meno potente e un po’ meno utile rispetto a ChatGPT. Con Gemini le cose però dovrebbero cambiare radicalmente. Gemini è già disponibile a livello globale (170 paesi), anche se solo in lingua inglese. Secondo Google è una tecnologia pari o superiore a quella di OpenAI, anche se il confronto è con ChatGPT 3.5, mentre la versione da battere è ChatGPT 4, che è a pagamento.
Rispetto alla versione gratuita di ChatGPT, inoltre, Google Bard ha accesso a Internet e può fare alcune cose in più. In altre parole, c’è il potenziale per attrarre tutto il vasto pubblico che oggi usa la versione base di ChatGPT. Almeno per chi sa e può usarlo in inglese.
Gemini esiste in tre versioni: Gemini Mini, Gemini Pro e Gemini Ultra. Chi usa Google Bard da oggi avrà accesso alla versione intermedia, Gemini Pro. Gemini Mini invece è pensata per un’esecuzione locale su hardware da smartphone, e il primo modello a sfruttarla sarà il Google Pixel 8 Pro.
Gemini Ultra è una versione più potente, e l’anno prossimo potremmo vedere un “Bard Advanced” che ne sfrutta le potenzialità - e non mi sorprenderebbe se questa fosse un’opzione a pagamento. Gemini Ultra è anche la versione multimodale del modello, in grado cioè di accettare e creare immagini, audio e video oltre al testo.
Le interazioni non testuali sono il punto di forza di Gemini in generale, afferma Demis Hassabis, responsabile di Google DeepMind. "L'abbiamo costruita per essere nativamente multimodale fin dall'inizio", dice. "Questa è una delle nuove capacità che ha... il tipo di integrazione e di ragionamento che può fare tra le varie modalità".
Sundar Pichai dice di considerare questo lancio sia come un grande momento per Bard che come l'inizio dell'era Gemini.