Il nuovo ChatGPT-o1 batte gli umani negli indovinelli

OpenAI ha rilasciato questa settimana il tanto atteso modello Strawberry per ChatGPT, vantando le sue capacità in ambiti complessi come programmazione, realizzazione di sequenze geniche e fisica quantistica.

Tuttavia, un test molto più pratico ha rivelato risultati contrastanti su compiti più comuni. Il nuovo modello, disponibile nelle versioni o1-preview e o1-mini su ChatGPT, si è dimostrato estremamente efficace nel risolvere enigmi e indovinelli logici, superando le capacità umane in termini di velocità.

Il nuovo modello di OpenAI usa pronomi in prima persona, cercando di risultare ancora più realistico e umano.

L'IA è in grado di scomporre il ragionamento in passaggi logici, rendendo visibile il processo di risoluzione. Tuttavia, quando si tratta di creare nuovi indovinelli o utilizzare l'umorismo, il modello mostra evidenti limiti.

Pur comprendendo la struttura logica, non riesce a fare il salto creativo necessario per generare contenuti divertenti o originali.

Il test è stato esteso a situazioni di vita quotidiana, come problemi meccanici di un'auto o consigli sulle relazioni. In questi casi, l'IA ha fornito risposte sensate e logiche, ma prive di originalità o intuizioni particolari.

Ad esempio, sui rumori sospetti di un'auto ha elencato una serie di possibili cause e soluzioni standard. Per quanto riguarda il flirt, ha proposto una lista di comportamenti da osservare, ma senza offrire spunti davvero innovativi.

È interessante notare come l'IA utilizzi pronomi in prima persona nel formulare le risposte, quasi mimando il processo di ragionamento di una persona reale. Frasi come "Sto analizzando le varie cause di un rumore mentre si guida" danno l'impressione di un'entità pensante.

I modelli o1-preview e o1-mini non offrono tutte le funzionalità delle versioni complete di ChatGPT, come l'analisi di immagini o documenti. Tuttavia, si distinguono per velocità e capacità logiche, fornendo sempre una spiegazione dettagliata del ragionamento seguito. Siamo curiosi di vedere quante di queste funzioni verranno integrate anche all'interno di iOS 18, una volta che Apple Intelligence arriverà anche da noi (fra l'altro, avete già preordinato i nuovi iPhone su Amazon?).

Nonostante l'impressionante abilità nel risolvere problemi logici, questi modelli mostrano chiari limiti quando si tratta di creatività e inventiva. Possono risolvere enigmi esistenti, ma faticano a crearne di nuovi o a proporre soluzioni davvero originali.

In conclusione, il modello Strawberry di OpenAI rappresenta un notevole passo avanti nelle capacità logiche dell'intelligenza artificiale, ma evidenzia anche i limiti attuali in termini di creatività e pensiero laterale. Mentre eccelle in compiti strutturati e logici, fatica ancora a replicare gli aspetti più intuitivi e imprevedibili dell'intelligenza umana.

Fonte dell'articolo: www.techradar.com