OpenAI, l'azienda creatrice di ChatGPT, sta sviluppando un nuovo approccio per i suoi modelli di intelligenza artificiale con un progetto dal nome in codice “Strawberry”.
Questo progetto, i cui dettagli non erano stati precedentemente resi noti, mira a migliorare le capacità di ragionamento dei modelli di IA, come rivelato da una serie di documenti interni esaminati da Reuters.
Il progetto Strawberry è stato concepito per permettere all’IA non solo di rispondere alle domande, ma anche di pianificare in anticipo quando navigare autonomamente su Internet per condurre quella che OpenAI definisce una “ricerca approfondita”.
Nonostante i dettagli specifici di come funzioni Strawberry siano mantenuti segreti anche all’interno di OpenAI, il progetto è visto come un passo in avanti significativo nella capacità di ragionamento dell'IA.
La tecnologia promette di consentire alle IA di pianificare, riflettere su come funziona il mondo fisico e affrontare problemi complessi in modo affidabile. Questo progresso è visto come fondamentale per raggiungere l'intelligenza a livello umano o superumano.
Il progetto Strawberry era precedentemente conosciuto come Q* e, già dall'anno scorso, era considerato un punto di svolta importante all'interno dell'azienda. OpenAI ha recentemente mostrato una demo di un progetto di ricerca con nuove capacità di ragionamento simili a quelle umane, ma non è chiaro se si trattasse di Strawberry.
Il CEO di OpenAI, Sam Altman, ha sottolineato l'importanza del miglioramento delle capacità di ragionamento nell'IA, affermando che sarà un'area di progresso cruciale. Anche altre aziende come Google, Meta e Microsoft stanno sperimentando tecniche per migliorare il ragionamento nei modelli di IA.
Strawberry include una fase di “post-addestramento” dei modelli di IA generativa di OpenAI, un processo che affina le prestazioni dei modelli dopo il loro addestramento iniziale su grandi quantità di dati.
Questo processo può coinvolgere metodi come il “fine-tuning”, dove i modelli ricevono feedback dagli esseri umani e vengono alimentati con esempi di risposte buone e cattive.
Una fonte ha paragonato Strawberry a un metodo sviluppato a Stanford nel 2022 chiamato “Self-Taught Reasoner” (STaR), che permette ai modelli di IA di creare autonomamente i propri dati di addestramento, potenzialmente superando l'intelligenza a livello umano.
OpenAI sta creando, addestrando e valutando i modelli su un dataset di “ricerca approfondita” per eseguire compiti complessi che richiedono pianificazione e azioni a lungo termine. L'azienda prevede anche di testare queste capacità per svolgere il lavoro di ingegneri software e hardware.
In conclusione, il progetto Strawberry rappresenta un componente chiave del piano di OpenAI per superare lo stato attuale delle IA e migliorare significativamente le capacità di ragionamento dei suoi modelli.