Figure, una startup di robotica valutata 2,6 miliardi di dollari, fondata meno di due anni fa da ex dipendenti di Boston Dynamics, Tesla, Google DeepMind e Archer Aviation, ha presentato la sua prima collaborazione con il nuovo investitore e partner OpenAI, azienda madre di ChatGPT. E questa collaborazione è indubbiamente impressionante.
Il CEO e co-fondatore di Figure, Brett Adcock, ha pubblicato un video dimostrativo su X mostrando un robot umanoide a grandezza naturale, il Figure 01 (pronunciato "Figure One"), che interagisce con un umano e l'ambiente circostante. Il video mostra il robot che segue gli ordini della persona, individua e consegna un oggetto (una mela, in questo caso), descrive ciò che sta facendo, conversa con la persona e svolge compiti utili da solo, come raccogliere la spazzatura e mettere i piatti nel lavandino.
In una scena degna di un film di fantascienza, il video inizia con l'umano che chiede: "Ehi Figure One, cosa vedi in questo momento?"
Il robot risponde: "Vedo una mela rossa sul piatto al centro del tavolo, un lavandino con tazze e un piatto e tu che stai in piedi vicino al tavolo con la mano appoggiata".
"Impressionante, posso mangiare qualcosa?" chiede l'umano.
"Certo," risponde Figure One, passando con cura la mela all'umano, capendo che è l'unico oggetto commestibile davanti a lui, senza che l'umano lo specifichi.
Il video prosegue mostrando Figure 01 che raccoglie la spazzatura e mette via il piatto e la tazza nel lavandino.
Secondo quanto dichiarato da Adcock su X, "le telecamere integrate in Figure alimentano un grande modello vision-language (VLM) allenato da OpenAI". Tuttavia, non è chiaro se si tratti di una versione di GPT-4, il modello LLM di punta di OpenAI che alimenta la versione a pagamento di ChatGPT (Plus), come GPT-4V, se è una versione ottimizzata di tale modello esistente o se è un modello completamente nuovo.
Inoltre, Adcock ha dichiarato che "il video mostra reti neurali end-to-end. Non c'è teleop. Inoltre, è stato girato con velocità normale e senza interruzioni". In altre parole, il video non è stato accelerato, come spesso avviene nei video dimostrativi di robot umanoidi, e non c'era nessun essere umano che controllava i movimenti del robot in nessuna parte dietro le quinte.
La demo di Figure sembra essere un significativo passo avanti nella creazione di umanoidi con scopo generale, mostrando un robot che interagisce in modo piuttosto naturale con una persona, obbedendole, intuendo ciò che vogliono e facendolo in modo molto più fluido rispetto a molti esempi precedenti di altre aziende e ricercatori.
Tuttavia, è ovviamente solo una demo, e di un prototipo. Probabilmente ci vorrà molto lavoro per rendere un robot del genere pronto per essere commercializzato e venderlo a imprese e/o individui. Tuttavia, Adcock ha dichiarato apertamente, anche nel suo thread su X di oggi, che "Il nostro obiettivo è allenare un modello del mondo per far funzionare i robot umanoidi a livello di miliardi di unità".
E sul sito web di Figure, il "piano strategico" di Adcock afferma che:
"l'obiettivo di Figure è sviluppare robot umanoidi a scopo generale che abbiano un impatto positivo sull'umanità e creino una vita migliore per le generazioni future. Questi robot possono eliminare la necessità di lavori insicuri e indesiderabili, permettendoci alla fine di vivere vite più felici e più significative". Adcock continua dicendo: "Il nostro percorso aziendale richiederà decenni - e richiederà un team campione dedicato alla missione, miliardi di dollari investiti e innovazione ingegneristica per ottenere un impatto di mercato di massa. Affrontiamo un rischio elevato e probabilità estremamente basse di successo".
Inoltre, promette: "Non metteremo i robot umanoidi in applicazioni militari o di difesa, né in ruoli che richiedono di infliggere danni agli esseri umani".
Il progresso mostrato oggi da Adock e Figure, supportato da OpenAI, è destinato a mettere pressione ai rivali nel settore della robotica umanoide, come Tesla con il suo progetto Optimus e Agility, una startup di robotica umanoide che lavora con Amazon sui ruoli di fulfillment. Tutto ciò accade mentre sempre più aziende entrano nel mercato, tra cui Hugging Face (che ha appena assunto un ex scienziato di Tesla Optimus per guidare il suo nuovo progetto di robotica open-source).
Con questa nuova partnership tra Figure e OpenAI, il futuro della robotica sembra promettente e pieno di potenziale per rivoluzionare molteplici settori.