Google potrebbe presto lanciare una versione preliminare di "Project Jarvis", un nuovo modello di intelligenza artificiale che consente di eseguire compiti quali ricerca, acquisti online o prenotazioni di voli, secondo quanto riferito da The Information. Questo strumento, basato su una versione futura di Gemini di Google, lavorerà esclusivamente tramite browser, con una specifica ottimizzazione per Chrome.
Il sistema di "Project Jarvis" si propone di aiutare gli utenti ad automatizzare le attività quotidiane legate alla navigazione web, interpretando screenshot e interagendo con i siti attraverso la selezione e l'input di testo. Nonostante si trovi in una fase iniziale, l'IA richiede attualmente "alcuni secondi" per passare da un'azione all'altra.
Si tratta di un modello simile al concept di "large action model" presentato da Rabbit durante il lancio di Rabbit R1, ma mai reso disponibile agli utenti finali.
Allo stato attuale, i principali competitor nel settore dell'IA stanno sviluppando modelli simili. Microsoft con Copilot Vision offre interazione vocale con le pagine web visualizzate, mentre Apple sta lavorando su Apple Intelligence, che potrà gestire attività su più applicazioni. Anche Anthropic e OpenAI stanno progressivamente aggiornando i loro sistemi per un utilizzo simile.
Nonostante l'annuncio ufficiale sia previsto per dicembre, Google contempla l'idea di distribuire "Project Jarvis" ad un numero ristretto di tester per identificare e correggere eventuali difetti.