Google ha annunciato durante il Google I/O 2024 una serie di nuove funzionalità basate sull'intelligenza artificiale per migliorare i prodotti già esistenti. Tra queste, spicca "Ask Photos", una funzione progettata per facilitare la ricerca di immagini all'interno della libreria di Google Foto attraverso comandi vocali e testuali consapevoli del contesto.
La nuova caratteristica di Google Foto permette agli utenti di trovare specifici dettagli o immagini ricercando tratti distintivi unici. Ad esempio, Google ha dimostrato come sia possibile identificare e mostrare il numero della targa della vostra auto semplicemente attraverso una richiesta specifica. Google Foto scandaglierà la libreria di immagini, capirà qual è l'automobile che appare più spesso ed è legata a voi in base ad altri fattori quali la posizione per darvi la risposta
Ask Photos, a new feature coming to @GooglePhotos, makes it easier to search across your photos and videos with the help of Gemini models. It goes beyond simple search to understand context and answer more complex questions. #GoogleIO pic.twitter.com/OsYXZLo5S1
— Google (@Google) May 14, 2024
Un altro esempio impressionante di questa tecnologia è stata la capacità di determinare il momento in cui un bambino ha imparato a nuotare analizzando le foto presenti nella libreria di Google Foto dell'utente. Questo tipo di riconoscimento avanzato, tuttavia, dipende ovviamente dai contenuti archiviati nella libreria di foto dell'utente.
La funzione "Ask Photos" sarà disponibile anche per i video, ma Google non ha fornito dimostrazioni pratiche o esempi durante l'evento. L'implementazione di questa funzionalità è prevista per i prossimi mesi, con un rilascio indicativamente previsto per l'estate.
Non è stato specificato se il servizio richiederà una connessione internet o se sarà disponibile anche in modalità offline sul dispositivo dell'utente.
La funzione è basata ovviamente sui modelli Google Gemini, che però non sono immuni dalle allucinazioni che caratterizzano le IA generative. Vedremo quali saranno i risultati quando la funzione verrà resa disponibile verso il grande pubblico. Il rollout è atteso per l'estate, ma non sappiamo se si tratterà di un rilascio globale o solo negli USA.