Sora, la nuova creazione di OpenAI nel campo della generazione di video mediante testo, promette di rivoluzionare il modo in cui immaginiamo e creiamo contenuti visivi. Con la capacità di gestire scene complesse, ricche di personaggi, movimenti dettagliati e fisica degli oggetti, questo modello si distingue per la sua capacità di generare video espressivi e realistici.
Le dimostrazioni fornite da OpenAI nel loro post sul blog offrono uno sguardo affascinante sul potenziale di Sora. Dalle scene della corsa all'oro in California a video girati da treni a Tokyo, il modello mostra una notevole varietà e qualità nei video generati. Sora è in grado di generare video in una vasta gamma di stili, che vanno dal fotorealismo all'animazione e anche video in bianco e nero, con una durata che può arrivare fino a un minuto. Un aspetto importante è che i video generati mantengono una ragionevole coerenza, evitando ciò che potremmo definire la "stranezza dell'IA", come oggetti che si muovono in direzioni fisicamente impossibili. Tuttavia, emerge anche la consapevolezza dei limiti attuali, con alcuni filmati che presentano artefatti o incongruenze dovute alla complessità della simulazione fisica.
Sora si inserisce in un panorama sempre più competitivo di modelli text-to-video. Al momento, Sora non è ancora disponibile per il pubblico, ma OpenAI sta lavorando attivamente con un team di valutatori e collaboratori esterni per perfezionare il modello.
Oltre alle sfide tecniche, Sora affronta anche questioni etiche e sociali legate alla generazione di video fotorealistici. OpenAI ha introdotto delle filigrane nel suo strumento text-to-image DALL-E 3, ma riconosce che possono essere facilmente rimosse. L'azienda si impegna a promuovere un uso responsabile dei suoi modelli e monitorare attentamente gli impatti di Sora sulla società.
Introducing Sora, our text-to-video model.
— OpenAI (@OpenAI) February 15, 2024
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf