Stable Diffusion 3.5 migliora finalmente la qualità delle immagini realizzate con l'IA

Stability AI ha rilasciato Stable Diffusion 3.5, l'ultima versione del suo generatore di immagini open-source. L'aggiornamento, disponibile da oggi, offre tre nuovi modelli che migliorano significativamente la qualità delle immagini generate e l'aderenza ai prompt rispetto alle versioni precedenti.

Il nuovo Stable Diffusion 3.5 arriva dopo le critiche ricevute dalla versione 3 Medium, rilasciata a giugno, che produceva immagini grottesche e deformi. L'azienda ha ammesso che quella versione "non ha soddisfatto pienamente i nostri standard o le aspettative della community".

I nuovi modelli puntano a correggere i problemi più noti del precedente Stable Diffusion 3 Medium.

I nuovi modelli puntano a risolvere questi problemi, offrendo una maggiore diversità di stili, tonalità della pelle e caratteristiche senza bisogno di prompt espliciti.

Stable Diffusion 3.5 Large è il modello di punta, progettato per usi professionali con una risoluzione di 1 MP. Offre la massima qualità e aderenza ai prompt tra i tre modelli.

Stable Diffusion 3.5 Large Turbo è una versione ottimizzata del modello Large, che privilegia l'efficienza sulla qualità massima. Può generare "immagini di alta qualità con un'eccezionale aderenza ai prompt" in soli quattro passaggi.

Stable Diffusion 3.5 Medium, con 2,5 miliardi di parametri, è pensato per l'hardware consumer. Bilancia qualità e semplicità, permettendo di generare immagini tra 0,25 e 2 megapixel. Sarà disponibile dal 29 ottobre.

Stability AI ha sottolineato che i nuovi modelli sono stati progettati per produrre risultati "rappresentativi del mondo, non solo di un tipo di persona, con diverse tonalità della pelle e caratteristiche, senza la necessità di prompt estesi". Questa attenzione alla diversità arriva dopo le polemiche che hanno coinvolto altri sistemi di IA, come il caso di Google Gemini che aveva generato immagini storicamente inaccurate.

L'azienda spera che questi miglioramenti possano risolvere i problemi riscontrati nelle versioni precedenti e offrire uno strumento più affidabile e versatile per la generazione di immagini basata sull'intelligenza artificiale.

Fonte dell'articolo: www.engadget.com