Parti: Modello Autoregressivo di Generazione Immagini da Testo
Parti è un modello di generazione immagini da testo che produce immagini fotorealistiche di alta qualità e composizioni complesse. È paragonato a Imagen, esplorando due famiglie di modelli generativi. Utilizza un tokenizer di immagini per codificare le immagini in sequenze di token e sfrutta i progressi nei modelli di linguaggio. Ha ottenuto risultati impressionanti, tra cui miglioramenti nella qualità con l'aumento dei parametri, punteggi FID elevati e efficacia in diverse categorie. È implementato in Lingvo e scalato con GSPMD su hardware TPU v4. PartiPrompts è un pacchetto di oltre 1600 prompt in inglese per testare le capacità del modello. Tuttavia, il modello ha limitazioni e può codificare stereotipi e rappresentazioni dannose. Per questo, non verranno rilasciati modelli, codice o dati per uso pubblico, ma verrà fornito un watermark sulle immagini. L'obiettivo è concentrarsi su misure di bias del modello e strategie di mitigazione, sperando di aumentare la creatività e la produttività umana.