Phenaki est un modèle innovant pour la synthèse de vidéos réalistes basé sur une séquence de prompts textuels. La génération de vidéos à partir de texte pose de nombreuses défis, tels que le coût informatique élevé, la quantité limitée de données de haute qualité text-vidéo et la longueur variable des vidéos. Pour résoudre ces problèmes, Phenaki introduit un nouveau modèle causal pour l'apprentissage de la représentation vidéo, qui compresse la vidéo en une petite représentation de jetons discrets. Ce tokenizer utilise une attention causale dans le temps, ce qui lui permet de fonctionner avec des vidéos de longueur variable. Pour générer des jetons vidéo à partir du texte, un transformateur masqué bidirectionnel conditionné sur des jetons de texte pré-calculés est utilisé. Les jetons vidéo générés sont ensuite dé-tokenisés pour créer la vidéo réelle. Pour aborder les problèmes de données, il est démontré comment l'entraînement conjoint sur un grand corpus de paires image-texte ainsi qu'un plus petit nombre d'exemples vidéo-texte peut entraîner une généralisation au-delà de ce qui est disponible dans les ensembles de données vidéo. Par rapport aux méthodes de génération de vidéos précédentes, Phenaki peut générer des vidéos de longueur arbitraire conditionnées par une séquence de prompts (c'est-à-dire du texte variable dans le temps ou une histoire) dans un domaine ouvert. De plus, l'encodeur-décodeur vidéo proposé surpasse tous les baselines par trame actuellement utilisés dans la littérature en termes de qualité spatio-temporelle et du nombre de jetons par vidéo.
Phenaki
Phenaki permet la génération de vidéos réalistes à partir de textes, offrant une solution innovante aux défis de la vidéo synthèse.
Meilleures alternatives à Phenaki
DiverseShot AI
DiverseShot AI est un outil pour transformer les vidéos en 3D immersives.
Adori
Adori est un outil AI pour transformer blogs en vidéos
Amplifiles
Amplifiles, la plateforme de vidéos courtes IA, booste l'engagement!
ShortsFaceless
Créez des vidéos courtes sans visage de haute qualité grâce à l'IA : automatisez les scripts, les images et les voix off pour gagner du temps et obtenir des résultats professionnels.
Pipio
Pipio: Créez des vidéos professionnelles facilement grâce à l'IA. Gagnez du temps et produisez du contenu de haute qualité.
VidAI
VidAI est un outil AI pour générer des vidéos courtes
GliaStudio
GliaStudio, l'outil d'IA qui révolutionne la création vidéo et simplifie le processus!
Powtoon
Powtoon est une plateforme pour créer des vidéos et des présentations captivantes.
Sendspark
Sendspark est un générateur de scripts vidéo IA pour les ventes
Visla
Visla, c'est l'outil de création et d'édition vidéo AI pour les pros!
BHuman
BHuman est un outil AI pour créer des vidéos personnalisées
Immersive Fox
Immersive Fox est un outil AI pour créer des vidéos multilingues qui aide les entreprises à améliorer leur marketing.
PlayPlay
PlayPlay est un outil de création vidéo pour entreprises
GoEnhance AI
GoEnhance AI est une plateforme de production vidéo polyvalente
HeyGen
HeyGen est un générateur de vidéos AI pour créer et traduire
JoggAI
JoggAI est un générateur de vidéos AI pour créer des publicités
Bytecap
Bytecap est un outil AI pour créer des vidéos sans visage et des sous-titres précis
guidde
guidde est une plateforme d'IA pour créer des vidéos documentaires rapidement
AI STUDIOS
AI STUDIOS est un générateur de vidéo IA avec de nombreuses fonctionnalités
SimilarVideo
SimilarVideo est un générateur de vidéos AI qui facilite la création de contenus marketing.
Dacast
Dacast est une plateforme de streaming vidéo offrant diverses fonctionnalités