Bark : Un modèle audio génératif textuel
Bark est un modèle audio génératif basé sur des transformateurs, développé par Suno. Il permet de créer des discours réalistes et multilingues, ainsi que d'autres types d'audio (musique, effets sonores). Il prend en charge plusieurs langues et détermine automatiquement la langue d'entrée. C'est un modèle entièrement génératif qui convertit directement le texte en audio. Il dispose de plus de 100 préréglages de voix pour adapter le ton, la hauteur et l'émotion. Pour l'installer, on recommande d'utiliser certaines commandes et on peut trouver un exemple de code Python pour générer de l'audio à partir d'un texte. Bark peut également générer de la musique. Par rapport à d'autres outils, Bark a des avantages tels que la génération audio multilingue, la flexibilité et une communauté active. Cependant, il a quelques inconvénients, notamment l'absence de clonage vocal personnalisé et une qualité variable de l'audio. Pour plus d'informations, on peut visiter le dépôt GitHub de Bark.