Conformer-2 : Modèle de reconnaissance vocale à la pointe de la technologie

Conformer

Découvrez Conformer-2, le modèle de reconnaissance vocale révolutionnaire, formé sur 1,1 million d'heures de données audio.

Visiter le Site
Conformer-2 : Modèle de reconnaissance vocale à la pointe de la technologie

Conformer-2 : Un modèle de reconnaissance vocale à la pointe de la technologie

Conformer-2 est le dernier modèle d'IA pour la reconnaissance automatique de la parole, formé sur 1,1 million d'heures de données audio en anglais. Ce modèle améliore les performances de son prédécesseur, Conformer-1, en offrant des améliorations significatives dans la transcription des noms propres, des alphanumériques et une robustesse accrue face au bruit.

Améliorations clés de Conformer-2

1. Performances améliorées

Conformer-2 a enregistré des améliorations notables :

  • 31,7 % d'amélioration sur les alphanumériques
  • 6,8 % d'amélioration sur le taux d'erreur des noms propres
  • 12,0 % d'amélioration de la robustesse au bruit

Ces avancées sont le résultat d'une augmentation des données d'entraînement et d'une meilleure technique d'ensemblage de modèles.

2. Rapidité accrue

La latence de notre pipeline d'inférence a été réduite jusqu'à 53,7 %, permettant des transcriptions plus rapides. Par exemple, le temps de transcription d'un fichier d'une heure est passé de 4,01 minutes à 1,85 minute.

3. Robustesse face au bruit

Conformer-2 a démontré une robustesse accrue face au bruit, surpassant son prédécesseur dans des conditions réelles. Cela permet aux utilisateurs d'appliquer le modèle à des données audio moins propres, ce qui est souvent le cas dans des environnements réels.

Applications de Conformer-2

Les équipes de produits et de développement peuvent tirer parti de Conformer-2 pour créer des applications d'IA générative basées sur des données vocales. Que ce soit pour des centres d'appels, des podcasts ou des webinaires, ce modèle est conçu pour répondre aux besoins des utilisateurs dans des cas d'utilisation réels.

Nouveaux paramètres de l'API

Avec le lancement de Conformer-2, nous introduisons un nouveau paramètre d'API : speech_threshold. Ce paramètre permet aux utilisateurs de définir un seuil pour la proportion de parole dans un fichier audio, afin de contrôler les coûts liés à des fichiers non pertinents.

Conclusion

Conformer-2 est désormais accessible via notre API et représente une avancée majeure dans le domaine de la reconnaissance vocale. Pour essayer Conformer-2, visitez notre Playground ou inscrivez-vous pour obtenir un jeton API gratuit. N'hésitez pas à contacter notre équipe commerciale pour toute question concernant l'intégration de Conformer-2 dans vos produits.

Appel à l'action

Ne manquez pas l'occasion de découvrir les capacités de Conformer-2. Essayez-le dès aujourd'hui et voyez comment il peut transformer vos applications d'IA !

Meilleures Alternatives à Conformer