Data Version Control (DVC) est une solution open-source conçue pour les projets d'intelligence artificielle, offrant une gestion et un versionnement efficaces des fichiers multimédias tels que les images, l'audio, la vidéo et les textes. Cet outil facilite l'organisation du processus de modélisation en apprentissage automatique (ML) en un workflow reproductible, basé sur les principes GitOps.
DVC permet de gérer des données à grande échelle, en versionnant et en sauvegardant les données, en les connectant au code, en suivant les expériences et en enregistrant les modèles. Il est particulièrement adapté pour le traitement et le versionnement de millions de fichiers dans des stockages cloud, permettant ainsi d'explorer et d'enrichir les ensembles de données.
Avec DVC, il est possible de créer des pipelines qui relient vos ensembles de données versionnés, le code et les modèles pour un suivi efficace des expériences. L'outil permet également de configurer des étapes au fur et à mesure, de suivre les expériences dans Git et de partager de gros fichiers de données et de modèles à côté du code via votre stockage cloud.
DVC est utilisé par des milliers d'utilisateurs et de clients, allant des startups aux entreprises du Fortune 500, pour améliorer la reproductibilité et l'efficacité de leurs projets d'IA.