OpenNMT представляет собой открытую экосистему, разработанную для нейронного машинного перевода и обучения нейронных последовательностей. Проект был запущен в декабре 2016 года группой Harvard NLP и компанией SYSTRAN и с тех пор нашел применение в различных исследовательских и промышленных приложениях. В настоящее время проект поддерживается SYSTRAN и Ubiqus.
OpenNMT предлагает реализации в двух популярных фреймворках для глубокого обучения: OpenNMT-py и OpenNMT-tf. OpenNMT-py отличается удобством использования и мультимодальностью, благодаря простоте PyTorch. OpenNMT-tf, с другой стороны, предлагает модульность и стабильность, используя экосистему TensorFlow.
Каждая из реализаций имеет свой набор уникальных функций, но разделяет общие цели: высокую настраиваемость архитектур моделей и процедур обучения, эффективные возможности обслуживания моделей для использования в реальных приложениях, а также расширения для выполнения других задач, таких как генерация текста, тегирование, суммаризация, преобразование изображений в текст и речи в текст.
Экосистема OpenNMT также включает проекты, охватывающие весь рабочий процесс NMT: CTranslate2 — эффективный механизм вывода для моделей Transformer на CPU и GPU, и Tokenizer — быстрая и настраиваемая библиотека токенизации текста с поддержкой BPE и SentencePiece.
OpenNMT является открытой экосистемой для нейронного машинного перевода и распространяется под лицензией MIT.