OpenNMTは、ニューラル機械翻訳(NMT)とニューラルシーケンス学習のための包括的なオープンソースエコシステムです。2016年12月にHarvard NLPグループとSYSTRANによって開始され、以来、数多くの研究および産業アプリケーションで使用されています。現在はSYSTRANとUbiqusによってメンテナンスされています。
OpenNMTは、2つの主要なディープラーニングフレームワークで実装されています。OpenNMT-pyは、PyTorchの使いやすさを活かしたユーザーフレンドリーでマルチモーダルな実装です。一方、OpenNMT-tfは、TensorFlowエコシステムを活用したモジュール式で安定した実装を提供します。
各実装には独自の特徴がありますが、以下の共通の目標を共有しています:
- 高度に設定可能なモデルアーキテクチャとトレーニング手順
- 実世界のアプリケーションで使用するための効率的なモデルサービング機能
- テキスト生成、タグ付け、要約、画像からテキスト、音声からテキストなどの他のタスクを可能にする拡張機能
OpenNMTエコシステムは、完全なNMTワークフローをカバーするプロジェクトも含んでいます。CTranslate2は、CPUとGPU上のTransformerモデルのための効率的な推論エンジンです。Tokenizerは、BPEとSentencePieceサポートを備えた高速でカスタマイズ可能なテキストトークン化ライブラリです。
OpenNMTはMITライセンスの下で提供されており、ニューラル機械翻訳のためのオープンソースエコシステムとして、研究と産業の両方で広く使用されています。