RLlib - библиотека для обучения с подкреплением
RLlib - это открытая библиотека для RL, которая поддерживает производственные нагрузки. Имеет унифицированный и простой API для разных приложений. Её особенности:
- Высокая распределенность, что ускоряет обучение на сотнях ЦП/узлов.
- Поддержка многопользовательского обучения с подкреплением (MARL).
- Поддержка внешних симуляторов.
- Предлагает алгоритмы оффлайн RL и имитационного обучения.
Установка осуществляется командой:
pip install "ray[rllib]" tensorflow torch
Для компьютеров с Apple Silicon нужно смотреть инструкции на официальном сайте. Пример использования - запуск алгоритма PPO в среде Taxi. RLlib уже используется в разных областях. Рекомендуется попробовать ее в проектах по обучению с подкреплением.