Cosine Genie представляет собой инновационную модель искусственного интеллекта, разработанную для задач программной инженерии. Она установила мировой рекорд по тесту SWE-Bench, который оценивает способности крупных языковых моделей в различных задачах разработки программного обеспечения. С результатом 30,08%, Genie значительно опережает другие модели, такие как Factory Code Droid (19,27%) и AutoCodeRover (18,83%).
SWE-Bench — это комплексный тест, предназначенный для оценки навыков программирования и решения задач, с которыми сталкиваются разработчики программного обеспечения. Genie демонстрирует исключительные способности благодаря интеграции человеческого мышления в свои обучающие данные, что обеспечивает её непревзойдённую интуицию в области программной инженерии.
Genie является частью экспериментальной программы доступа OpenAI и предлагает уникальные возможности для разработчиков, желающих использовать передовые технологии ИИ в своих проектах. Модель доступна для тестирования, и команда Cosine AI приглашает разработчиков поделиться своими идеями и проектами, чтобы увидеть, как Genie может помочь в их реализации.
Для получения дополнительной информации о технических аспектах и результатах тестирования Genie, можно ознакомиться с техническим отчётом, доступным на сайте Cosine AI.