Sketch представляет собой инновационный инструмент для пользователей pandas, который использует искусственный интеллект для написания кода. Этот ассистент способен понимать контекст ваших данных, что позволяет ему предлагать более релевантные решения. Sketch легко интегрируется в ваш рабочий процесс и не требует установки дополнительных плагинов для IDE.
Для начала работы с Sketch достаточно установить его через pip:
pip install sketch
Sketch предлагает несколько функций, которые могут быть полезны на разных этапах работы с данными:
- Data Catalogging: Автоматическое тегирование данных, включая идентификацию PII, и генерация метаданных.
- Data Engineering: Очистка и маскирование данных для обеспечения соответствия требованиям, а также создание и извлечение производных признаков.
- Data Analysis: Ответы на вопросы, связанные с данными, и создание визуализаций.
Пример использования Sketch:
import sketch
# Использование функции ask для получения информации о данных
df.sketch.ask("Какие столбцы имеют целочисленный тип?")
# Использование функции howto для генерации кода
df.sketch.howto("Построить график продаж в зависимости от времени")
# Использование функции apply для генерации новых признаков
df['review_keywords'] = df.sketch.apply("Ключевые слова для отзыва [{{ review_text }}] продукта [{{ product_name }}] (через запятую):")
Sketch использует эффективные алгоритмы аппроксимации для быстрого обобщения ваших данных и передачи этой информации в языковые модели. В будущем планируется интегрировать эти обобщения непосредственно в специализированные модели, что позволит получать ещё более точные результаты.
Sketch — это мощный инструмент для всех, кто работает с данными и ищет способы ускорить и улучшить процесс анализа.