Sketch to totalnie odjechany asystent do tworzenia kodu dla fanów pandas. Rozumie kontekst danych jak nikt inny i dzięki temu daje mega trafne sugestie. Jego użycie to pestka i nie trzeba instalować dodatkowych pluginów do IDE. Wystarczy rzucić pip install sketch
i jazda!
W ramach demo pokazujemy „standardowy” (hipotetyczny) przepływ pracy z analizą danych, prezentując interfejs w naturalnym języku, który bez problemu ogarnia masę zadań w świecie danych. Jest tu wszystko: katalogowanie danych (np. wykrywanie danych osobowych), tworzenie metadanych, sprzątanie i maskowanie danych, tworzenie i ekstrakcja pochodnych cech, analiza danych i wizualizacja.
Sketch ma w zanadrzu różne bajery. Jest .sketch.ask
, czyli podstawowy system pytanek i odpowiedzi, który sypie odpowiedziami w tekście opartymi na statystykach podsumowujących i opisie danych. . sketch.howto
to podstawowy prompt do pisania kodu, który wyrzuca blok kodu, który można skopiować i użyć jako startowy punkt albo nawet zakończenie dla każdego pytania o dane. . sketch.apply
to bardziej zaawansowany ficzer przydatny do generowania danych.
Sketch korzysta z zajebistych algorytmów przybliżających (dane szkice) do szybkiego podsumowania danych i przekazania tych info do modeli językowych. Teraz robi to poprzez podsumowanie kolumn i zapisanie tych statystyk jako dodatkowy kontekst używany przez prompt do pisania kodu. W przyszłości planują wrzucić te szkice bezpośrednio do customowych modeli bazowych „dane + język”, żeby mieć bardziej dokładne wyniki.