Sketch: AI Code-Writing Assistant Understanding Data Content
Sketch là một trợ lý viết mã AI dành cho người dùng pandas, nó có khả năng hiểu nội dung dữ liệu của bạn, từ đó làm tăng đáng kể độ liên quan của các gợi ý.
Khởi động và Sử dụng Nhanh chóng
Sketch có thể được sử dụng chỉ trong vài giây và không yêu cầu thêm bất kỳ plugin nào cho môi trường phát triển统合 (IDE) của bạn. Bạn chỉ cần cài đặt thông qua lệnh pip install sketch
và sau đó có thể bắt đầu sử dụng ngay.
Các Giao diện và Hành động
- .sketch.ask: Đây là một hệ thống trả lời câu hỏi cơ bản trên Sketch. Nó sẽ trả về một câu trả lời dưới dạng văn bản dựa trên các thống kê tóm tắt và mô tả của dữ liệu. Bạn có thể sử dụng nó để hiểu về dữ liệu, tìm tên cột tốt hơn, đặt các giả thiết (ví dụ: làm thế nào để thực hiện X với dữ liệu này) và nhiều hơn nữa. Ví dụ:
df.sketch.ask("Which columns are integer type?")
sẽ trả về các cột có kiểu dữ liệu là số nguyên. - .sketch.howto: Đây là gợi ý "viết mã" cơ bản trong Sketch. Nó sẽ trả về một khối mã mà bạn có thể sao chép và sử dụng như một điểm khởi đầu (hoặc có thể là điểm kết thúc!) cho bất kỳ câu hỏi nào bạn muốn đặt cho dữ liệu. Bạn có thể sử dụng nó để hỏi cách làm sạch dữ liệu, chuẩn hóa, tạo các đặc điểm mới, vẽ biểu đồ và thậm chí xây dựng các mô hình. Ví dụ:
df.sketch.howto("Plot the sales versus time")
sẽ trả về mã để vẽ biểu đồ doanh thu theo thời gian. - .sketch.apply: Đây là một gợi ý nâng cao hơn, hữu ích hơn cho việc tạo dữ liệu. Bạn có thể sử dụng nó để phân tích các trường, tạo các đặc điểm mới và nhiều hơn nữa. Để sử dụng nó, bạn cần thiết lập một tài khoản miễn phí với OpenAI và đặt biến môi trường với khóa API của bạn. Ví dụ:
OPENAI_API_KEY=YOUR_API_KEY df['review_keywords'] = df.sketch.apply("Keywords for the review [{{ review_text }}] of product [{{ product_name }}] (comma separated):")
Cách Hoạt động Sketch sử dụng các thuật toán ước tính hiệu quả (data sketches) để nhanh chóng tóm tắt dữ liệu của bạn và đưa thông tin đó vào các mô hình ngôn ngữ. Hiện tại, nó tóm tắt các cột và viết các thống kê tóm tắt này như là ngữ cảnh bổ sung để được sử dụng bởi gợi ý viết mã.
Tùy chọn Sử dụng Bạn có thể sử dụng trực tiếp một vài mô hình Hugging Face đã được xây dựng trước (hiện tại là MPT-7B và StarCoder), chúng sẽ chạy hoàn toàn cục bộ (khi bạn tải trọng số của mô hình từ HF). Để làm điều này, bạn cần thiết lập 3 biến môi trường:
os.environ['LAMBDAPROMPT_BACKEND'] = 'StarCoder'
os.environ['SKETCH_USE_REMOTE_LAMBDAPROMPT'] = 'False'
os.environ['HF_ACCESS_TOKEN'] = 'your_hugging_face_token'
Bạn cũng có thể gọi trực tiếp OpenAI (và không sử dụng điểm cuối của chúng ta) bằng cách sử dụng khóa API của riêng bạn. Để làm điều này, bạn cần thiết lập 2 biến môi trường:
SKETCH_USE_REMOTE_LAMBDAPROMPT=False
OPENAI_API_KEY=YOUR_API_KEY
Sketch đang ngày càng phát triển và mang lại nhiều giá trị cho người dùng trong quá trình viết mã và làm việc với dữ liệu tabular.