Гоббл Бот - это крутая штука! Он позволяет вам собрать весь ваш контент, будь то с сайта, PDF-файла или видео на YouTube, и превратить его в один текстовый файл, готовый для использования при обучении GPT. Просто загрузите URL сайта, ссылку на YouTube, перетащите файлы или нажмите, чтобы выбрать. Работает с файлами различных форматов, типа.TXT,.MD,.XSL,.PDF,.DOC и многими другими. Главная фишка - помогает создать GPT (кастомный чатбот ChatGPT), особенно если у вас контент с сайта, видео с YouTube или больше 20 файлов (что превышает текущий лимит загрузки для GPT). Но это небольшой проект, сделанный за выходные, поэтому некоторые моменты могут быть неидеальными. Например, с большими PDF-файлами, ePUB/MOBI и сложными сайтами могут быть проблемы. Разработчик планирует добавить всякие крутые вещи, типа API, аккаунты, подключение к облачным хранилищам (Dropbox и т.д.), автоматическую синхронизацию и параллельную обработку большего количества контента. Если у вас есть вопросы, обращайтесь к автору на rafal.fyi.
Лучшие альтернативы Gobble Bot

Email Signature Parser
Email Signature Parser извлекает контактные данные и отправляет их в различные сервисы

Crawlbase
Crawlbase - All-in-one data crawling platform for developers

Diffbot
Diffbot - крутой инструмент для извлечения веб-данных для разных нужд

Reworkd
Reworkd - автоматизирует извлечение веб-данных, экономит время и средства

Web Scraper
Web Scraper - автоматизирует извлечение данных для всех

ParseHub
ParseHub — это мощный и бесплатный инструмент для веб-скрапинга, который позволяет легко извлекать данные с веб-сайтов без необходимости написания кода.

Datatera.ai
Datatera.ai — это инструмент с искусственным интеллектом, который преобразует файлы и веб-сайты в структурированные данные.

PromptLoop
PromptLoop — это платформа для автоматизации задач с использованием ИИ, позволяющая ускорить исследования и анализ данных.

Thunderbit
Thunderbit — это инструмент автоматизации веб-задач с использованием ИИ, который помогает пользователям автоматизировать рутинные задачи, такие как копирование-вставка, сбор данных и заполнение веб-страниц.

Import.io
Import.io — это платформа для извлечения веб-данных, которая помогает компаниям получать доступ к защищенной информации для анализа рынка.

Bytebot
Bytebot - это AI-инструмент для автоматизации веб-задач без необходимости написания кода, упрощающий сбор данных и заполнение форм.

GoLess
GoLess — это инструмент для автоматизации браузера, который позволяет автоматизировать задачи, такие как сбор данных, заполнение форм и тестирование веб-сайтов, без необходимости написания кода.

UseScraper
UseScraper — это мощный API для быстрого сканирования и извлечения данных с веб-сайтов, поддерживающий HTML, обычный текст и Markdown.

Webtap.ai
Webtap.ai — это мощный инструмент для веб-скрапинга, который позволяет извлекать данные с любого сайта с помощью естественного языка.

Extracto.bot
Extracto.bot — это интеллектуальный веб-скрейпер без необходимости настройки, который помогает автоматически собирать данные с любого сайта.

SCRAP
SCRAP - это AI-ассистент для сбора данных, который автоматизирует процесс извлечения информации с веб-сайтов.

WebScraping.AI
WebScraping.AI предлагает мощный API для веб-скрапинга с поддержкой JavaScript, ротацией прокси и интеллектуальной обработкой HTML.

FlowScraper
FlowScraper — это мощный веб-скрапер с интуитивно понятным конструктором потоков, позволяющий автоматизировать извлечение данных без необходимости написания кода.

Data Donkee
Data Donkee предлагает AI-решения для извлечения веб-данных, упрощая доступ к необходимым данным без необходимости программирования.

SadCaptcha
SadCaptcha - это API для решения капчи TikTok, позволяющее разработчикам автоматизировать обход любых капч с минимальным количеством кода.

Kadoa
Kadoa — это AI-платформа для автоматического извлечения и обработки неструктурированных веб-данных без необходимости написания кода.