Goutte - Super PHPowy Skrobacz Stron z GitHub

FriendsOfPHP/Goutte

Goutte to prosty skrobacz stron dla PHP. Przeszukuje i wyciąga dane, ale jest już trochę przestarzały. Czytaj więcej!

Goutte - Super PHPowy Skrobacz Stron z GitHub

Goutte to prosta biblioteka do skrobania stron internetowych i pełzania po sieci dla PHP. Ma świetne API do przemierzania stron i wyciągania danych z odpowiedzi HTML/XML. Ale uwaga! Ta biblioteka jest już trochę przestarzała. Od wersji v4 Goutte stał się prostym łącznikiem do klasy HttpBrowser z komponentu Symfony BrowserKit. Żeby się przenieść, trzeba zamienić Goutte\Client na Symfony\Component\BrowserKit\HttpBrowser w swoim kodzie. Goutte wymaga PHP 7.1+. Żeby zainstalować, trzeba dodać fabpot/goutte jako wymaganą zależność w pliku composer.json: composer require fabpot/goutte. Można stworzyć instancję klienta Goutte (który rozszerza Symfony\Component\BrowserKit\HttpBrowser): use Goutte\Client; $client = new Client(); Potem można robić zapytania za pomocą metody request(): // Przejdź na stronę symfony.com/blog/ $crawler = $client->request('GET', ''). Ta metoda zwraca obiekt Crawler (Symfony\Component\DomCrawler\Crawler). Żeby użyć własnych ustawień HTTP, można stworzyć i przekazać instancję HttpClient do Goutte. Na przykład, żeby dodać timeout 60 sekund: use Goutte\Client; use Symfony\Component\HttpClient\HttpClient; $client = new Client(HttpClient::create(['timeout' => 60])); Można też klikać w linki: // Kliknij w link "Security Advisories" $link = $crawler->selectLink('Security Advisories')->link(); $crawler = $client->click($link); Wyciąganie danych: // Pobierz najnowszy post w tej kategorii i wyświetl tytuły $crawler->filter('h2 > a')->each(function ($node) { print $node->text()." "; }); Można też wysyłać formularze: $crawler = $client->request('GET', ''); $crawler = $client->click($crawler->selectLink('Sign in')->link()); $form = $crawler->selectButton('Sign in')->form(); $crawler = $client->submit($form, ['login' => 'fabpot', 'password' => 'xxxxxx']); $crawler->filter('.flash-error')->each(function ($node) { print $node->text()." "; }); Żeby dowiedzieć się więcej, trzeba przeczytać dokumentację komponentów BrowserKit, DomCrawler i HttpClient Symfony, żeby poznać więcej o tym, co można zrobić z Goutte. Goutte wymawia się jako goot, czyli rymuje się z boot, a nie out. To cienka warstwa wokół następujących komponentów Symfony: BrowserKit, CssSelector, DomCrawler i HttpClient. Jest licencjonowana na licencji MIT.

Najlepsze Alternatywy dla FriendsOfPHP/Goutte

Crawlbase

Crawlbase

Crawlbase to zajebista platforma do web scrapingu i crawlingu, która ułatwia ekstrakcję danych

Reworkd

Reworkd

Reworkd to zajebiste narzędzie do ekstrakcji danych z sieci, które oszczędza czas i kasę

ParseHub

ParseHub

ParseHub to darmowe narzędzie do web scrapingu, łatwe w użyciu

BulkGPT

BulkGPT

BulkGPT to zajebiste narzędzie zasilane AI, które upraszcza automatyzację przepływu pracy i bezproblemowe web scraping.

BrowseGPT

BrowseGPT

BrowseGPT to automatyzacja przeglądarki z wykorzystaniem AI

Datatera.ai

Datatera.ai

Datatera.ai to narzędzie przekształcające pliki i strony w dane strukturalne

Horseman

Horseman

Horseman to narzędzie zintegrowane z GPT, ułatwiające przeszukiwanie sieci

Thunderbit

Thunderbit

Thunderbit to zajebiste narzędzie do automatyzacji sieci z AI, które oszczędza czas i wysiłek

Import.io

Import.io

Import.io to specjalistyczne narzędzie do ekstrakcji danych z sieci

Bytebot

Bytebot

Bytebot to zajebiste narzędzie do automatyzacji sieci bez kodowania!

Goless

Goless

Goless to zajebiste narzędzie do automatyzacji przeglądarki, które ułatwia życie

Rapture Parser

Rapture Parser

Rapture Parser to potężne narzędzie do web scrapingu, ułatwiające ekstrakcję danych

UseScraper

UseScraper

UseScraper to zajebiste narzędzie do web scrapingu i crawlingu, które działa szybciutko i skutecznie

Octoparse CEM

Octoparse CEM

Octoparse CEM to narzędzie zasilane AI, które optymalizuje doświadczenia klientów.

Webtap.ai

Webtap.ai

Webtap.ai - AI-driven web scraper for easy data grabs

Extracto.bot

Extracto.bot

Extracto.bot to inteligentny skrobacz stron bez konfiguracji, ułatwiający zbieranie danych

Scrap.so

Scrap.so

Scrap.so to zajebiste AI do zbierania danych!

WebScraping.AI

WebScraping.AI

WebScraping.AI to potężne API do web scrapingu z funkcjami AI

FlowScraper

FlowScraper

FlowScraper to potężny skrobacz stron bez wymogu kodowania

FriendsOfPHP/Goutte

FriendsOfPHP/Goutte

Goutte to zajebisty PHPowy skrobacz stron z fajnym API

Data Donkee

Data Donkee

Data Donkee to AI-zasilane narzędzie do ekstrakcji danych bez kodowania

Polecane Narzędzia

AgentGPT

AgentGPT

AgentGPT to narzędzie pozwalające zarządzać kontem i zapisywać agentów

Zobacz Szczegóły
Octoparse

Octoparse

Octoparse to bezkodowe rozwiązanie do automatyzacji web scrapingu

Zobacz Szczegóły
Puppeteer

Puppeteer

Puppeteer to biblioteka JavaScript kontrolująca przeglądarki

Zobacz Szczegóły
Copyfish

Copyfish

Copyfish to bezpłatne OCR, pozwalające wyodrębnić tekst z obrazów

Zobacz Szczegóły
Mozenda

Mozenda

Mozenda to super narzędzie do ekstrakcji danych z sieci, które ułatwia życie!

Zobacz Szczegóły
Beautiful Soup

Beautiful Soup

Beautiful Soup to zajebista biblioteka Python dla screen-scrapingu

Zobacz Szczegóły
ScrapingBee

ScrapingBee

ScrapingBee to zajebiste API do web scrapingu, które ułatwia wyciąganie danych

Zobacz Szczegóły
Scrapy

Scrapy

Scrapy to open-source'owy framework do web scrapingu, który ułatwia wyciąganie danych z witryn.

Zobacz Szczegóły