Goutte is een sicke webscraping- en webcrawlingbibliotheek voor PHP. Het biedt een coole API om websites te verkennen en gegevens uit HTML/XML-responsen te plukken. Let op: deze bibliotheek is weliswaar een beetje outdated. Sinds versie 4 is Goutte een simpele proxy geworden voor de HttpBrowser-klasse uit het Symfony BrowserKit-component. Om te migreren, moet je Goutte\Client vervangen door Symfony\Component\BrowserKit\HttpBrowser in je code. Goutte heeft PHP 7.1+ nodig. Om 'm te installeren, voeg je fabpot/goutte als vereiste afhankelijkheid toe aan je composer.json-bestand: composer require fabpot/goutte. Je kunt een Goutte Client-instantie maken (die Symfony\Component\BrowserKit\HttpBrowser uitbreidt): use Goutte\Client; $client = new Client(); Met de request()-methode kun je aanvragen doen: // Naar de symfony.com-website gaan $crawler = $client->request('GET', ''); Deze methode geeft een Crawler-object terug (Symfony\Component\DomCrawler\Crawler). Om je eigen HTTP-instellingen te gebruiken, kun je een HttpClient-instantie maken en aan Goutte geven. Bijvoorbeeld om een timeout van 60 seconden toe te voegen: use Goutte\Client; use Symfony\Component\HttpClient\HttpClient; $client = new Client(HttpClient::create(['timeout' => 60])); Je kunt op links klikken: // Op de "Security Advisories"-link klikken $link = $crawler->selectLink('Security Advisories')->link(); $crawler = $client->click($link); En gegevens extraheren: // Het nieuwste bericht in deze categorie pakken en de titels laten zien $crawler->filter('h2 > a')->each(function ($node) { print $node->text()." "; }); Daarnaast kun je formulieren indienen: $crawler = $client->request('GET', ''); $crawler = $client->click($crawler->selectLink('Inloggen')->link()); $form = $crawler->selectButton('Inloggen')->form(); $crawler = $client->submit($form, ['login' => 'fabpot', 'password' => 'xxxxxx']); $crawler->filter('.flash-error')->each(function ($node) { print $node->text()." "; }); Voor meer info kun je de documentatie van de BrowserKit, DomCrawler en HttpClient Symfony Components checken om te zien wat je nog meer met Goutte kunt doen. Goutte wordt uitgesproken als goot, dus het rijmt op boot en niet op out. Goutte is een dunne wrapper rond de volgende Symfony Components: BrowserKit, CssSelector, DomCrawler en HttpClient. Goutte heeft een MIT-licentie.

FriendsOfPHP/Goutte
Goutte is een fijne PHP-webscraper voor het efficiënt verzamelen van data. Al is 'ie wel wat verouderd.

Beste Alternatieven voor FriendsOfPHP/Goutte

Crawlbase
Crawlbase is een AI-aangedreven webscrapingplatform dat dataverzameling versterkt.

Reworkd
Reworkd is een AI-gedreven webgegevens-extractor die tijd en moeite bespaart

Web Scraper
Web Scraper is een toffe AI-gedreven data-extractietool die tijd bespaart!

ParseHub
ParseHub is een superhandige webscraping-tool waarmee je data moeiteloos verzamelt

BulkGPT
BulkGPT is een AI-gedreven tool voor workflowautomatisering die taken vereenvoudigt.

BrowseGPT
BrowseGPT is een coole AI-browserautomatiseringstool waarmee je opdrachten geeft

Datatera.ai
Datatera.ai is een toffe AI-aangedreven webscrapingtool die data-extractie simpel maakt.

Horseman
Horseman is een toffe AI-aangedreven webcrawler met allerlei mogelijkheden

Thunderbit
Thunderbit is een geweldige AI-aangedreven webautomatiseringstool die tijd bespaart

Import.io
Import.io is een AI-aangedreven webgegevensextractietool die tijd bespaart en nauwkeurigere gegevens levert.

Bytebot
Bytebot is een AI-aangedreven webautomatiseringstool die taken vereenvoudigt

Goless
Goless is een toffe AI-gedreven webautomatiseringstool die alles simpeler maakt

Rapture Parser
Rapture Parser is een AI-aangedreven webschrapingtool die data-extractie vereenvoudigt

UseScraper
UseScraper is een toffe webscraper en crawler met diverse outputformaten

Octoparse CEM
Octoparse CEM is een toffe AI-tool die klantervaringen naar een hoger niveau tilt.

Webtap.ai
Webtap.ai is een AI-aangedreven webschraper waarmee je eenvoudig data verzamelt

Extracto.bot
Extracto.bot is een sicke AI-webscraper die dataverzameling easy maakt

Scrap.so
Scrap.so is een AI-aangedreven dataverzamelaar voor diverse behoeften

WebScraping.AI
WebScraping.AI is een krachtige AI-aangedreven webscraping-API met diverse functies

FlowScraper
FlowScraper is een sicke AI-aangedreven webscraper voor makkelijke data-extractie

FriendsOfPHP/Goutte
Goutte is een toffe PHP-webscraper om data van webpagina's te halen