cURL, DOMElement et UTF-8

DOMElement et UTF-8 avec cURL
DOMElement et UTF-8 avec cURL

PHP supporte libcurl, une bibliothèque créée par Daniel Stenberg, qui vous permet de vous connecter et de communiquer avec différents types de serveurs, et ce, avec différents types de protocoles. Grâce aux fonctions cURL, on peut recupérer le contenu d’un fichier par le protocole http/https.

Une fonction bien pratique pour le faire :

La fonction retourne le contenu de la page renseignée dans $url.
PHP propose une classe DOMElement permettant d’analyser le contenu HTML retourné par cURL. Seulement, la gestion de l’encodage utf-8 n’est pas pris en charge, donc on convertit le contenu avec la fonction mb_convert_encoding() :

Et hop, on récupère le contenu de l’id #my_id. Bien-sûr, il faut que le site accepte les requêtes cURL, sinon il faudra passer par une solution tel que CorsAnywhere ou phantomJS.

Soumettre un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *