9
votes

Sélection d'une DIV spécifique à partir d'une page Web externe à l'aide de CURL

Bonjour, quelqu'un peut-il m'aider à sélectionner un DIV spécifique à partir du contenu d'une page Web.

Disons que je veux obtenir le div avec id = "wrapper_content" de Webpage http://www.test.com/page3.php.

my code actuel ressemble à ceci: (ne fonctionne pas) xxx < P> Donc, j'aimerais savoir comment je peux utiliser des expressions de Reg pour trouver un DIV spécifique et comment non défini le reste de la page Web de sorte que $ file_content ne contient que le div.


0 commentaires

3 Réponses :


15
votes

HTML n'est pas régulier , donc Vous ne devriez pas utiliser Regex. Au lieu de cela, je recommanderais un analyseur HTML tel que simple HTML DOM ou DOM

Si vous alliez utiliser de simples HTML DOM, vous feriez quelque chose comme ce qui suit: < Pré> xxx

même si vous avez utilisé RegEx, votre code ne fonctionnerait toujours pas correctement. Vous devez obtenir le contenu de la page avant de pouvoir utiliser regex. xxx


1 commentaires

STR_GET_HTML () La fonction n'est pas définie. Pourquoi?



0
votes

Vérifiez notre hpricot, il vous permet de sélectionner élégamment des sections

Tout d'abord, vous utiliseriez CURL pour obtenir le document, puis utilisez HPRICOT pour obtenir la pièce dont vous avez besoin


0 commentaires

4
votes
include('simple_html_dom.php');
$html = str_get_html($file_contents);
$elem = $html->find('div[id=wrapper_content]', 0);
Download simple_html_dom.php

0 commentaires