Bonjour, quelqu'un peut-il m'aider à sélectionner un DIV spécifique à partir du contenu d'une page Web.
Disons que je veux obtenir le div avec id = "wrapper_content" code> de Webpage
http://www.test.com/page3.php
.
my code actuel ressemble à ceci: (ne fonctionne pas) p> $ file_content code> ne contient que le div. p> p>
3 Réponses :
HTML n'est pas régulier , donc Vous ne devriez pas utiliser Regex. Au lieu de cela, je recommanderais un analyseur HTML tel que simple HTML DOM ou DOM
Si vous alliez utiliser de simples HTML DOM, vous feriez quelque chose comme ce qui suit: p> < Pré> xxx pré>
même si vous avez utilisé RegEx, votre code ne fonctionnerait toujours pas correctement. Vous devez obtenir le contenu de la page avant de pouvoir utiliser regex. P>
STR_GET_HTML () La fonction n'est pas définie. Pourquoi?
Vérifiez notre hpricot, il vous permet de sélectionner élégamment des sections p>
Tout d'abord, vous utiliseriez CURL pour obtenir le document, puis utilisez HPRICOT pour obtenir la pièce dont vous avez besoin p>
include('simple_html_dom.php'); $html = str_get_html($file_contents); $elem = $html->find('div[id=wrapper_content]', 0); Download simple_html_dom.php