J'ai cherché et essayé plusieurs solutions à ce problème, mais aucun d'entre eux n'a travaillé: J'ai ce HTML
<div class="detalhes_colunadados"> <div class="detalhescolunadados_blocos"> <h5>Descrição completa</h5> Sala de estar/jantar,2 vagas de garagem cobertas.<br> </div> <div class="detalhescolunadados_blocos"> <h5>Valores</h5> Venda: R$ 600.000,00<br> CondomÃnio: R$ 660,00<br> </div> </div>
3 Réponses :
Il me semble que cela fonctionne:
//div[@class="detalhescolunadados_blocos"]/text()
Essayez de faire ceci:
//div[@class="detalhes_colunadados"]/div/text()
Essayez l'expression XPath suivante:
$ xmllint --html --shell so.html / > xpath //div[@class='detalhescolunadados_blocos'][1]//text()[not(ancestor::h5)] Object is a Node Set : Set contains 2 nodes: 1 TEXT content= 2 TEXT content= Sala de estar/jantar,2 vagas de gar...
Pourquoi ne pas utiliser xmllint --html --xpath '// foo' file.html code>? =)
Merci de me faire remarquer l'option - xpath code>. C'est en fait sans papiers.
Merci beaucoup, j'oublisais que la partie de texte est l'enfant de H5, je incluse essayé // texte () [non (auto :: h5)].
Je ne suis pas bon chez XPath, mais je sais que pour l'extraction du texte que vous devez utiliser la fonction de texte () ...