Questions et réponses pour le html-parsing :

L'analyse HTML est le processus de consommation d'une sérialisation d'un document HTML et de production d'une représentation avec laquelle vous pouvez travailler par programme - par exemple, afin d'en extraire des données. La spécification HTML définit un algorithme standard pour l'analyse HTML, qui est implémenté dans tous les principaux navigateurs.

10
votes
J'ai une feuille Excel avec des cellules contenant HTML. Comment puis-je lotter les convertir en clairexuel? Pour le moment, il y a tellement de tags et de styles inutiles. Je veux l'écrire ...

10
votes
J'utilise Nokogiri pour tirer le et tags, Mais j'ai du mal à obtenir ces problèmes: xxx J'ai ce code: ...

10
votes
J'écris une application qui rampe un groupe de mes pages Web. Plutôt que de prendre tout le code source de la page, je voudrais prendre tout le contenu et stocker cela et pouvoir stoc ...

10
votes
Je commence juste à partir à Perl et j'ai écrit un script simple pour faire une gratte Web. J'utilise www :: Mécaniser et HTML :: TreeBuilder pour faire la plupart des ...