Je fais un projet dans lequel je dois lire un fichier HTML et identifier des balises spécifiques, modifier le contenu de la balise et créer un nouveau fichier HTML. Y a-t-il une bibliothèque qui analyse des balises HTML et est capable d'écrire les balises à un nouveau fichier? P>
4 Réponses :
regarde http://java-source.net/open-source/html- analyseurs pour une liste de bibliothèques Java qui analysent les fichiers HTML dans des objets Java pouvant être manipulés. P>
Si les fichiers HTML que vous utilisez sont bien formés (XHTML), vous pouvez également utiliser des bibliothèques XML dans Java pour trouver des balises particulières et les modifier. L'IO elle-même devrait être traitée par les bibliothèques que vous utilisez. p>
Si vous choisissez d'analyser manuellement les chaînes, vous pouvez utiliser des expressions régulières pour trouver des balises particulières et utiliser les bibliothèques Java IO pour écrire dans les fichiers et créer de nouveaux documents HTML. Mais cette méthode réinvente la roue afin de parler car vous devez gérer l'ouverture et la fermeture de balises et toutes ces choses sont gérées par des bibliothèques préexistantes. P>
Si vous souhaitez modifier la page Web et renvoyer le contenu modifié, je suis le meilleur moyen d'utiliser la transformation XSL.
http://fr.wikipedia.org/wiki/xslt P>
Je suppose que c'était ce que j'attendais avec impatience. Je dois générer des rapports et le présenter dans le format que l'utilisateur souhaite que cela soit présenté.
J'utilise actuellement le processeur Xalan et le code travaille magnifiquement. Voici le lien pour le processeur xml.apache.org/xalan-j
Consultez http://jsoup.org , il a une API amicale de type DOM, pour des tâches simples que vous donez Il faut analyser le HTML. P>