Questions et réponses pour le lxml :

lxml est une bibliothèque Python haute performance et complète pour le traitement du XML et du HTML.

8
votes
J'essaie de créer un grattoir Web qui analysera une page Web de publications et extraire les auteurs. La structure squelettique de la page Web est la suivante: import re import ...

6
votes
Je tente actuellement d'analyser itérablement un très grand document HTML (je sais .. yuck) pour réduire la quantité de mémoire utilisée. Le problè ...