J'ai quelques problèmes à entrer dans la balise sous une étiquette d'en-tête (H1, H2, etc.).
Prenez cette page: p>
https://www.w3schools.com/python/ref_string_split.asp P>
permet de dire que je veux obtenir le texte dans le "Définition et utilisation" en-tête, p> Comment faire référence au bloc code> directement sous cette ligne? p> p >
3 Réponses :
Vous pouvez sélectionner l'intégralité du bloc-balle qu'il est imbriqué, puis utilisez 2 fonctions .Split ():
Disons que vous soyez capable d'accéder à MAINTENANT, l'élément la Remarque: nous utilisons 2 Checkout plus sur l'utilisation de l'utilisation de l'officiel Beautiful Doc A > p>
définition et utilisation h2> code> avec
soupe.find_all ('h2') [7] code> p >
p code> est un frère à l'élément ci-dessus, qui peut être extrait à l'aide de
SOUP.FIND_ALL ('H2') [7] .next_silebling.next_sibling code>
Il en résulte P>
split () code> la méthode divise une chaîne dans une liste. p> code> p> p> P>
.NExt_sibling code> depuis le premier frère de sodage à
Définition et utilisation h2> code> est une nouvelle ligne, c'est-à-dire
\ n Code> p>
Vous pouvez utiliser Find_Next pour obtenir la balise suivante.
p_text_after_h2=p_after_h2.text.replace("\n","")