0
votes

Comment accéder à la balise ci-dessous une étiquette d'en-tête (c'est-à-dire

) avec BS4 / Python

J'ai quelques problèmes à entrer dans la balise sous une étiquette d'en-tête (H1, H2, etc.).

Prenez cette page:

https://www.w3schools.com/python/ref_string_split.asp

permet de dire que je veux obtenir le texte dans le "Définition et utilisation" en-tête, xxx

Comment faire référence au bloc

directement sous cette ligne?


0 commentaires

3 Réponses :


0
votes

Vous pouvez sélectionner l'intégralité du bloc-balle qu'il est imbriqué, puis utilisez 2 fonctions .Split (): xxx


0 commentaires

0
votes

Disons que vous soyez capable d'accéder à

définition et utilisation avec soupe.find_all ('h2') [7]

MAINTENANT, l'élément p est un frère à l'élément ci-dessus, qui peut être extrait à l'aide de SOUP.FIND_ALL ('H2') [7] .next_silebling.next_sibling Il en résulte

la split () la méthode divise une chaîne dans une liste.

Remarque: nous utilisons 2 .NExt_sibling depuis le premier frère de sodage à

Définition et utilisation est une nouvelle ligne, c'est-à-dire \ n

Checkout plus sur l'utilisation de l'utilisation de l'officiel Beautiful Doc


0 commentaires

0
votes

Vous pouvez utiliser Find_Next pour obtenir la balise suivante.

p_text_after_h2=p_after_h2.text.replace("\n","")


0 commentaires