Je veux recevoir des noms d'un site Web dans une liste.
soup = bs4.BeautifulSoup(page.text, 'html.parser')
tbl = soup.find('ul', class_='static-top-names part1')
for link in tbl:
names = link.get_text()
print(names)
3 Réponses :
Si le format est toujours #. Nom code>, vous pouvez alors procéder comme suit: p>
nom.split ('.', 1) [1] code> p>
Vous pouvez simplement diviser avec '.' personnage de points ou même un espace s'il y a un espace avant le nom. P>
SO quelque chose comme ça. p>
Ce sera la liste des noms de juste, j'ai utilisé nom.split ('') [- 1] code> nom.split ('.') [- 1] code> donnerait simplement le nom. Ensuite, vous pouvez ajouter ces noms dans une liste. P>
noms = [link.get_text (). Split ('') [- 1] pour le lien dans TBL] CODE> P>
[- 1] code> comme indice de liste après que votre texte ne contient que deux éléments après la division avec de l'espace. Donc, s'il y a plus d'articles, veuillez utiliser l'index approprié. p>
Utilisez une expression régulière pour la cohérence.
new_list = [re.sub('\d+.','',s) for s in original_list]