0
votes

Web raclant une liste HTML avec python

J'essaie de gratter une liste HTML en Python pour renvoyer le lien de liste.

Voici le HTML: P>

quotes = []

table = table.find('ul', attrs={'class': 'sub-menu'})

for row in table.find_all('li', attrs={'class'}):
    quote = {}
    quote['url'] = row.a['href']
    quotes.append(quote)

for i in quotes:
   print(i)


3 commentaires

Une fois que vous avez le LI , accédez simplement à l'attraits [href '] de son enfant.


Peut-être que vous aimerez BeauXoup4, vérifiez cela, serait une chose comme B.Find_All ('TR'), puis trouvez ('a'). obtenir ('href')


Hey!, Ce sera bien si vous envisagez d'accepter ou de pervoir une réponse pour récompenser ceux qui vous ont aidé, ou s'il y a quelque chose de mal, vous pouvez aussi laisser un commentaire aussi;) @ryangadsdon


3 Réponses :


0
votes

Essayez-le:

quotes = []

for row in table.find_all('li'):
    quote = {}
    quote['url'] = row.a['href']
    quotes.append(quote)


0 commentaires

0
votes

IIUC, vous pouvez essayer ceci: xxx

sortie: xxx


ou si vous voulez des listes séparées: xxx

sortie: xxx


0 commentaires

0
votes

Ceci est juste le moyen de les trouver, mais je ne sais pas comment vous voulez les margeer ou les énumérer.

soup = BeautifulSoup(htmlresponse, 'lxml')
links = soup.select('ul.sub-menu li a')
for link in links:
    print('url:', link.get('href'))
liclass = soup.select('ul.sub-menu li')
for lc in liclass:
    print(lc.get('class'))


0 commentaires