J'essaie de gratter une liste HTML en Python pour renvoyer le lien de liste.
Voici le HTML: P>
quotes = [] table = table.find('ul', attrs={'class': 'sub-menu'}) for row in table.find_all('li', attrs={'class'}): quote = {} quote['url'] = row.a['href'] quotes.append(quote) for i in quotes: print(i)
3 Réponses :
Essayez-le:
quotes = [] for row in table.find_all('li'): quote = {} quote['url'] = row.a['href'] quotes.append(quote)
IIUC, vous pouvez essayer ceci: sortie: p> ou si vous voulez des listes séparées: p> sortie: p>
Ceci est juste le moyen de les trouver, mais je ne sais pas comment vous voulez les margeer ou les énumérer.
soup = BeautifulSoup(htmlresponse, 'lxml') links = soup.select('ul.sub-menu li a') for link in links: print('url:', link.get('href')) liclass = soup.select('ul.sub-menu li') for lc in liclass: print(lc.get('class'))
Une fois que vous avez le
LI code>, accédez simplement à l'attraits
[href '] code> de son enfant.
Peut-être que vous aimerez BeauXoup4, vérifiez cela, serait une chose comme B.Find_All ('TR'), puis trouvez ('a'). obtenir ('href')
Hey!, Ce sera bien si vous envisagez d'accepter ou de pervoir une réponse pour récompenser ceux qui vous ont aidé, ou s'il y a quelque chose de mal, vous pouvez aussi laisser un commentaire aussi;) @ryangadsdon