im essayant d'extraire des valeurs de la page HTML à l'aide de magnifiquesSoup.
i Mise à jour du code de Jack et il extrait maintenant la note dans les commentaires. Mais j'ai 2 problèmes: 1. Il extrait la note que des 10 premiers avis 2. Je voudrais inclure également la troisième colonne à l'extraction, date, située en haut à gauche de l'examen. Pourriez-vous s'il vous plaît aidez-moi? P>
url = 'https://www.kununu.com/de/allianz-deutschland/kommentare' page = requests.get(url) soup = bs(page.text, 'html.parser') divs = soup.find_all(class_="col-xs-12 col-lg-12") titles = [] #this initializes a list of titles badges = [] #this initializes a list of badges for item in divs[0].find_all('span',class_="rating-title"): titles.append(item.text.strip()) for item in divs[0].find_all('span',class_="rating-badge"): badges.append(item.text.strip()) my_list = list(zip(titles, badges)) #this takes the two lists, zips them and converts the zip element back to a list df = pd.DataFrame(my_list, columns = ['rating-title', 'rating-badge']) print(df) Output rating-title rating-badge 0 Arbeitsatmosphäre 5,00 1 Vorgesetztenverhalten 2,00 2 Kollegenzusammenhalt 5,00 3 Interessante Aufgaben 4,00 4 Kommunikation 3,00 .. ... ... 125 Gehalt / Sozialleistungen 4,00 126 Arbeitsbedingungen 4,00 127 Umwelt- / Sozialbewusstsein 3,00 128 Work-Life-Balance 5,00 129 Image 4,00 [130 rows x 2 columns]
3 Réponses :
Vous n'êtes pas allé dans les éléments imbriqués. Vous venez d'attraper et d'imprimer l'élément parent.
print (df) title ratings 0 Arbeitsatmosphäre 3,62 1 Vorgesetztenverhalten 3,49 2 Kollegenzusammenhalt 3,92 3 Interessante Aufgaben 3,78 4 Kommunikation 3,44 5 Arbeitsbedingungen 3,70 6 Umwelt- / Sozialbewusstsein 3,76 7 Work-Life-Balance 3,54 8 Gleichberechtigung 3,94 9 Umgang mit älteren Kollegen 3,88 10 Karriere / Weiterbildung 3,52 11 Gehalt / Sozialleistungen 3,60 12 Image 3,80
Les éléments suivants doivent vous procurer les données dans un fichier de données Pandas: sortie: p> etc. p> < / p>
Merci Jack. J'ai mis à jour votre code, donc il extrait la note des critiques maintenant. Pourriez-vous s'il vous plaît aider à obtenir des évaluations de plus de 10 avis?
@Codecodecode - Ce code obtient toutes les notes sur cette page (11 maintenant, à l'exclusion de l'image).
Name: Arbeitsatmosphäre Stars: 3,62 Name: Vorgesetztenverhalten Stars: 3,49 Name: Kollegenzusammenhalt Stars: 3,92 Name: Interessante Aufgaben Stars: 3,78 Name: Kommunikation Stars: 3,44 Name: Arbeitsbedingungen Stars: 3,70 Name: Umwelt- / Sozialbewusstsein Stars: 3,76 Name: Work-Life-Balance Stars: 3,54 Name: Gleichberechtigung Stars: 3,94 Name: Umgang mit älteren Kollegen Stars: 3,88 Name: Karriere / Weiterbildung Stars: 3,52 Name: Gehalt / Sozialleistungen Stars: 3,60 Name: Image Stars: 3,80
S'il vous plaît poster votre URL, pas une image.