im essayant d'extraire des valeurs de la page HTML à l'aide de magnifiquesSoup.
i Mise à jour du code de Jack et il extrait maintenant la note dans les commentaires. Mais j'ai 2 problèmes: 1. Il extrait la note que des 10 premiers avis 2. Je voudrais inclure également la troisième colonne à l'extraction, date, située en haut à gauche de l'examen. Pourriez-vous s'il vous plaît aidez-moi? P>
url = 'https://www.kununu.com/de/allianz-deutschland/kommentare'
page = requests.get(url)
soup = bs(page.text, 'html.parser')
divs = soup.find_all(class_="col-xs-12 col-lg-12")
titles = [] #this initializes a list of titles
badges = [] #this initializes a list of badges
for item in divs[0].find_all('span',class_="rating-title"):
titles.append(item.text.strip())
for item in divs[0].find_all('span',class_="rating-badge"):
badges.append(item.text.strip())
my_list = list(zip(titles, badges)) #this takes the two lists, zips them and converts the zip element back to a list
df = pd.DataFrame(my_list, columns = ['rating-title', 'rating-badge'])
print(df)
Output
rating-title rating-badge
0 Arbeitsatmosphäre 5,00
1 Vorgesetztenverhalten 2,00
2 Kollegenzusammenhalt 5,00
3 Interessante Aufgaben 4,00
4 Kommunikation 3,00
.. ... ...
125 Gehalt / Sozialleistungen 4,00
126 Arbeitsbedingungen 4,00
127 Umwelt- / Sozialbewusstsein 3,00
128 Work-Life-Balance 5,00
129 Image 4,00
[130 rows x 2 columns]
3 Réponses :
Vous n'êtes pas allé dans les éléments imbriqués. Vous venez d'attraper et d'imprimer l'élément parent.
print (df)
title ratings
0 Arbeitsatmosphäre 3,62
1 Vorgesetztenverhalten 3,49
2 Kollegenzusammenhalt 3,92
3 Interessante Aufgaben 3,78
4 Kommunikation 3,44
5 Arbeitsbedingungen 3,70
6 Umwelt- / Sozialbewusstsein 3,76
7 Work-Life-Balance 3,54
8 Gleichberechtigung 3,94
9 Umgang mit älteren Kollegen 3,88
10 Karriere / Weiterbildung 3,52
11 Gehalt / Sozialleistungen 3,60
12 Image 3,80
Les éléments suivants doivent vous procurer les données dans un fichier de données Pandas: sortie: p> etc. p> < / p>
Merci Jack. J'ai mis à jour votre code, donc il extrait la note des critiques maintenant. Pourriez-vous s'il vous plaît aider à obtenir des évaluations de plus de 10 avis?
@Codecodecode - Ce code obtient toutes les notes sur cette page (11 maintenant, à l'exclusion de l'image).
Name: Arbeitsatmosphäre Stars: 3,62 Name: Vorgesetztenverhalten Stars: 3,49 Name: Kollegenzusammenhalt Stars: 3,92 Name: Interessante Aufgaben Stars: 3,78 Name: Kommunikation Stars: 3,44 Name: Arbeitsbedingungen Stars: 3,70 Name: Umwelt- / Sozialbewusstsein Stars: 3,76 Name: Work-Life-Balance Stars: 3,54 Name: Gleichberechtigung Stars: 3,94 Name: Umgang mit älteren Kollegen Stars: 3,88 Name: Karriere / Weiterbildung Stars: 3,52 Name: Gehalt / Sozialleistungen Stars: 3,60 Name: Image Stars: 3,80
S'il vous plaît poster votre URL, pas une image.