-1
votes

Beautiful de la classe Valeur de la classe Python

im essayant d'extraire des valeurs de la page HTML à l'aide de magnifiquesSoup.

i Mise à jour du code de Jack et il extrait maintenant la note dans les commentaires. Mais j'ai 2 problèmes: 1. Il extrait la note que des 10 premiers avis 2. Je voudrais inclure également la troisième colonne à l'extraction, date, située en haut à gauche de l'examen. Pourriez-vous s'il vous plaît aidez-moi? P>

url = 'https://www.kununu.com/de/allianz-deutschland/kommentare'
page = requests.get(url)

soup = bs(page.text, 'html.parser')
divs = soup.find_all(class_="col-xs-12 col-lg-12")

titles = [] #this initializes a list of titles
badges = [] #this initializes a list of badges
for item in divs[0].find_all('span',class_="rating-title"):
    titles.append(item.text.strip())
for item in divs[0].find_all('span',class_="rating-badge"):
    badges.append(item.text.strip())


my_list = list(zip(titles, badges)) #this takes the two lists, zips them and converts the zip element back to a list
df = pd.DataFrame(my_list, columns = ['rating-title', 'rating-badge'])
print(df)

Output
                    rating-title rating-badge
0              Arbeitsatmosphäre         5,00
1          Vorgesetztenverhalten         2,00
2           Kollegenzusammenhalt         5,00
3          Interessante Aufgaben         4,00
4                  Kommunikation         3,00
..                           ...          ...
125    Gehalt / Sozialleistungen         4,00
126           Arbeitsbedingungen         4,00
127  Umwelt- / Sozialbewusstsein         3,00
128            Work-Life-Balance         5,00
129                        Image         4,00

[130 rows x 2 columns]


1 commentaires

S'il vous plaît poster votre URL, pas une image.


3 Réponses :


0
votes

Vous n'êtes pas allé dans les éléments imbriqués. Vous venez d'attraper et d'imprimer l'élément parent.

print (df)
                          title ratings
0             Arbeitsatmosphäre    3,62
1         Vorgesetztenverhalten    3,49
2          Kollegenzusammenhalt    3,92
3         Interessante Aufgaben    3,78
4                 Kommunikation    3,44
5            Arbeitsbedingungen    3,70
6   Umwelt- / Sozialbewusstsein    3,76
7             Work-Life-Balance    3,54
8            Gleichberechtigung    3,94
9   Umgang mit älteren Kollegen    3,88
10     Karriere / Weiterbildung    3,52
11    Gehalt / Sozialleistungen    3,60
12                        Image    3,80


0 commentaires

0
votes

Les éléments suivants doivent vous procurer les données dans un fichier de données Pandas: xxx

sortie: xxx

etc. < / p>


2 commentaires

Merci Jack. J'ai mis à jour votre code, donc il extrait la note des critiques maintenant. Pourriez-vous s'il vous plaît aider à obtenir des évaluations de plus de 10 avis?


@Codecodecode - Ce code obtient toutes les notes sur cette page (11 maintenant, à l'exclusion de l'image).



0
votes
Name: Arbeitsatmosphäre              Stars:  3,62
Name: Vorgesetztenverhalten          Stars:  3,49
Name: Kollegenzusammenhalt           Stars:  3,92
Name: Interessante Aufgaben          Stars:  3,78
Name: Kommunikation                  Stars:  3,44
Name: Arbeitsbedingungen             Stars:  3,70
Name: Umwelt- / Sozialbewusstsein    Stars:  3,76
Name: Work-Life-Balance              Stars:  3,54
Name: Gleichberechtigung             Stars:  3,94
Name: Umgang mit älteren Kollegen    Stars:  3,88
Name: Karriere / Weiterbildung       Stars:  3,52
Name: Gehalt / Sozialleistungen      Stars:  3,60
Name: Image                          Stars:  3,80

0 commentaires