1
votes

Comment faire pour que la valeur compte sur certains mots dans un ensemble de données

J'ai deux problèmes

1.) Le besoin d'obtenir la valeur compte pour le nombre de fois qu'un mot apparaît dans mon csv sur les avis des clients. Les mots sur lesquels je veux que la valeur compte sont:

keywords = ["grand", "chapeau", "robe", "tissu", "couleur"]

Le nom de mon dataframe est "shopbop" et la colonne est "review_mo"

2) Souhaite créer une colonne distincte appelée "mots-clés_terms" dans le cadre de données qui renvoie les mots des "mots-clés" apparus dans la cellule "review_mo" et les afficher sous une nouvelle colonne appelée "mots-clés_terms".

Par exemple, si dans la revue, si le mot "grand" et "couleur" était utilisé, j'aimerais que cette ligne correspondante sous les "mots-clés" (grand, couleur) y apparaisse et le fasse pour toutes les lignes où celles-ci des conditions peuvent s'appliquer. Merci!


1 commentaires

Qu'avez-vous essayé? Pourquoi ça ne marche pas?


3 Réponses :


0
votes

1.) Le besoin d'obtenir la valeur compte pour le nombre de fois qu'un mot apparaît dans mon csv sur les avis des clients.

Compteur bon pour vous:

from collections import Counter
cnt = Counter()
for word in ['red', 'blue', 'red', 'green', 'blue', 'blue']:
    cnt[word] += 1
print(cnt)
# {'blue': 3, 'red': 2, 'green': 1}

0 commentaires

1
votes

Vous pouvez faire directement

from collections import Counter

counter = Counter(['red', 'blue', 'red', 'green', 'blue', 'blue'])
print(counter)

sans boucle


0 commentaires

0
votes

Vous pouvez simplement utiliser list.count()

data = ['a', 'a', 'b', 'c', 'd']

print(data.count('a'))


0 commentaires