salut je cherche une bibliothèque qui élimine les mots d'arrêt du texte dans javascript code>, mon objectif final est de calculer TF-IDF, puis de convertir le document donné en espace de vecteur, et tout de Ceci est
javascript code>.
Quelqu'un peut-il me dire une bibliothèque qui m'aidera à faire ça. Une bibliothèque pour supprimer les mots d'arrêt serait également super. p>
4 Réponses :
Je pense qu'il n'y a pas de bibliothèques pour une telle chose, vous devez télécharger ces mots à partir de https: // www. rangs.nl/stopwords .
puis remplacez les mots comme suit: p>
Ce lien est maintenant cassé.
Il y a une bibliothèque JavaScript pour supprimer des mots d'arrêt ici: http://geeklad.com/remove -stop-mots-in-javascript p>
Voici un tableau avec des mots stops anglais. J'espère que ça aide. De http://www.ranks.nl/stopwords (mentionné dans la réponse précédente).
En outre, cela pourrait être une ressource utile pour vous. P>
https://github.com/shiffman/a2z-f16/tree/gh-pages/week5-analysis p>
http://shiffman.net/a2z/text-analysis/ p>
Utilisez les mots points d'arrêt fournis par le Bibliothèque NLTK :
I go place things
??? I MENA ME CODE> est dans votre liste de mots d'arrêt, pourquoi a-t-il été montré en résultat?
Ne vérifiait pas les périodes. La période sur ma phrase est gâchée. Correction de la fonction pour gérer maintenant les périodes correctement. Acclamations.
Pourquoi avez-vous besoin d'une bibliothèque pour éliminer les mots d'arrêt? Vous ne pouvez pas simplement les lire à partir d'un fichier texte brut puis, dans une boucle, utiliser
texte = texte.replace (stopword, "") code> pour chaque motopaire?