7
votes

Suppression de mot d'arrêt en JavaScript

salut je cherche une bibliothèque qui élimine les mots d'arrêt du texte dans javascript , mon objectif final est de calculer TF-IDF, puis de convertir le document donné en espace de vecteur, et tout de Ceci est javascript . Quelqu'un peut-il me dire une bibliothèque qui m'aidera à faire ça. Une bibliothèque pour supprimer les mots d'arrêt serait également super.


1 commentaires

Pourquoi avez-vous besoin d'une bibliothèque pour éliminer les mots d'arrêt? Vous ne pouvez pas simplement les lire à partir d'un fichier texte brut puis, dans une boucle, utiliser texte = texte.replace (stopword, "") pour chaque motopaire?


4 Réponses :


5
votes

Je pense qu'il n'y a pas de bibliothèques pour une telle chose, vous devez télécharger ces mots à partir de https: // www. rangs.nl/stopwords .

puis remplacez les mots comme suit: xxx


1 commentaires

Ce lien est maintenant cassé.



1
votes

Il y a une bibliothèque JavaScript pour supprimer des mots d'arrêt ici: http://geeklad.com/remove -stop-mots-in-javascript


0 commentaires

2
votes

Voici un tableau avec des mots stops anglais. J'espère que ça aide. De http://www.ranks.nl/stopwords (mentionné dans la réponse précédente).

En outre, cela pourrait être une ressource utile pour vous.

https://github.com/shiffman/a2z-f16/tree/gh-pages/week5-analysis

http://shiffman.net/a2z/text-analysis/ xxx


0 commentaires

9
votes

Utilisez les mots points d'arrêt fournis par le Bibliothèque NLTK :

I go place things


2 commentaires

??? I MENA ME est dans votre liste de mots d'arrêt, pourquoi a-t-il été montré en résultat?


Ne vérifiait pas les périodes. La période sur ma phrase est gâchée. Correction de la fonction pour gérer maintenant les périodes correctement. Acclamations.