10
votes

Comment déterminer le sujet, l'objet et d'autres mots?

J'essaie de mettre en œuvre une application capable de déterminer le sens de la phrase, en la divisant en pièces plus petites. J'ai donc besoin de savoir quels mots sont soumis, objet, etc. afin que mon programme puisse savoir comment gérer cette phrase.


0 commentaires

5 Réponses :


2
votes

Je suppose qu'il n'y a pas de "simple" de faire cela. Vous devez construire un analyseur linguistique (ce qui est tout à fait possible), cependant, une langue comme beaucoup de cas exceptionnels. Et c'est ce qui fait de la mise en œuvre d'un analyseur linguistique difficile.


0 commentaires

9
votes

Vous devriez regarder le Toolkit de langue naturelle , qui est exactement ce genre de chose.

Voir cette section du manuel: catégorisation et marquage des mots - voici un extrait: xxx

"Ici, nous voyons que et est CC, une conjonction de coordination; maintenant et complètement sont rb ou adverbes; pour est dans, une préposition; quelque chose est nn, un nom; et différent est JJ, un adjectif. "


1 commentaires

NLTK est une bonne ressource pour ce genre de chose, mais le marquage partiel de la parole ne donne pas assez d'informations grammaticales pour distinguer les rôles de sujet / objet. Je pense que le chapitre 8 du manuel (analyse de la structure de la phrase) serait plus approprié.



11
votes

Ceci est un problème de recherche ouvert. Vous pouvez avoir une vue d'ensemble sur Wikipedia, http://fr.wikipedia.org/wiki/natural_language_processing . Considérons des phrases telles que "les mouches de temps comme une flèche, des mouches de fruits comme une banane" - des mots classifiants sans ambiguïté ne sont pas faciles.


0 commentaires

2
votes

Le problème spécifique que vous mentionnez, l'identification du sujet et des objets d'une clause est accompli par Syntaxtic analysant . Vous pouvez avoir une bonne idée de la façon dont les travaux d'analyse en utilisant Cette démo de logiciel d'analyse développé par Université Stanford.

Cependant, l'analyse syntaxique ne détermine pas l'affirmation d'une phrase, seule sa structure. Détermination du sens (sémantique) est un problème très difficile en général et il n'y a pas de technologie qui peut vraiment «comprendre» une phrase de la même manière qu'un serait humain. Bien qu'il n'y ait pas de solution générale, vous pourrez peut-être faire quelque chose dans un domaine de sujet très restreint. Par exemple, les données que vous souhaitez analyser sur un sujet étroit avec un ensemble limité de «choses» que les gens parlent?


0 commentaires

2
votes

STOMPCHICKEN a donné la bonne réponse à cette question, mais j'aimerais ajouter que les concepts de sujet et d'objet sont appelés relations grammaticales, et que Briscoe et Carroll's RASP est un analyseur qui peut aller à l'étape supplémentaire de déduire une liste de relations de l'analyse.

Voici un exemple de sortie de leur Démo Page . C'est un extrait de la production d'une phrase qui commence "Nous décrivons une approche robuste précise indépendante du domaine ...":

(| ncsubj | | décrire: 2_vv0 | | Nous: 1_ppis2 | _)
(| Dobj | | Décrivez: 2_vvv0 | | Approche: 7_nn1 |)


0 commentaires