11
votes

Reconnaissance linguistique en Java

Y a-t-il une reconnaissance de la langue open source pour Java? Trouvé uniquement pour C / C ++.

upding:

Je parle de la langue du texte humain. Exemple:

Entrée: je m'appelle John. Sortie: Anglais.

Entrée: ich Heisse John. Sortie: allemand.

entrée: меня зовут джон. Sortie: russe.


2 commentaires

S'il vous plaît dites-nous quel type de logiciel vous voulez. Devrait-il s'agir d'un automate formel, reconnaissant si une chaîne est dans une langue formelle particulière? Devrait-il dire quelle langue humaine un texte est dans? Dites quelle langue du code source est écrit? Dites quelle langue certains exécutables auraient pu être écrites? Reconnaître si des sons sont des mots ou des bruits juste? Reconnaître ce que les gens de la langue parlent?


Peu piquée, mais a dû -1 car aucun effort de recherche n'est affiché ... C'est une bonne question cependant, alors je l'ai laissé.


4 Réponses :


13
votes

Voir ce que vous pensez de la version dans Apache TIKA . Cela suppose que vous voulez savoir quel texte linguistique se trouve, par opposition à vouloir construire un analyseur pour un langage de programmation.


1 commentaires

peut-être fournir un lien vers tika



0
votes

Je pense antlr est à peu près norme.


2 commentaires

L'un de nous est confus. Je pensais qu'il voulait une façon de dire si le texte était en chinois ou en japonais, et vous pensez qu'il veut faire un parser! On verra.


@bmargulies - On n'a pas pu être déduite de la question, alors les deux réponses ont un sens.



3
votes

textcat http://textcat.sourceforge.net/ n'a pas de russe mais il gère ce qui suit:

  • albanais
  • danois
  • néerlandais
  • anglais
  • finnois
  • français
  • allemand
  • hongrois
  • italien
  • norvégien
  • polonais
  • slovaque
  • slovène
  • espagnol
  • suédois

0 commentaires

1
votes

Il y a API de détection de langue qui accepte du texte via HTTP POST et renvoie JSON avec des langues et des scores détectés. Il peut être utilisé à partir de Java ou de tout autre langage de programmation.


0 commentaires