9
votes

Identifier les emplacements géographiques dans le texte

Quel type de travail a été fait pour déterminer si une chaîne spécifique concerne un lieu géographique? Par exemple:

'troy, ny'
'austin, texas'
'hotels in las vegas, nv'


0 commentaires

4 Réponses :


3
votes

Un lien pour aider: Recherche geonames.org :

retourne les noms trouvés pour le SearchTerm comme document XML ou JSON

Exemple: http://ws.geonames.org/search? Q = Troy,% 20NY & MaxRows = 10


1 commentaires

Cela mesure des chaînes individuelles vers des endroits, mais n'est pas utile pour trouver des lieux dans le texte arbitraire.



8
votes

Le problème que vous décrivez est souvent appelé appelé de la requête géographique ou plus généralement de récupération d'informations géographiques.

Il y avait une tâche récente à ce que cela a eu lieu à la clef 2007 ( http: //www.uni-hildesheim.de/geoclef/2007/Query-parsing.htm ). L'équipe gagnante a utilisé une grammaire à base de règles, ce qui est similaire à ce que vous ne voulez probablement pas. Un autre article sur www2009 parle de Geoparser: http://www2009.eprint.org/239/ . < / p>

Il existe également des documents sur la récupération de l'information géographique à CIKM 2007: http: //www.geo.unizh.ch/~rsp/gir07/accepted.html

Je ne connais aucun logiciel open source qui le fait, mais cela peut être regroupé dans un moteur de recherche comme Lemur.


0 commentaires

4
votes

Il existe une approche très intéressante prise par tous les niveaux qui se concentrent sur la manière dont les emplacements sont exprimés en anglais - ils utilisent essentiellement des expressions régulières sophistiquées et étendues qui sont maintenant open source. Leur application est conçue pour analyser les articles de presse, les critiques et diverses flux de données publiques et les relier à des emplacements spécifiques, et cela fonctionne bien. Des expressions telles que «un feu dans le bâtiment du coin nord-est du 20e et Valence St. à San Francisco» sont très précis géographiques. Vous pouvez étudier la source ici . La partie particulière que vous voulez probablement est ebub / ebpub / géocoder / base.py , situé dans le Ebpub Télécharger, et tout ce qui l'entoure, par exemple en commençant par la classe SmartGeocoder et Travailler en arrière.


0 commentaires

0
votes

Je suis en train de construire une géoparsère gratuite à Geocode.xyz

(soutient actuellement environ 50 pays européens, bientôt pour offrir une couverture mondiale)

Un échantillon d'application de la géoparçage peut être trouvé sur openWikimap


0 commentaires