2013-05-05 2 views
1

Я работаю над проблемой интеллектуального анализа текста: извлеките место из текста. Место может быть либо только штатами, либо более конкретными, такими как название района в Чикаго или даже конкретный адрес. Но это только в США.Оценка местоположения из текста

Я пытался создать Yahoo Place maker api, но я не могу создать ключ api (веб-сайт не отвечает). Есть ли способ сделать это, например, быстрый шахтер, или написать всеобъемлющее регулярное выражение?

+2

Regex не работает для этого, посмотрите здесь: http://stackoverflow.com/questions/9397485/regex-street-address-match –

ответ

1

Рассмотрите именуемый признак сущности Стэнфорда (NER). Интернет демо здесь:

http://nlp.stanford.edu:8080/ner/process

Это библиотека Java. Лицензия - GPL v2, хотя лицензия на распространение в автономном приложении является дорогой.

+0

Есть ли в любом случае использовать quickminer для этой цели? –

+1

Существует плагин Information Extraction для RapidMiner, но я пробовал его несколько раз и на самом деле не понимаю. –

Смежные вопросы