Я планирую выполнить некоторую настройку данных по своим данным.Как предсказать правильное название страны для имени страны?
Ситуация-У меня есть данные, которые имеют поле country
. Он содержит имена стран, которые вводят пользователя (это может содержать орфографические ошибки или разные названия стран для той же страны, что и США/США/США для США). У меня есть список правильных названий стран.
Что я хочу? - Чтобы предсказать, к какой ближайшей стране это относится. Например, если дано U.S.
, оно изменится на USA
(правильное название страны в нашем списке).
Есть ли способ, которым я могу это сделать, используя Java или opennlp или любой другой метод?
Левенштейн Расстояние полезно! Но проблема в том, что для страны, такой как 'США', если данные имеют« Соединенные Штаты », тогда расстояние будет намного больше, чем должно быть! – AngryLeo
@AyushBanka: В этот раз вы можете использовать API, который я добавил в ответ. Этот код [Git] (https://gist.github.com/maephisto/9228207) может вам помочь. Вы можете добавить свое. – iNikkz