2014-11-25 2 views
0

Как найти семантическое сходство между любыми двумя заданными предложениями?Как найти сходство предложения?

Например: Какие фильмы сделал ron howard direct?

фильмы режиссера Рона Хауарда.

Я знаю, что это сложная проблема. Но хотелось бы спросить мнения экспертов. Я не знаю, как использовать части речи, чтобы достичь этого. http://nlp.stanford.edu:8080/parser/index.jsp

+1

Как на каком уровне? «Фильмы не направлены на моего Рона Ховарда» лексически очень похожи на ваше второе предложение, но семантически его диаметрально противоположное. Голосование закрывается слишком широко. – tripleee

+0

Я не вижу цели вашего примера. Вы работаете над системой контроля качества? Если да, вы должны указать его и четко указать, каков ваш вклад и что ожидается в качестве вывода. – Pierre

+0

Возможный дубликат [Как вычислить подобие косинуса с учетом 2 строк предложения? - Python] (http://stackoverflow.com/questions/15173225/how-to-calculate-cosine-similarity-given-2-sentence-strings-python) – alvas

ответ

0

Его широкая проблема. Я лично поеду за cosine similarity.

Вам необходимо преобразовать ваши предложения в вектор. Для преобразования предложения в вектор вы можете рассмотреть несколько правил, таких как количество событий, порядок, синонимы и т. Д. Затем, используя указанное расстояние, как указано, here

Вы также можете изучить поиск elastics для finding associated words. Вы можете создавать свои собственные анализаторы, стеблемеры, токенизаторы, фильтры (например, синонимы) и т. Д., Что может быть очень полезно при поиске похожих предложений. Elasticsearch также предоставляет more like this query, который находит похожие документы, используя оценки tf-idf.

Смежные вопросы