2016-05-25 2 views
0

Я пытаюсь построить инструмент для вычисления подобия между 2-х слов, и я обнаружил, что существует формула пришел из Манчестерского университета следующим образом:Сходство подобия - Как рассчитать глубину подсчета с помощью WordNet?

Formula for word similarity from Manchester research group

До сих пор, я до сих пор путают, как получить h, которая является глубиной подсхема в иерархических семантических сетях. Как мое понимание, h - длина пути от верхнего слова к определенному слову, как ссылка от автора, верхним словом является «сущность» для NOUN. Но как насчет другого типа слова, такого как ADJ, ADV, VERB ...? И если у нас уже есть первое слово, как мы можем перечислить путь от него к слову, нам нужно вычислить

Бумага находится по следующей ссылке: https://www.researchgate.net/profile/Keeley_Crockett/publication/232645326_Sentence_Similarity_Based_on_Semantic_Nets_and_Corpus_Statistics/links/0deec51b8db68f19fa000000.pdf

Действительно ценят за любой ответ. Благодаря

ответ

0

Я хотел бы добавить больше деталей, которые я только что нашел. Этим деталям достаточно для моего поиска, но, возможно, не совсем с вопросом выше, но я думаю, что мне нужно поделиться тем, кому это нужно в будущем.

  1. «Entity» не только корень существительного, но и корень любого слова даже это ГЛАГОЛА, ADJ, ADV ....

    • Ex полный путь к слову «поцелуй «: КОРНЕВАЯ # п # 1 < субъект # п # 1 < абстракция # п # 6 < psychological_feature # п # 1 < событие # п # 1 < акт # п # 2 < сенсорный # п # 5 < поцелуй # п # 1
    • EX полный путь для слова «удар»: КОРНЕВАЯ # п # 1 < субъект # п # 1 < абстракция # п # 6 < psychological_feature # п # 1 < событие # п # 1 < акт # п # 2 < speech_act # п # 1 < возражение # п # 2 < kick # n # 4
  2. Чтобы рассчитать глубину любого слова, нам нужно рассчитать начальное слово («сущность») и базу в иерархической базе данных Word Net.

Вернись выше пример, ч (длина subsummer от «поцелуя» и «удар») равно 6, который является отсчет от верхнего корня дерева узла к слову «акт»

0

Каждый раз, когда я пытался понять иерархию Wordnet я нашел то, что отменяет все, что предполагалось ранее :) Что касается сходства, если вы используете Python и NLTK, я рекомендую вам использовать предоставленные метрики подобия , если нет, то это может быть хорошим началом, чтобы понять, как все работает.

В этой связи, прокрутите вниз до похожести: http://www.nltk.org/howto/wordnet.html

+0

Благодаря Хосеп , но на самом деле я пытаюсь представить выше формулу, чтобы проверить, лучше ли это или хуже, чем другой алгоритм. Вот почему я пытаюсь понять, как это работает.BTW, когда мы посещаем Word Net на wesite, перейдите в FAQ, вы можете найти инструмент, разработанный в Pearl, чтобы подсчитать расстояние между словами –

Смежные вопросы