2016-10-31 5 views
2

Я пытаюсь понять, как python-перчатка вычисляет most-similar терминов.peteron перчатка измерение подобия измерение

Используется ли сходство с косинусом?

Пример из питона-перчаточном GitHub https://github.com/maciejkula/glove-python/tree/master/glove : enter image description here

Я знаю, что с word2vec gensim, метод most_similar вычисляет сходство с использованием косинуса расстояния.
enter image description here

ответ

1

На веб-сайте проекта перчаток это объясняется с достаточной ясностью. http://www-nlp.stanford.edu/projects/glove/

Для того, чтобы захватить в количественном виде нюанс необходимо отличать мужчину от женщины, это необходимо для модели, чтобы связать более чем один номер на пару слов. Естественным и простым кандидатом на расширенный набор дискриминационных чисел является векторная разница между двумя векторами слова. GloVe разработан таким образом, чтобы такие векторные различия максимально учитывали значение, указанное в сопоставлении двух слов.

Чтобы узнать больше о математике за этим, проверьте раздел «Обзор модели» на сайте