2017-01-18 3 views
1

Я хочу получить точность из модели Doc2Vec, реализованной в Python. В официальной документации я увидел, что существует метод получения точности, который принимает в качестве параметра файл. Каким должно быть содержание этого входного файла?Вычислить точность модели word2vec в Python

Я попытался поставить 4-кортеж, как говорит документация, но у меня все шаблоны ошибочно классифицированы.

ответ

0

Нет простого измерения точности модели Doc2Vec - вам нужно будет иметь метод оценки, который является обычным для ваших целей и целей проекта.

accuracy() метод на Word2Vec, также унаследованной Doc2Vec, делает очень узкий вид аналогии тестирования, используя только слова-векторов, так как тот же метод был использован в оригинальной word2vec бумаги и оригинального Google word2vec.c инструментария. Вы можете увидеть тестовые файлы, которые они использовали, questions-words.txt и questions-phrases.txt, в Github mirror of the Google word2vec-toolkit.

Поскольку некоторые режимы Doc2Vec генерируют слова-векторы, вы можете выполнить такой аналог теста на этих моделях Doc2Vec, но он вообще не проверяет документы-векторы и модель, которая хорошо справляется с этими слово-аналогами может быть не лучше для любой задачи вашего документа ниже.