Нет простого измерения точности модели Doc2Vec - вам нужно будет иметь метод оценки, который является обычным для ваших целей и целей проекта.
accuracy()
метод на Word2Vec, также унаследованной Doc2Vec, делает очень узкий вид аналогии тестирования, используя только слова-векторов, так как тот же метод был использован в оригинальной word2vec бумаги и оригинального Google word2vec.c инструментария. Вы можете увидеть тестовые файлы, которые они использовали, questions-words.txt
и questions-phrases.txt
, в Github mirror of the Google word2vec-toolkit.
Поскольку некоторые режимы Doc2Vec генерируют слова-векторы, вы можете выполнить такой аналог теста на этих моделях Doc2Vec, но он вообще не проверяет документы-векторы и модель, которая хорошо справляется с этими слово-аналогами может быть не лучше для любой задачи вашего документа ниже.