2015-04-16 2 views
1

Я использую класс Doc2vec из фреймворка gensim для вычисления векторного представления каждого документа в корпусе.Отсутствие предложений из представления Doc2vec

Корпус содержит очень короткие предложения, у них может быть даже одно слово. Я заметил, что для многих предложений, особенно коротких, Doc2vec не предоставляет никаких представлений. Может ли кто-нибудь объяснить причины этого?

ответ

2

У меня была эта проблема. Я решил это, установив параметр min_count = 1.

model = doc2vec.Doc2Vec(size=100) 

стал

model = doc2vec.Doc2Vec(size=100, min_count=1) 

Сделано моя проблема уйти!

Я нашел свой ответ в комментариях учебника doc2vec http://radimrehurek.com/2014/12/doc2vec-tutorial/

Смежные вопросы