2016-06-16 3 views
1

В doc2vec function есть параметр, называемый size.Что такое параметр размера в gensim doc2vec представляют

Я понимаю, что size - это размер выходного вектора, и если size=400 будет захватывать контент лучше, чем если бы size=100.

Однако, я не понимаю, что делает size подставка? Означает ли это, как далеко Doc2Vec будет искать слова, чтобы предсказать следующее слово? Или что это значит?

Спасибо большое,

ответ

1

size это число измерений в созданных векторов. Таким образом, size=100 означает, что каждый документ (фактически, тег-документ) получает 100-мерный вектор от обучения.

Больше измерений не всегда лучше: они означают более медленное обучение и большую модель. И если вы работаете с небольшим набором данных, слишком много измерений рискуют переобучением - это не позволяет модели представить обобщенные шаблоны в данных.

Смежные вопросы