2016-12-02 3 views
0

Я пытаюсь использовать LDA модуль GenSim сделать следующую задачуРасчет распределения темы невидимого документа на GenSim

«Поезд модели LDA с одним большим документом и следить за 10 скрытых тем. Учитывая новый , невидимый документ, предсказать распределение вероятности из 10 скрытых тем ".

В соответствии с учебным пособием здесь: http://radimrehurek.com/gensim/tut2.html, это представляется возможным для документа в корпусе, но мне интересно, возможно ли это для невидимого документа.

Спасибо!

ответ

0

Из документации вы вывесили это выглядит, как вы можете тренировать свою модель, как это:

>>> model = models.LdaModel(corpus, id2word=dictionary, num_topics=100) 

, а затем из this page это выглядит, как вы можете применить модель на «невидимый документ», как это:

>>> doc_lda = model[doc_bow] 

Где doc_bow является сумкой слов, генерируемой инструментом doc2bow.

Смежные вопросы