Я использовал tf/idf для вычисления сходства между двумя документами. Он имеет некоторые ограничения и не работает очень хорошо.Сходство документа
Я искал LDA (выделенное выделение дирихле) для вычисления подобия документа. Я не знаю много об этом. Я не мог найти много вещей о моей проблеме.
Не могли бы вы предоставить мне какой-либо учебник, связанный с моей проблемой? Или вы можете дать некоторые советы, как я могу достичь этой задачи с помощью LDA ???
Благодаря
P.S: также есть ли исходный код Availabe выполнить такую задачу с LDA ??
Можете ли вы уточнить, почему косинус сходство не работает для вас? –