Я использую реализацию LL для sklearn для моделирования тем. После подгонки модели я получаю некоторые темы, имеющие смысл с словами, имеющими весовые коэффициенты усиления, так что это нормально, однако я также получаю другие темы со всеми словами «весовые значения» до предшествующего (1/количество тем). Такое поведение звучит странно для меня, что это может быть причиной?Scikitlearn скрытое выделение дирихле дает пустую тему
Информация о моей установке являются:
- Vocab из 1000 слов
- Я передаю модель матрица ffidf сделана с помощью этого Vocab над документами более 700, каждый документ составляет от 500 до 1000 символов
- Я попытался запустить различное число итераций эм, это не меняет результат
- Я прошу 30 тем
Я также задаюсь вопросом, может ли случиться, что у меня слишком много тем, но если это так, не должна ли модель менять вес темы?