Итак, я обозначил твиты как переработанные или не переработанные, и я должен использовать логистическую регрессию, чтобы построить модель, чтобы предсказать, будет ли изменен твит или нет.Как использовать несколько функций для текста в текстовой классификации?
Проблема, с которой я столкнулся, - это я не знаю, как использовать несколько признаков с логистической регрессией. Функции, которые мне нужно использовать, - tf-idf, lda, был ли изменен твит, сколько твитов времени от определенного пользователя было переутомлено в прошлом.
Как я могу использовать 4 функции в двоичной классификации? Любая помощь будет принята с благодарностью.
Какой инструмент вы используете для этой задачи (scikit-learn, тензорный поток ...)? Процедура использования двух функций такая же, как и с использованием 4 функций, нет никакой разницы. –
scikit узнать. Как мы будем это делать? любой справочный учебник? –
Можете ли вы поделиться небольшим примером своего набора данных? Таким образом, я могу помочь лучше –