У меня есть твиты определенной учетной записи, я хочу, чтобы пройти через каждый твит и классифицировать в классе таких лейблах, как бизнес, музыка, спорт и т.д.Multi-класс классификации в R
Мой подход к созданию обучающих данных для назначения несколько ключевых слов для каждой метки класса, например
- Ключевые слова для «Бизнес» может быть - предприниматель, работа, ВВП ...
- Ключевые слова для «Music» может быть - песни, жанр, альбом ...
файл .csv для обучающих данных имеет 2 колонки 1. Ключевые слова 2. класс
Является ли это правильный путь?
Заранее благодарю вас!
Я пробовал, это была точная вещь, которую я искал. Спасибо огромное! –
Нет проблем. Рад был помочь. Quanteda - отличный инструмент для анализа текста. Также хорошо, потому что он понимает щебет! – lmkirvan
Это глупая задача спросить, но я не могу найти решение этого. Я сохранил «спорт», «ношу» в своем словаре, но всякий раз, когда я встречаю слова, связанные с ними, такие как «спорт», «носит», он не может их идентифицировать. Любое предложение, как это сделать? –