Я пытаюсь обучить классификатор, чтобы классифицировать текст из чата между двумя пользователями, поэтому я могу предсказать, кто из этих двух пользователей, скорее всего, скажет X предложение/слово. Чтобы добраться туда, я заработал текст из журнала чата и закончил с двумя массивами слов, UserA_words
и UserB_words
.Какое представление текстовых данных чата следует использовать для классификации пользователей?
В каком формате мне нужно преобразовать эти массивы, чтобы передать его в классификатор, например, naiveBayes или SVM? Как пройти, например. пакет представления слов в классификатор?
Запрашивать, какое представление ML использовать для конкретной задачи классификации по теме на сайте-партнере [DataScience.SE] (http://datascience.stackexchange.com). Пожалуйста, мигрируйте туда. – smci
Удержание этого не является конструктивным: либо перейти на DataScience.SE, либо оставить здесь. Мой ответ показывает, что у этого есть реальный ответ. – smci
@smci Извините, я новичок здесь, я опубликовал аналогичный вопрос в Data Science SE, но как мне перенести этот? Заранее благодарю – whiteTea