Как я могу связать свою матрицу tfidf с категорией? например, у меня есть данные ниже наборТекстовая категоризация Python с предварительно подготовленными данными
**ID** **Text** **Category**
1 jake loves me more than john loves me Romance
2 july likes me more than robert loves me Friendship
3 He likes videogames more than baseball Interest
раз я вычислить tfidf для каждого и каждое предложение, принимая «текст» столбца, как мой вход, как я смог бы обучить систему классифицировать эту строку матрицу, связанную с моей категорией выше, чтобы я мог повторно использовать для своих тестовых данных?
используя вышеуказанный набор данных поезда, когда я передаю новое предложение «julie - прекрасный человек», я хотел бы, чтобы это предложение было отнесено к одной или нескольким предопределенным категориям, как указано выше.
Я использовал эту ссылку Keep TFIDF result for predicting new content using Scikit for Python как мой отправной точкой для решения этой проблемы, но я не был в состоянии понять, о том, как отобразить tfidf матрицу для предложения к категории
Да, я уже преобразованный текст в число, но как система узнает, к какой категории относятся эти числа? Я преобразовал текст в число, но я не смог пометить номера текста в категорию, которую я хотел бы сделать (как показано в моем наборе данных вопроса). – RData
То, что делает классификатор и шаг прогнозирования. у предсказанной переменной будут категории для нового текста. – elyase
y_train моя категория? – RData