В scikit learn или nltk классификатор обычно рассматривают термин частота или TF-IDF.Есть ли класс, который работает как на уровне слов, так и на уровне предложения?
Я хочу также рассмотреть термин частота, а также структуру предложения для классификации. У меня есть 15 вопросов. Каждый с текстовым файлом, содержащим предложение с новыми строками.
Категория город содержит эту фразу:
In which city Obama was born?
Если я считаю на срок частоты, то следующий может не рассматриваться. потому что обама или город в наборе данных не совпадает с предложением запроса
1. In which place Hally was born 2. In which city Hally was born?
Есть ли классификатор, который считает как термин частота, а структура предложения. Поэтому при обучении он также классифицирует входной запрос с аналогичной структурой предложения.