Предположим, у нас есть текстовый файл 10000 и мы хотели бы классифицировать как политическое, здоровье, погоду, спорт, науку, образование, ......... Мне нужна подготовка набор данных для классификации текстовых документов и алгоритм классификации наивного Байеса. Любой может помочь получить наборы данных. OR Есть ли другой способ получить классификацию. Я новичок в Machine Learning. Пожалуйста, объясните свой ответ полностью.Подготовка и тестирование Набор данных для текстового файла классификации
Пример:
**Sentence** **Output**
1) Обама выиграл выборы. -----------------------------------------------> политический
2) Индия выиграла 10 калиток ---------------------------------------- ------> спорт
3) Табак более опасен -------------------------------- -------------> Здоровье
4) ньютон законы движения может быть применен к машине --------------> наука
Любой способ классифицировать эти предложения в соответствующие категории
Добро пожаловать в StackOverflow. Прочтите и следуйте инструкциям по отправке в справочной документации. [по теме] (http://stackoverflow.com/help/on-topic). – Prune