Я стараюсь классифицировать документы на основе их суммарного представления слов (Особенности: 1000). Для классификации я использую SVM, кажется, что иногда SVM не заканчивается и работает бесконечно. (Запуск sci-kit: SVC (C = 1.0, kernel = 'linear', cache_size = 5000, verbose = True)) Теперь я ищу решение, я подумывал применить MinMax-Scaler для получения вычисления эффективное представление документов. Но разве я испортил свою сумку с представлением слов с нормализацией функции?Текст-классификация: Сумка слов с MinMax-Scaler
Заранее благодарен!