Мне интересно, следует ли масштабировать категориальные объекты после преобразования в одно горячее кодирование (например, 0 0 0 1 0 0 для 6 возможных значений переменной) по реальным функциям с использованием svm-scale функция. Похоже, что руководство libsvm так говорит.libsvm масштабирование функций реального и категориального
Кроме того, что влияет на обучение в SVM, если есть некоторые функции, которые являются недискриминационными, например. случайный шум? Должен ли я удалять такие функции перед обучением? Я предполагаю, что это может повлиять на обучение, потому что SVM по существу вычисляет евклидовы расстояния между точками данных, которые представлены в виде векторов признаков. Я не очень беспокоюсь о времени работы, так как количество функций мало. Пожалуйста, укажите стандартную реализацию алгоритма выбора объектов для svm. Любое предложение приветствуется.
спасибо.