На самом деле я использую интерфейс OpenCV svm python, и я пытаюсь классифицировать данные по 4 категориям. Когда метки и данные обучения в порядке, я имею в виду, например, данные были в 4 группах, упорядоченных как метка 1, метка 2, метка 3 и метка 4, правильное соотношение было низким, всего лишь 50% вправо. Но когда я перетасовал данные обучения, результат был разумным, примерно на 90% правильным. Поэтому мой вопрос: влияет ли порядок данных обучения на конечный результат или мне нужно перетасовать данные перед обучением?Требуется ли перетасовать данные обучения для мульти-классификации SVM?
ответ
Нет, это не меняет тренировку SVM, хотя некоторые параметры настройки, используемые в вашем коде, могут зависеть от порядка. Например, если вы используете перекрестную проверку без рандомизации, чем упорядоченный набор намного сложнее (в последовательных сгибах может быть даже 0 выборок некоторых классов!).
Короче:
- SVM обучение не зависит от данных, заказывающих
- Некоторые инструменты библиотеки на основе используемых в качестве «дополнительного метода» может зависеть от него
Мой ответ Нет. Основываясь на this page, В отличие от алгоритма обучения обратного распространения для искусственных нейронных сетей, данный SVM всегда будет детерминистически сходиться к одному и тому же решению для заданного набора данных независимо от ini . Для учебных комплектов, содержащих менее примерно 5000 точек, градиентный спуск обеспечивает эффективное решение этой проблемы оптимизации [Campbell and Cristianini, 1999].
Во-первых, убедитесь, что векторы объектов соответствуют соответствующим меткам после перетасовки. Также убедитесь, что на каждой этикетке есть много векторных функций в обоих случаях.
Во-вторых, вы можете попробовать повторить свое обучение, чтобы узнать, изменяется ли SVM. Используйте точно такие же наборы данных с тем же порядком и без перетасовки. Теоретически это не изменится, так как проблема выпуклой оптимизации должна иметь уникальный максимум.
В-третьих, есть вероятность, что вы достигли максимального времени итерации, если ваша тренировка сходится очень медленно. Тогда раннее завершение может привести к некоторой очевидной случайности в результатах.
Последнее, но не менее важное, хотя математически первичное решение уникально в SVM, двойное решение может быть неединственным. В основном это зависит от выбора связанной переменной C. This article анализировал возможную уникальность между первичными и двойными решениями.
- 1. Подготовьте свои данные для обучения SVM libsvm
- 2. Машина обучения gridsearch для svm
- 3. Сложность обучения линейного SVM
- 4. CvSVM масштабирует данные обучения?
- 5. Слегка перекошенный график для обучения SVM
- 6. Извлечение формы Контекст Дескрипторы для обучения SVM
- 7. Ошибка обучения Java + OpenCV SVM
- 8. Требуется стратегия машинного обучения
- 9. Использование одноклассного svm с вредоносными данными обучения
- 10. SVM как тип обучения на основе экземпляров?
- 11. Необходима отдельная проверка и набор тестов, необходимых для обучения SVM?
- 12. обучения требуется с javascript
- 13. В SVM, может ли вектор поддержки быть не образцом обучения?
- 14. Может ли SVM учиться постепенно?
- 15. sklearn svm area под ROC менее 0,5 для данных обучения
- 16. Требуется ли зарегистрировать и оплатить Adobe для обучения PhoneGap?
- 17. Требуется ли знание QTP для обучения Quality Center
- 18. Имеет ли смысл word2vec для контролируемого обучения?
- 19. Как тренировать данные для SVM?
- 20. Особенности конкатенации SURF и функции радона для обучения SVM
- 21. Набора изображений дорожного знака для обучения SVM OpenCV
- 22. OpenCV 3.2.0: Чтение Канни изображение для обучения SVM
- 23. SVM: Объединяя индивидуальные баллы для каждого параметра с помощью обучения SVM
- 24. Высокая предвзятость или отклонение? - SVM и прочерченные кривые обучения
- 25. ключевые фразы для SVM
- 26. Как перетасовать данные растровых изображений?
- 27. Как создать данные обучения
- 28. Должен ли я перетасовывать данные для обучения нейронной сети с использованием backpropagation?
- 29. OpenCV SVM: обновление обученного SVM
- 30. Нужно ли нормализовать входной вектор для прогнозирования в SVM?
Я использовал проверку креста для проверки соотношения. Может, в этом и дело! –