При применении техники PCA на обучающем наборе мы находим матрицу коэффициентов A, которая является основным компонентом. Поэтому, когда мы находимся на стадии обучения, мы находим этих директоров и проецируем их на данные. мой вопрос заключается в том, применяем ли мы те же принципы или находим новых принципов для данных на стадии тестирования?
Я думаю, что в ответ вот так: если мы используем его для уменьшения размерности, мы должны найти новые принципы. но если мы используем его для извлечения функций (например, для извлечения данных для ЭЭГ), мы должны использовать старую (которая для данных на этапе обучения), насколько мое мышление верно?
BS: Я не прошу и ответить на вопрос, в то же время, но сказать, что я думаю, чтобы показать точки непонимания, и принять мнение от экспертовPCA в машинном обучении
ответ
PCA является одним из художественных векторных преобразований. Цель состоит в уменьшении размерности. Это своего рода слияние коррелированных функций. Если у вас есть функции, такие как вес и размер и большинство объектов, когда что-то тяжелое, также большой. Он заменяет эти функции одним weight_and_size. Он уменьшает шум, а также составляет e.q. нейронная сеть меньше.
Это позволяет сети решить проблему за более короткое время (уменьшая размер сети). Это также должно улучшить обобщение.
Так что, если вы обучили свою сеть с вектором объектов сжатым с помощью PCA, вам также нужно проверить его с преобразованными данными. Просто потому, что он имеет столько же входов, сколько и сжатый вектор признаков. Вы также должны использовать точно такое же преобразование. Если сеть узнала, что первый вход weight_and_size, вы не можете поместить значение e.q. warm_and_colorful и ожидать хороших результатов.
Как PCA, так и PCR построены на данных обучения, а преобразование применяется для проверки эффективности (ошибки) оценки. С помощью этих двух методов вы получаете лучшие результаты, когда не используете только один набор учебных материалов, но выполняете K-fold Cross Validation, где вы делаете отдельный PCA для каждой складки и применяете преобразования к наборам тестов. Надеюсь, поможет!
- 1. Значимость PCA или SVD в машинном обучении
- 2. Преимущества TDD в машинном обучении
- 3. Оценка оценки в машинном обучении
- 4. условие в формуле в машинном обучении
- 5. понимание pca в обучении машинам
- 6. Что такое метод NumericToNominal в машинном обучении.
- 7. Как увеличить производительность R в машинном обучении?
- 8. Создание контролируемой модели в машинном обучении
- 9. Что означает «Oracle» в машинном обучении?
- 10. Вопрос о классификаторах в машинном обучении
- 11. Когда использовать генеративные алгоритмы в машинном обучении?
- 12. Огромные наборы данных в машинном обучении sklearn
- 13. маркировка набора данных в машинном обучении
- 14. Каково определение «гибкости» метода в машинном обучении?
- 15. Интуиция о ядро-трюке в машинном обучении
- 16. Интерпретация кривой обучения в машинном обучении
- 17. Номинальный ценный набор данных в машинном обучении
- 18. Обработка геопространственных координат при машинном обучении
- 19. Как вычислить потерю журнала при машинном обучении
- 20. Скомпенсированный класс и неуравновешенный класс в машинном обучении
- 21. Большое количество функций в машинном обучении плох (регрессия)?
- 22. Как работает процедура весовой системы в машинном обучении?
- 23. Нужно ли нормализовать/стандартизировать данные в машинном обучении?
- 24. Почему так называемое «ядро» в машинном обучении функции ядра?
- 25. C++ library/framework, API для моделей Mixture в машинном обучении
- 26. В обучении машинам, что такое определение «вниз по течению»?
- 27. Какой классификатор в машинном обучении может быть лучше, если у меня есть перекрытие классов?
- 28. Используете ли мы модель гамма-смеси (GMM) для кластеризации данных в машинном обучении так часто?
- 29. в машинном обучении: существует ли аналог анализа ошибок для задач, не связанных с классификацией?
- 30. Помощь в обучении QTest
Непонятный вопрос. Что вы подразумеваете под «новыми принципами» и «старыми принципами»? Можете ли вы уточнить? – eigenchris
Я считаю, что вопрос: вы вычисляете главные компоненты векторов на обучающем наборе, а затем * используйте их * с набором тестов (или новыми наблюдениями в реальном приложении) * или * принимаете ли вы свой набор тестов/новые наблюдения и * перечислить * главные компоненты векторов. – ely
Ответ, как для уменьшения размерности, так и для извлечения элементов, заключается в том, что вы никогда не перекомпилируете новый набор базовых векторов для данных тестирования или новых наблюдений. Базовые векторы, которые вы изучаете, - это модель, которую вы изучаете, и используете эту модель для любых новых входящих данных (будь то тестовые данные или данные реального мира). – ely