Если вы используете библиотеку, такую как scikit-learn, как назначить больший вес некоторым функциям ввода для классификатора типа SVM? Это что-то люди делают или есть другое решение моей проблемы?Как уделить больше внимания определенным функциям в обучении машинам?
ответ
Прежде всего - , вероятно, вы не должны это делать. Вся концепция машинного обучения заключается в использовании статистического анализа для назначения оптимальных весов. Вы вмешиваетесь здесь в целую концепцию, поэтому вам нужно очень хорошее доказательство того, что это важно для процесса, который вы пытаетесь моделировать, и по какой-то причине ваша модель в настоящее время его отсутствует.
Это, как говорится, нет общего ответа. Это чисто специфическая модель, некоторые из которых позволят вам весовые характеристики - в случайном лесу вы можете смещать распределение, из которого вы производите выборку, чтобы анализировать те, которые вас интересуют; в SVM этого должно быть достаточно, чтобы просто умножать данную функцию на константу - помните, когда вам сказали нормализовать ваши функции в SVM? Вот почему - вы можете использовать масштаб функций для «управления» вашим классификатором по заданным функциям. Будут предложены те, у которых высокие значения. Это действительно будет работать для любой нормализуемой нормы веса (регуляризованная логистическая регрессия, регрессия гребня, лассо и т. Д.).
Спасибо за ответ, я заметил в scikit-learn, у SVC-классификатора есть вход «sample_weight», где вы можете придать большее значение определенным классам. Можете ли вы привести пример использования этой функции? – 28r
sample_weight - это весовые конкретные ** образцы ** (экземпляры, точки, объекты), а не целые классы (хотя он может быть использован для этой цели). Это используется, например, для реализации методов повышения, которые итеративно имеют избыточный вес, которые ранее были неправильно классифицированы. Он также используется для избыточного веса классов меньшинства в несбалансированной классификации. Однако, опять же, это другой вид взвешивания, чем тот, который в вопросе – lejlot
- 1. понимание pca в обучении машинам
- 2. некоторые путаницы в обучении машинам
- 3. Недостающие значения в обучении машинам scikits
- 4. Прогрессия в обучении машинам с использованием python
- 5. В обучении машинам, что такое определение «вниз по течению»?
- 6. Код с 10-кратной перекрестной проверкой в обучении машинам
- 7. Подстановка Wordpress к определенным функциям
- 8. Rexster передаёт значения функциям, определенным в сценариях
- 9. Как уделить время первому событию?
- 10. Как уделить внимание предыдущему приложению в какао?
- 11. std :: unique_ptr, мешающий определенным функциям sf :: RenderWindow?
- 12. Nginx предоставляет доступ к определенным машинам без использования IP
- 13. Как ограничить доступ к определенным функциям в CodeIgniter?
- 14. Обучение машинам: неконтролируемое обратное распространение
- 15. Простой пример обучения машинам в формате .cd
- 16. Обучение машинам в GATE
- 17. Как уделить внимание Eclipse RCP TitleAreaDialog?
- 18. Помощь в обучении QTest
- 19. Предотвращение прямого доступа к определенным функциям в codeigniter
- 20. Доступ к функциям javascript, определенным в разных файлах
- 21. Как увеличить производительность R в машинном обучении?
- 22. Android в обучении Windows
- 23. Как уделить время в текущем формате в консоли App
- 24. Анализ навыков в обучении
- 25. Ошибка в обучении CNN
- 26. PCA в машинном обучении
- 27. Динамический доступ к определенным функциям или свойствам переменных
- 28. Как оценить и объяснить обученную модель в этом обучении?
- 29. Предложения по обучению машинам
- 30. Как уделить внимание iFrame в Firefox, просто загружена страница?
Зачем вам это нужно? Хорошие алгоритмы уже делают это автоматически и ситуативно. – MSalters
Посмотрите на TF-IDF - он весит – Paparazzi
@Paparazzi tfidf не относится к весовым функциям, это скорее о «раздавливании» слишком быстро растущих, поэтому вы получаете разумные масштабы. Это не приводит к тому, что определенная функция является «более важной», если вы не используете очень специфический классификатор сверху (например, для деревьев решений, tfidf вообще не имеет значения «важность») – lejlot