Я пытаюсь выполнить анализ настроений в наборе данных. Но нет существующего корпуса, который может быть обучен моему классификатору, аналогичен набору данных, который я хочу проанализировать. Мой вопрос заключается в следующем: могу ли я использовать выборочное выборочное подмножество этих данных для фаз обучения/валидации, а затем использовать подготовленный классификатор для выполнения анализа в более крупном наборе данных? Я планирую ввести некоторую изменчивость, добавив точки данных к набору тренировок, которые аналогичны набору данных приложения, но не из этого набора. Это действительный подход?Выбор набора для обучения из большего набора приложений
0
A
ответ
1
Что вы ищете, это стандартная процедура перекрестной проверки. Во время кросс-валидации вы разбиваете свои данные (предположим) на 80% -20% учебных данных тестирования и делаете 5-10 (в зависимости от размера данных, которые у вас есть) разные расколы. Поэтому я предлагаю вам сохранить подмножество данных, а затем выполнить кросс-валидацию в этом подмножестве. Это оптимальный способ обучения вашей модели.
Смежные вопросы
- 1. Выбор подмножества из большего 2d набора?
- 2. Поиск повторяющегося набора строк среди большего набора
- 3. Вероятностный выбор из набора
- 4. R Уровни неправильны для большего набора данных
- 5. Выбор случайного элемента из набора
- 6. Выбор иностранных значений из набора
- 7. Выбор из набора значений enum
- 8. Приложение для набора приложений JavaFX
- 9. Пример неравномерно распределенного набора для обучения
- 10. Функции набора логических приложений
- 11. Выбор набора данных WPF
- 12. Кнопки приложений накладного набора
- 13. Размеры набора для тренировки и набора тестов
- 14. Выбор набора в AS3
- 15. Выбор определенного набора словарей
- 16. Выбор чисел из набора с равной вероятностью
- 17. Как выбрать случайный выбор из набора действий
- 18. Сделать выбор выбранного помощника из набора параметров?
- 19. Случайный выбор строк из набора результатов sql?
- 20. Выбор определенной строки из набора данных
- 21. Выбор функции ансамбля из набора функций
- 22. XPath: выбор из набора узлов, возвращаемых функцией
- 23. Выбор случайного элемента набора мощности
- 24. Лучший способ загрузки изображений из набора приложений
- 25. Выбор столбцов из набора результатов хранимой процедуры
- 26. Выбор определенных столбцов из набора данных
- 27. Выбор элементов из неизвестного набора множеств
- 28. Выбор TOP 1 из результирующего набора
- 29. Выбор N случайных чисел из набора
- 30. Выбор различного набора тегов из HTML DOM
Спасибо, что ответили. Я думал, что перекрестная проверка будет правильным подходом. Чтобы уточнить, вы предлагаете мне выполнить кросс-проверку на моем подмножестве и использовать остальную часть моих данных как «неизвестный» набор данных, который я бы хотел проанализировать? –
Точно. Не выполняйте кросс-валидации на всем наборе, иначе вы перевернете свою модель. – rpd
Мысль так. Благодаря! –