Когда дело доходит до нормальных ANN или любого из стандартных методов машинного обучения, я понимаю, какие комплекты обучения, тестирования и валидации должны быть (как концептуально, так и соотношение «правило большого пальца»). Однако для двунаправленной сети LSTM (BLSTM), как разбить данные, меня смущает.Наборы для тестирования, тестирования и валидации для двунаправленного LSTM (BLSTM)
Я пытаюсь улучшить прогнозирование отдельных данных предмета, которые состоят из контролируемых значений здоровья. В простейшем случае для каждого субъекта существует один длинный ряд значений (> 20 тыс. Значений), а смежные части этого временного ряда помечены из набора категорий в зависимости от текущего состояния здоровья субъекта. Для BLSTM сеть обучается всем данным, идущим вперед и назад одновременно. Проблема в том, как разделить временной ряд для одного предмета?
- Я не могу просто взять последние 2000 значений (например), потому что они могут попасть в одну категорию.
- И я не могу прерывать временные ряды случайным образом, потому что тогда фазы обучения и тестирования будут состоять из разрозненных кусков.
Наконец, каждый из предметов (насколько я могу судить) имеет несколько иные (но похожие) характеристики. Так, может быть, так как у меня есть тысячи предметов, я тренируюсь на некоторых, тестирую на некоторых и проверяю на других? Однако, поскольку между предметными различиями существуют различия, как мне настроить тесты, если бы я рассматривал только один предмет для начала?