1

Когда дело доходит до нормальных ANN или любого из стандартных методов машинного обучения, я понимаю, какие комплекты обучения, тестирования и валидации должны быть (как концептуально, так и соотношение «правило большого пальца»). Однако для двунаправленной сети LSTM (BLSTM), как разбить данные, меня смущает.Наборы для тестирования, тестирования и валидации для двунаправленного LSTM (BLSTM)

Я пытаюсь улучшить прогнозирование отдельных данных предмета, которые состоят из контролируемых значений здоровья. В простейшем случае для каждого субъекта существует один длинный ряд значений (> 20 тыс. Значений), а смежные части этого временного ряда помечены из набора категорий в зависимости от текущего состояния здоровья субъекта. Для BLSTM сеть обучается всем данным, идущим вперед и назад одновременно. Проблема в том, как разделить временной ряд для одного предмета?

  • Я не могу просто взять последние 2000 значений (например), потому что они могут попасть в одну категорию.
  • И я не могу прерывать временные ряды случайным образом, потому что тогда фазы обучения и тестирования будут состоять из разрозненных кусков.

Наконец, каждый из предметов (насколько я могу судить) имеет несколько иные (но похожие) характеристики. Так, может быть, так как у меня есть тысячи предметов, я тренируюсь на некоторых, тестирую на некоторых и проверяю на других? Однако, поскольку между предметными различиями существуют различия, как мне настроить тесты, если бы я рассматривал только один предмет для начала?

ответ

0

Я думаю, что это больше связано с вашим конкретным набором данных, чем с Bi-LSTM в целом.

Вы вводите в заблуждение разделение набора данных для обучения/тестирования против разделения последовательности в конкретном образце. Похоже, у вас много разных тем, которые составляют другой образец. Для стандартного разделения обучения/тестирования вы разделили бы ваш набор данных между субъектами, как вы предложили в последнем абзаце.

Для любого вида приложения RNN вы НЕ разделяете свою временную последовательность; вы вводите всю свою последовательность в виде единственного образца в свой Bi-LSTM. Поэтому действительно возникает вопрос, подходит ли такая модель вашей проблеме, которая имеет несколько меток в определенных точках последовательности. Вы можете использовать вариант последовательности для последовательности LSTM-модели, чтобы предсказать, какая метка имеет каждый момент времени в последовательности, но опять же вы НЕ разделили бы последовательность на несколько частей.

Смежные вопросы