Я тренирую сеть LSTM, и я ищу, чтобы понять лучшие практики обучения длинных последовательностей, длины O (1k) или более. Что такое хороший подход к выбору размера мини-бара? Каким образом искажение в распространенности лейбла повлияет на этот выбор? (Положительные результаты встречаются редко в моем сценарии). Стоит ли пытаться перебалансировать мои данные? Спасибо.Обучение RNN на длинных последовательностях
3
A
ответ
2
Возможно, вы захотите перебалансировать, чтобы они составляли 50/50. В противном случае он будет искажаться в том или ином классе.
Что касается размера партии, я бы стал такой же большой, как и в памяти.
Я не уверен, что LSTM смогут изучать зависимости от O (1k), но стоит попробовать. Вы можете посмотреть на что-то вроде wavenet, если вам нужны сверхновые зависимости.
https://deepmind.com/blog/wavenet-generative-model-raw-audio/
Смежные вопросы
- 1. С ++ regex segfault на длинных последовательностях
- 2. RNN L2 Регуляризация прекращает обучение
- 3. Обучение Tensorflow RNN не будет выполнено?
- 4. XQuery последовательностях
- 5. Простой RNN в факеле
- 6. RNN Tensorflow с последовательностями переменной длины, заполненные нули влияют на обучение
- 7. Быстрые алгоритмы поиска уникальных множеств в двух очень длинных последовательностях текста
- 8. ANSI Ключевые последовательностях
- 9. разница Regex в последовательностях
- 10. Обнаружение Ключевые последовательностях
- 11. Регрессионные тесты на произвольных числовых последовательностях
- 12. Clojure: итерация на нескольких (возможно бесконечных) последовательностях
- 13. Scala: регулярное выражение на списках/последовательностях
- 14. POS-тегирование с использованием RNN
- 15. операции побитовое на длинных
- 16. postgresql nextval вопрос о последовательностях
- 17. Обучение шаблонам на C++
- 18. Обучение tesseract на Windows
- 19. SPARQL - обучение на примере
- 20. Запрос на обучение
- 21. Исчезающий/взрывающийся градиент для RNN
- 22. Найти определенные шаблоны в последовательностях
- 23. Обучение классификатора изображений - нейронная сеть
- 24. Сравнение смежных элементов в последовательностях
- 25. Слияние XML в разных последовательностях
- 26. вопрос об общих последовательностях бит
- 27. Ошибка среза Tensorflow RNN
- 28. LSTM с rnn cuda()?
- 29. Тренировка тренировки RNN Tensorflow
- 30. Государственная нормализация RNN