Учитывая подготовленную модель LSTM, я хочу выполнить вывод для одиночных временных меток, то есть seq_length = 1
в приведенном ниже примере. После каждого временного времени внутренние LSTM (память и скрытые) состояния должны запоминаться для следующей «партии». В самом начале вывода вычисляются внутренние состояния LSTM init_c, init_h
с учетом ввода. Затем они сохраняются в объекте LSTMStateTuple
, который передается в LSTM. Во время обучения это состояние обновляется каждый раз. Однако для вывода я хочу, чтобы state
сохранялся между партиями, т. Е. Начальные состояния нужно было вычислить только в самом начале, после чего состояния LSTM должны сохраняться после каждой «партии» (n = 1).TensorFlow: Помните состояние LSTM для следующей партии (stateful LSTM)
Я нашел этот связанный вопрос StackOverflow: Tensorflow, best way to save state in RNNs?. Однако это работает только в том случае, если state_is_tuple=False
, но это поведение скоро будет отменено TensorFlow (см. rnn_cell.py). У Keras, похоже, есть хорошая обертка, чтобы сделать stateful LSTM возможно, но я не знаю, как это сделать в TensorFlow. Эта проблема на TensorFlow GitHub также связана с моим вопросом: https://github.com/tensorflow/tensorflow/issues/2838
Любые хорошие предложения по созданию модели LSTM с состоянием?
inputs = tf.placeholder(tf.float32, shape=[None, seq_length, 84, 84], name="inputs")
targets = tf.placeholder(tf.float32, shape=[None, seq_length], name="targets")
num_lstm_layers = 2
with tf.variable_scope("LSTM") as scope:
lstm_cell = tf.nn.rnn_cell.LSTMCell(512, initializer=initializer, state_is_tuple=True)
self.lstm = tf.nn.rnn_cell.MultiRNNCell([lstm_cell] * num_lstm_layers, state_is_tuple=True)
init_c = # compute initial LSTM memory state using contents in placeholder 'inputs'
init_h = # compute initial LSTM hidden state using contents in placeholder 'inputs'
self.state = [tf.nn.rnn_cell.LSTMStateTuple(init_c, init_h)] * num_lstm_layers
outputs = []
for step in range(seq_length):
if step != 0:
scope.reuse_variables()
# CNN features, as input for LSTM
x_t = # ...
# LSTM step through time
output, self.state = self.lstm(x_t, self.state)
outputs.append(output)
Возможный дубликат [Tensorflow, лучший способ сохранить состояние в RNN?] (Http://stackoverflow.com/questions/37969065/tensorflow-best-way-to-save-state-in-rnns) –