Предполагая, что я хочу обновить предварительно подготовленную матрицу встраивания слов во время обучения, существует ли способ обновить только подмножество матрицы встраивания слов?Обновление только части матрицы встраивания слов в Tensorflow
Я смотрел на страницу API Tensorflow и нашел это:
# Create an optimizer.
opt = GradientDescentOptimizer(learning_rate=0.1)
# Compute the gradients for a list of variables.
grads_and_vars = opt.compute_gradients(loss, <list of variables>)
# grads_and_vars is a list of tuples (gradient, variable). Do whatever you
# need to the 'gradient' part, for example cap them, etc.
capped_grads_and_vars = [(MyCapper(gv[0]), gv[1])) for gv in grads_and_vars]
# Ask the optimizer to apply the capped gradients.
opt.apply_gradients(capped_grads_and_vars)
Однако, как я могу подать заявление, что к слову-вложение матрицы. Предположим, что я делаю:
word_emb = tf.Variable(0.2 * tf.random_uniform([syn0.shape[0],s['es']], minval=-1.0, maxval=1.0, dtype=tf.float32),name='word_emb',trainable=False)
gather_emb = tf.gather(word_emb,indices) #assuming that I pass some indices as placeholder through feed_dict
opt = tf.train.AdamOptimizer(1e-4)
grad = opt.compute_gradients(loss,gather_emb)
Как затем использовать opt.apply_gradients
и tf.scatter_update
обновить оригинальную embeddign матрицу? (Кроме того, tensorflow выдает ошибку, если второй аргумент compute_gradient
не tf.Variable
)
Как вы определяете «подмножество» здесь ? – viksit
Только подмножество строк в матрице встраивания.Поскольку каждая строка является вектором вложения слов, это всего лишь подмножество векторов вложения слов из исходной матрицы вложения слова – user1718064
http://deeplearning.net/software/theano/tutorial/faq_tutorial.html Это то, что я хотел бы как добиться, но в Tensorflow – user1718064