Я пытаюсь построить CLDNN, что исследованный в работе hereTensorflow уменьшить размеры ранга 3 тензора
После сверточных слоев, особенности пройти через слой тускло-восстановительным. В момент, когда функции покидают конверовские слои, размеры составляют [?, N, M]
. N представляет количество окон, и я думаю, что сеть требует уменьшения размера M, поэтому размеры объектов после тусклого красного слоя составляют [?,N,Q]
, где Q < M
.
У меня есть два вопроса.
Как это сделать в TensorFlow? Я попытался с помощью гири с
W = tf.Variable(tf.truncated_normal([M,Q],stddev=0.1))
Я думал, что умножение
tf.matmul(x,W)
даст[?, N, Q]
но[?, N, M]
и[M, Q]
не являются допустимыми размерами для умножения. Я хотел бы сохранить N постоянным и уменьшить размер M.Какую нелинейность следует применять к исходу
tf.matmul(x,W)
? Я думал об использовании ReLU, но я даже не мог сделать # 1.