2013-06-11 1 views
1

Как я понимаю, при использовании softmax значений K в видимых единицах RBM скрытый блок остается двоичным.Если я использую softmax в RBM, мне нужно использовать его в скрытых единицах, а также в видимых?

Если это так - я не уверен, как вычислять вклады двоичных единиц в видимые. Должен ли я связывать двоичное состояние 0 в скрытом блоке с конкретным состоянием из состояний K softmax, а состояние 1 - другим состояниям K-1? Или, может быть, 0 в скрытом блоке коррелирует с 0 во всех K возможных состояниях видимой единицы (но разве это не противоречит тому, что должно быть включено хотя бы одно из K-состояний?).

ответ

2

Я думаю, что я понял свое недоразумение: единицы softmax ведут себя как группы двоичных субъединиц, и каждая субъединица имеет свои собственные веса для скрытых единиц. Это означает, что матрица весов между скрытым слоем и видимым слоем является 3-мерной, а не 2, и теперь очевидно, как рассчитать вклады.

+0

Можете ли вы предоставить мне учебник о том, что является слоем softmax и как его использовать в RBM? Я понял, как RBM может обучаться с бинарными видимыми и скрытыми единицами, но не имеет понятия о том, как использовать для не двоичных чисел. Поэтому, пожалуйста, укажите мне некоторые учебные пособия, в которых рассказывается о softmax в этом контексте. – StrikeR

+0

http://www.cs.toronto.edu/~hinton/absps/guideTR.pdf глава 13 – Uri

+0

@Uri Привет, что происходит с термином смещения, связанным с таким модулем softmax? Скажем, у меня есть переменная, которая может принимать 10 возможных значений, поэтому будет только один смещающий термин для этого или 10 различных значений смещения для 10 состояний. – bytestorm

Смежные вопросы