2017-01-04 2 views
0

Если я правильно понимаю игру, есть доска 19x19. В газете AlphaGo Nature, http://www.nature.com/nature/journal/v529/n7587/full/nature16961.html, упоминается сверточная сеть. Мое понимание сверточных сетей - это примеры распознавания образов. Тогда как можно применить сверточную сеть к этой проблеме? Разве это не перебор, чтобы превратить доску в изображение 19x19?Как используются сверточные сети в AlphaGo?

ответ

1

Go сильно влияет на шаблоны, и, как вы могли заметить в классификации изображений, сверточные сети хороши в этом.

Вы спрашиваете, есть ли перебор, чтобы сменить бордюр на 19 * 19-образное изображение, я должен признать, что я не пытался создать его изображение, скажем 0 для черного камня, 0,5 без камней и 1 для белого камня и тренировки сети с ним, но я уверен, что он будет работать в некоторой степени.

Вещи более экстремальные, чем это! плата 19 * 19 go преобразуется в тензор 19 * 19 * 48. (в качестве изображения rgb было бы только 19 * 19 * 3) один самолет для черных камней один самолет для белых камней один самолет для пустых пластов и еще 45 самолетов, которые кодируют несколько значений, которые полезны для сети, чтобы знать. (такие вещи, как свобода, atari, вольности после переезда, все они есть в газете, но вы должны знать немного больше о том, чтобы понять их)

это перебор, определенно нет! сверточные сети хорошо разбираются в шаблонах, но для этого им нужна правильная информация. например, ladder невозможно обнаружить в этой сети, так как невозможно получить эту информацию с одной стороны платы на другую и обратно в пределах используемых 13-ти слоев, поэтому некоторые из 48-дюймовых плоскостей используются для передачи информации в сеть если какой-то ход - захват лестницы или движение лестницы.

Смежные вопросы