2016-12-20 3 views
2

the error messageМодель CNN, почему данные слишком велики?

the model structure

  • использование keras и tensorflow бэкенд
  • только
  • использование процессора, памяти 128GB
  • входных данных имеет форму (45,1024,1024)
  • модель имеет только один сверток, один (2,2) максимальный пул
  • a 1024 * 1024 полностью подключен.

Я получил сообщение об ошибке:

Недопустимый аргумент: Shape [4194304,1048576] слишком большой (более 1099511627776 записей)

к сведению, что:

4194304 = 2048 * 2048 
1048576 = 1024 * 1024 

Как керы вычислили эту форму? почему он слишком велик?

ответ

0

Форма [4194304, 1048576] вычисляется следующим образом:

Применение 16 извилины размера [3, 3] с режимом same границы на входы размера [1024, 1024, 3] дает нам выход размера [1024, 1024, 16]. После максимального объединения размера 2 он становится [512, 512, 16], который при сплющивании составляет 512 * 512 * 16 = 4194304. 1048576 исходит от 1024 * 1024, как указано в конструкторе слоя Dense.

Я думаю, вы должны пересмотреть архитектуру вашей модели. Вы можете использовать входы меньшего размера, добавлять несколько слоев объединения, уменьшать размерность, используя 1 x 1 свертки. И я сомневаюсь, что 1024 * 1024 - разумное количество узлов в полностью подключенном слое.

Смежные вопросы