2016-06-14 2 views
3

Я пытаюсь создать CNN, используя Tensorflow, который классифицирует изображения в 16 классов.Ошибка Tensorflow cnn: логины и метки должны быть одинакового размера:

Мой оригинального размер изображения 72x72x1, и моя сеть построена так:

# Network 
n_input = dim 
n_output = nclass # 16 
weights = { 
    'wc1': tf.Variable(tf.random_normal([5, 5, 1, 32], stddev=0.1)), 
    'wc2': tf.Variable(tf.random_normal([5, 5, 32, 64], stddev=0.1)), 
    'wd1': tf.Variable(tf.random_normal([9*9*128, 1024], stddev=0.1)), 
    'wd2': tf.Variable(tf.random_normal([1024, n_output], stddev=0.1)) 
} 
biases = { 
    'bc1': tf.Variable(tf.random_normal([32], stddev=0.1)), 
    'bc2': tf.Variable(tf.random_normal([64], stddev=0.1)), 
    'bd1': tf.Variable(tf.random_normal([1024], stddev=0.1)), 
    'bd2': tf.Variable(tf.random_normal([n_output], stddev=0.1)) 
} 

Вот мои ко чистая функция:

def conv_basic(_input, _w, _b, _keepratio): 
# Input 
_input_r = tf.reshape(_input, shape=[-1, 72, 72, 1]) 

# Conv1 
_conv1 = tf.nn.relu(tf.nn.bias_add(
     tf.nn.conv2d(_input_r, _w['wc1'], strides=[1, 1, 1, 1], padding='SAME') 
     , _b['bc1'])) 
_pool1 = tf.nn.max_pool(_conv1, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME') 
mean, var = tf.nn.moments(_pool1, [0, 1, 2]) 
_pool1 = tf.nn.batch_norm_with_global_normalization(_pool1, mean, var, 1., 0., 1e-7, 0) 
_pool_dr1 = tf.nn.dropout(_pool1, _keepratio) 

# Conv2 
_conv2 = tf.nn.relu(tf.nn.bias_add(
     tf.nn.conv2d(_pool_dr1, _w['wc2'], strides=[1, 1, 1, 1], padding='SAME') 
     , _b['bc2'])) 
_pool2 = tf.nn.max_pool(_conv2, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME') 
mean, var = tf.nn.moments(_pool2, [0, 1, 2]) 
_pool2 = tf.nn.batch_norm_with_global_normalization(_pool2, mean, var, 1., 0., 1e-7, 0) 
_pool_dr2 = tf.nn.dropout(_pool2, _keepratio) 

# Vectorize 
_dense1 = tf.reshape(_pool_dr2, [-1, _w['wd1'].get_shape().as_list()[0]]) 

# Fc1 
_fc1 = tf.nn.relu(tf.add(tf.matmul(_dense1, _w['wd1']), _b['bd1'])) 
_fc_dr1 = tf.nn.dropout(_fc1, _keepratio) 

# Fc2 
_out = tf.add(tf.matmul(_fc_dr1, _w['wd2']), _b['bd2']) 

# Return everything 
out = { 
    'input_r': _input_r, 
    'conv1': _conv1, 
    'pool1': _pool1, 
    'pool1_dr1': _pool_dr1, 
    'conv2': _conv2, 
    'pool2': _pool2, 
    'pool_dr2': _pool_dr2, 
    'dense1': _dense1, 
    'fc1': _fc1, 
    'fc_dr1': _fc_dr1, 
    'out': _out 
} 
return out 

Когда я пытаюсь запустить это, я получаю ошибка: "tensorflow.python.framework.errors.InvalidArgumentError: logits and labels must be same size: logits_size=[6,16] labels_size=[1,16]"

на линии cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(_pred, y))

Я попытался изменить весовые значения wd1, и, кроме того, что запрошенная форма требует кратного xxx, она просто меняет значения в скобках.

Эти значения (особенно 6) кажутся очень произвольными, idk, из которых они происходят. Было бы хорошо, если бы кто-то объяснил мне, как выбираются количества нейронов уровня FC, так как это также кажется немного произвольным.

Благодаря

EDIT: Мой полный код https://gist.github.com/EricZeiberg/f0b138d859b9ed00ce045dc6b341e0a7

ответ

0

Его трудно сказать, от того, что вы предоставили, но, кажется, как вы кормите входы с партии размером 6, но только обеспечивают одну метку для них. Откуда берутся ваши данные?

+0

Я отредактировал сообщение, чтобы включить мой полный код – Eric

3

Учитывая Ваш код (и гадать, чего не хватает в нем), я думаю, что у вас есть эти параметры и результаты (поправьте меня, если ошибаюсь):

  • batch_size: 1
  • num_classes: 16
  • этикетки y: тип INT, форма [batch_size, 1]
  • выходы _pred: тип float32, должен быть форма [batch_size, num_classes]

В коде, вы используете только 2 Макс пулы, которые уменьшают карту ввода функции от [1, 72, 72, 1] до [1, 18, 18, 64].

На этом шаге вы должны написать:

# Vectorize 
_dense1 = tf.reshape(_pool_dr2, [1, 18*18*64]) 

Вы также должны заменить матрицу wd1 с:

'wd1': tf.Variable(tf.random_normal([18*18*64, 1024], stddev=0.1)) 

В целом в этих ситуациях необходимо печатать каждую форму , шаг за шагом и реализовать самостоятельно, где форма не соответствует ожидаемому.

+0

Я отредактировал сообщение, чтобы включить мой полный код – Eric

+0

После того, как вы пробовали свой код, теперь он говорит: «ValueError: невозможно передать значение формы (1, 16) для Tensor u'Reshape_3: 0 ', который имеет форму' (1,) '' – Eric

+0

О, также, у меня размер партии 1, а num_classes - 16 – Eric

Смежные вопросы