0

В настоящее время я создаю CNN, чтобы различать гнилое яблоко и нормальное яблоко. Я чувствую, что было бы очень полезно, если бы я мог кормить CNN изображениями rgb. Однако, что именно мне нужно изменить на следующую сеть?Как обучить CNN с изображением RGB

x = tf.placeholder('float', [None, 784]) 
#y = tf.placeholder(tf.float32, shape=(), name="init") 
y = tf.placeholder('int32') 

keep_rate = 0.8 
keep_prob = tf.placeholder(tf.float32) 

def conv2d(x, W): 
    return tf.nn.conv2d(x, W, strides=[1,1,1,1], padding='SAME') 

def maxpool2d(x): 
    #      size of window   movement of window 
    return tf.nn.max_pool(x, ksize=[1,2,2,1], strides=[1,2,2,1], padding='SAME') 



def convolutional_neural_network(x): 
    weights = {'W_conv1':tf.Variable(tf.random_normal([5,5,1,32])), 
       'W_conv2':tf.Variable(tf.random_normal([5,5,32,64])), 
       'W_fc':tf.Variable(tf.random_normal([7*7*64,1024])), 
       'out':tf.Variable(tf.random_normal([1024, n_classes]))} 

    biases = {'b_conv1':tf.Variable(tf.random_normal([32])), 
       'b_conv2':tf.Variable(tf.random_normal([64])), 
       'b_fc':tf.Variable(tf.random_normal([1024])), 
       'out':tf.Variable(tf.random_normal([n_classes]))} 

    x = tf.reshape(x, shape=[-1, 28, 28, 1]) 

    print("test") 
    print(x) 
    conv1 = tf.nn.relu(conv2d(x, weights['W_conv1']) + biases['b_conv1']) 
    conv1 = maxpool2d(conv1) 

    conv2 = tf.nn.relu(conv2d(conv1, weights['W_conv2']) + biases['b_conv2']) 
    conv2 = maxpool2d(conv2) 

    fc = tf.reshape(conv2,[-1, 7*7*64]) 
    fc = tf.nn.relu(tf.matmul(fc, weights['W_fc'])+biases['b_fc']) 
    fc = tf.nn.dropout(fc, keep_rate) 

    output = tf.matmul(fc, weights['out'])+biases['out'] 
    return output 

Я попытался изменить определенные значения, однако я постоянно получаю одну ошибку за другой. В настоящее время эта сеть предназначена для получения изображений с разрешением 28 на 28 каналов 1 в оттенках серого.

ответ

2

Единственное различие между серой шкалы и RGB изображения являются количество полос, соответственно 1 и 3.

Итак, ваш CNN должен принимать 3 полосы в качестве входных данных, а не 1. Остальные будут обрабатываться.

Не делая ваш код запуска, вам нужно как минимум изменить:

weights = {'W_conv1':tf.Variable(tf.random_normal([5,5,3,32])) 
x = tf.reshape(x, shape=[-1, 28, 28, 3]) 
+0

К сожалению, я случайно нажал кнопку вниз голосов. Это не позволяет мне отменить голосование. –

+0

Также нужно также изменить четвертое значение шагов и k-размера в моей maxpool-функции на 3, так как теперь значение цветового канала равно трем? –

+0

Ага, если вы отредактируете свой ответ, я могу отменить подачу голоса –

Смежные вопросы