x_train:(153347,53)
x_test:(29039,52)
y:(153347,)
Я работаю с sklearn. Для того, чтобы пересечь проверить и изменить свой набор данных я сделал:Как исправить изменение набора данных для перекрестной проверки?
x_train, x_test, y_train, y_test = cross_validation.train_test_split(
x, y, test_size=0.3)
x_train = np.pad(x, [(0,0)], mode='constant')
x_test = np.pad(x, [(0,0)], mode='constant')
y = np.pad(y, [(0,0)], mode='constant')
x_train = np.arange(8127391).reshape((-1,1))
c = x.T
np.all(x_train == c)
x_test = np.arange(1510028).reshape((-1,1))
c2 = x.T
np.all(x_test == c2)
y = np.arange(153347).reshape((-1,1))
c3 = x.T
np.all(y == c3)
Мое сообщение об ошибке: ValueError: Найдены массивы с противоречивым числом образцов: [2 153347]
Я не уверен, что мне нужно раздуть мой набор данных в этом случае и изменение не работает. Любые идеи о том, как я могу это исправить?
Возможно, вам стоит упомянуть, что вы используете sklearn и описываете больше, что вы делаете. В противном случае шансы высоки, что их просто игнорируют. – fricke
Хорошо, спасибо за подсказку. – Bolajio
где это сообщение, исходя из? Кажется, что вы просто передали транспонированный 'y' – lejlot