2016-09-28 5 views
1
x_train = train['date_x','activity_category','char_1_x','char_2_x','char_3_x','char_4_x','char_5_x','char_6_x', 
'char_7_x','char_8_x','char_9_x','char_10_x',.........,'char_27','char_29','char_30','char_31','char_32','char_33', 
'char_34','char_35','char_36','char_37','char_38'] 
y = y_train 
x_test = test['date_x','activity_category','char_1_x','char_2_x','char_3_x','char_4_x','char_5_x','char_6_x', 
'char_7_x','char_8_x','char_9_x','char_10_x','char_1_y','group_1','char_1_y','char_2_y','char_3_y', 'char_4_y','char_5_y','char_6_y','char_7_y', 
'char_8_y','char_9-y','char_10_y', ...........,'char_29','char_30','char_31','char_32','char_33', 
'char_34','char_35','char_36','char_37','char_38'] 

train.iloc([0:17,19:38]) 

После попытки срезать колонки с помощью train([0:17,19:38)], я прибегал к вводу данных для всех имен столбцов. Это довольно громоздкий способ сделать это, но я получаю только то, что я называю 19:38. Я получаю сообщение об ошибке Key для его первого способа, вызвав имена столбцов.Вызов подмножества набора данных

+0

Если 'pandas' ведет себя что-нибудь подобное' numpy', вы должны быть в состоянии используйте 'numpy.r_ [0: 17,19: 38]', чтобы превратить эти фрагменты в матовый индексный массив. –

+0

Еще лучше: 'pandas.np.r_ [0: 17,19: 38]'. –

ответ

1

Как было предложено @AndrasDeak
Рассмотрим pd.DataFrametrain

train = pd.DataFrame(np.arange(1000).reshape(-1, 20)) 

Затем используйте предложение как этот

train.iloc[np.r_[0:17, 19:38]] 
Смежные вопросы