2016-03-17 3 views
1

Я хотел бы назвать столбцы, когда я импортировать файл CSV в dataframe с DASK в Python.The коде я использую выглядит следующим образом:Имя столбцов при импорте CSV для dataframe в DASK

for i in range(1, files + 1): 
    filename = str(i) + 'GlobalActorsHeatMap.csv' 
    runs[i] = dd.read_csv(filename, header=None) 

Я хотел бы использовать массив с именами для каждого столбца:

имена = [ 'дань', ' percent_countries_active', ' num_wars', «num_trib Утес, 'войны', 'war_to_tribute_ratio', 'US_wealth', 'UK_wealth', 'NZ_wealth' ]

Возможно ли это сделать напрямую?

ответ

1

Просто используйте names аргумент для read_csv

names = [...] 
dd.read_csv(filename, header=None, names=names) 

Подробнее here

+0

Спасибо. Ошибка заключалась в том, что количество столбцов в именах не соответствовало количеству элементов в csv. –

Смежные вопросы