У меня есть CSV-файл с 2 колонками, представляющий собой распределение элементов в год, который выглядит следующим образом:Группа строк в CSV по блокам 25
A B
1900 10
1901 2
1903 5
1908 8
1910 25
1925 3
1926 4
1928 1
1950 10
и т.д., около 15000 строк.
При создании диаграммы распределения, основанной на этих данных, слишком много точек на топоре, не очень красивое. Я хочу группировать строки по блокам по 25 лет, так что в конце у меня было бы меньше очков на топор. Так, например, от 1900 до 1925 я бы сумму произведенных деталей, 1 строка в колонке и 1 строке в столбце B:
1925 53
1950 15
До сих пор я только фигурировал, как преобразовать данные в CSV файл в целое:
o=open('/dates_dist.csv', 'rU')
mydata = csv.reader(o)
def int_wrapper(mydata):
for v in reader:
yield map(int, v)
reader = int_wrapper(mydata)
не можете найти, как это сделать далее ...
Вау, это было быстро и идеально! Большое спасибо :) – user3241376
@unutbu - Предположительно, 'csv.reader' будет создан следующим образом:' csv.reader (o, delimiter = '', skipinitialspace = True) 'или аналогичный? (для обслуживания нестандартного и переменного разделителя пробелов). – mhawke
@mhawke: Да; поскольку у ОП не возникало проблемы с вызовом вызова 'csv.reader', я не изменял этот код, чтобы он соответствовал тому, как были представлены данные. – unutbu