У меня есть CSV-файл с 25 столбцами. В этих данных столбец 18 является идентификатором People_ID, а столбец 19 является датой пожертвования. Я предварительно отсортировал данные с помощью Linux, чтобы все идентификаторы людей отображались вместе, отсортированные по дате пожертвования в порядке убывания.Как сравнить строки в файле данных (.csv) на основе двух значений, а затем свертывать данные с помощью Python?
Здесь я не уверен, как действовать. Мне нужно найти все строки, которые имеют одинаковые People_ID и Дата пожертвования, суммировать различные значения, а затем выводить одну строку в вывод. Таким образом, каждая строка в файле будет либо другим клиентом, либо другой датой пожертвования одним и тем же клиентом. Было бы лучше использовать словарь, используя People_ID в качестве ключа? Как это выглядит синтаксически?
Я думал, что-то вроде этого:
with open("file.csv") as csv_file:
for row in csv.reader(csv_file, delimiter=','):
if row[18] in data_dict:
# something something
sqlite сам по себе также может быть полезен для такого рода задач. – Paul
Итак, есть линии, которые разделяют «People_ID», линии, которые делят «Дату пожертвования», и строки, которые разделяют оба? И вы хотите отсортировать транзакции в отдельном ведре для каждой уникальной комбинации «People_ID» и «Дата пожертвования»? – TigerhawkT3
Имеет ли ваш файл специальную первую строку или заголовок, который называет столбцы? – Paul