Я проанализировал файл .xlsx
на pandas dataframe
и желал конвертировать в список кортежей. pandas dataframe
имеет две колонки.Pandas dataframe к списку кортежей
Список кортежей требует product_id
, сгруппированных по transaction_id
. Я видел post при создании pandas dataframe
в список кортежей, но результат кода сгруппирован с transaction_id
, сгруппированным с `product_id.
Как я могу получить список кортежей в нужном формате в нижней части страницы?
import pandas as pd
import xlrd
#Import data
trans = pd.ExcelFile('/Users/Transactions.xlsx')
#parse xlsx file into dataframe
transdata = trans.parse('Orders')
#view dataframe
#print transdata
transaction_id product_id
0 20001 48165
1 20001 48162
2 20001 48166
3 20004 48815
4 20005 48165
transdata = trans.parse('Orders')
#Create tuple
trans_set = [tuple(x) for x in subset.values]
print trans_set
[(20001, (48165), (20001, 48162), (20001, 48166), (20004, 48815), (20005, 48165)]
Desired Result:
[(20001, [48165, 48162, 48166]), (20004, 48815), (20005, 48165)]
Пожалуйста, задать новый вопрос. Покажите DataFrame, который у вас есть, и желаемый формат CSV. – unutbu
Извините @unutbu Я новый пользователь python, имел в виду неправильный тип данных. Ваш результат дал список кортежей, как мне сохранить как .csv? –
Что должно выглядеть CSV? Например, должны ли '(20, [1, 2, 3])' становиться '" 20,1,2,3 "или' '20, "[1, 2, 3]" 'или что-то еще? – unutbu