У меня есть панд dataframe ДФ с этим настройкиCompute частоты значения в панд dataframe
col1 col2
v1 i1
v1 i50
v2 i60
v2 i1
v2 i8
v10 i8
v10 i1
v10 i2
..
Я хотел бы, чтобы вычислить, сколько из элементов, входящих col1 имеет значение col2. И хранить результаты в dataframe с помощью этой установки
col1 frequency
i1 80
i2 195
... ...
Я попытался сделать это в панд,
item_frequency = pd.unique(relevant_data[relevant_data['col2'].isin(pd.unique(relevant_data['col2'].values.ravel()))]['col1'].values.ravel())
, который приносит ошибку
raise ValueError('Lengths must match to compare')
ValueError: Lengths must match to compare
PS: Я хотел бы сделать это в векторном виде.
Не могли бы вы уточнить вашу задачу, с точным входом малогабаритного и результат вы хотите получить от этого входа? –
, поэтому результат должен быть col1, col2, frequency? –
Ваш желаемый результат не соответствует вашему утверждению, считаете ли вы чисто частоту элемента или частоту элемента за транзакцию? – EdChum