Я хочу генерировать «интервалы категорий» из категорий. к примеру, предположим, что у меня есть следующие:генерировать «категории-интервалы» из категорий
>>> df['start'].describe()
count 259431.000000
mean 10.435858
std 5.504730
min 0.000000
25% 6.000000
50% 11.000000
75% 15.000000
max 20.000000
Name: start, dtype: float64
и уникальное значение в моей колонке:
array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16,
17, 18, 19, 20], dtype=int8)
, но я хочу использовать следующий список интервалов:
>>> intervals
[[0, 2.2222222222222223],
[2.2222222222222223, 4.4444444444444446],
[4.4444444444444446, 6.666666666666667],
[6.666666666666667, 8.8888888888888893],
[8.8888888888888893, 11.111111111111111],
[11.111111111111111, 13.333333333333332],
[13.333333333333332, 15.555555555555554],
[15.555555555555554, 17.777777777777775],
[17.777777777777775, 20]]
изменить мой столбец «start» на значения x
, где x
представляет индекс интервала, который содержит df['start']
(так x
в моем случае будет варьироваться от 0 до 8)
Есть ли более или менее простой способ сделать это, используя pandas/numpy?
Заранее благодарим за помощь.
С уважением.
это eactly то, что я искал, спасибо @ali_m – dark