Моя CSV-файл содержит столбцы, такие как:Как использовать столбец ввода в качестве основного индекса в иерархической индексации в пандах?
col1 col2
1 0.9
1 0.3
2 0.4
2 0.9
2 0.1
3 0.0
4 0.5
4 0.9
И я это в кадр данных, поэтому, естественно ФР добавляет индекс для всех строк.
Я хочу, чтобы первый столбец как мой основной индекс, и в пределах каждого основного индекса, имеет незначительный индекс, такие как:
ID col1 col2
1 1 0.9
2 0.3
2 1 0.4
2 0.9
3 0.1
3 1 0.0
4 1 0.5
2 0.9
Как мне это сделать?
Моя конечная цель состоит в том, чтобы устранить строки определенного основного идентификатора. Например, если среднее значение строк в Major ID 4 меньше 0,5, я удалю эти строки.
Я предполагаю, что лучший способ - использовать основной индекс, но если есть лучший способ, пожалуйста, дайте мне знать.
Это круто! Благодарю. Но даже если я добавлю этот индекс, используя 'set_index', как вы сказали, как мне легко выбрать все строки этого основного индекса? то есть в моем вопросе, скажем, я хотел бы выбрать все строки основного индекса '1'? – Candic3