mukey cokey hzdept_r hzdepb_r
422927 11090397 0 20
422927 11090397 20 71
422927 11090397 71 152
422927 11090398 0 18
422927 11090398 18 117
422927 11090398 117 152
Я хотел бы подмножить вышедший над ним кадр данных, так что выбирается только ПЕРВЫЙ КОМПЛЕКТ Cokey (в данном случае 11090397). Конечно, поскольку это образец данных, решение должно масштабироваться до более крупных версий такого кадра данных.Подмножество данных на основе поля
В этом случае результирующий набор данных должен быть:
mukey cokey hzdept_r hzdepb_r
422927 11090397 0 20
422927 11090397 20 71
422927 11090397 71 152
Я попытался с помощью GroupBy, но не знаете, как выбрать только первое значение cokey оттуда.
Есть ли преимущество в первом уникальном значении по сравнению с первым значением? – cphlewis
не совсем, это просто еще один метод получения значений из df – EdChum
. В уникальной документации не указано, что он поддерживает порядок, тo. – cphlewis