У меня есть pandas DataFrame
под названием data
с колонкой ms
. Я хочу исключить все строки, где data.ms
выше 95% процентиля. На данный момент я делаю это:Устранение всех данных по данному процентилю
limit = data.ms.describe(90)['95%']
valid_data = data[data['ms'] < limit]
который работает, но я хочу обобщить это на любой процентиль. Каков наилучший способ сделать это?
с помощью панд, если я хочу сравнивать различные седловины с определенными квантилями, есть быстрый способ, подобный NumPy вещание? –
также работает при удалении по всем столбцам, то есть 'df [df