У меня есть список значений, описывающих некоторую совокупность. Значения распределяются на два пика, как показано на приведенной ниже гистограмме. Разделить популяцию на два в Python
Есть ли простой способ автоматического обнаружения «зазора» в центре распределения и разбиения исходного списка на две стороны? Идеально использовать numpy, если это возможно.
Редактировать добавить: Очевидно, я мог бы просто отсортировать список, перебрать его и разбить на первое нулевое значение, но Я надеюсь, что существует более надежный метод, который является «разумным», даже если оба пика не так четко разделены. Обратите внимание, что комментарий strikethro не работает, это гистограмма, которая имеет нулевые значения, а не данные, oops!
только один раскол? что, если есть еще один образец, например:: 0,4 –
Ну, только наличие 2 подгрупп было частью первоначального предположения, но вы заставили меня расспросить его по моему конкретному случаю! – lost