2010-04-07 3 views
2

Не могу понять, как установить приблизительную максимальную цену для коллекции записей.Как установить фильтр по расчетной максимальной цене

Чего я хочу избежать - просто использовать SQL MAX, потому что, возможно, есть записи с непомерными ценами.

Например, в категории «компьютеры-метиз» из OLX (http://www.olx.com/computers-hardware-cat-240) фильтр для максимальной цены является estimately значения $ 1400, но сортировка по цене, первые пункты выше $ 10000

Может быть, они рассчитывали а затем оценил некоторую максимальную цену ... как вы думаете?

ответ

3

Если предполагается нормальное (гауссово) распределение по ценам можно оценить максимум, используя эту формулу

avg(price) + 3*stddev(price)

Если distribiution действительно гауссовский около 95% образцов должны содержаться в [avg - 3 * stddev; avg + 3 * stddev]

+0

Есть ли способ найти максимум, который содержит 90% образцов, вместо 95%? Я прошу об этом, потому что если есть 2 или 3 непомерных цен, расчетный максимум будет слишком высоким ... Я попытался заменить 3 * на 2 *, и я думаю, что он ближе к тому, что я ищу для ... –

+0

3 - это просто обычное значение, вы можете изменить его в соответствии с вашими потребностями, например, я сказал, что это зависит от распределения образцов. Очевидно, вы можете просто удалить выбросы вручную, но я предполагаю, что дело не в этом. – pablochan

0

так что вы просите? компьютеры делают то, что их точно просят сделать. Посмотрите на статистические функции - средний и т.д. (http://en.wikipedia.org/wiki/Median)

+1

Немного снисходительно, вам не кажется? –

Смежные вопросы