2009-11-13 7 views
2

Предположим, что я провел опрос 10 человек, спрашивающих, следует ли оценивать фильм как от 0 до 4 звезд. Допустимые ответы: 0, 1, 2, 3 и 4.Статистика Вопрос

Среднее - 2.0 звезды.

Как рассчитать уверенность (или неопределенность) об этом рейтинге в 2,0 звезды? В идеале, я хотел бы число от 0 до 1, где 0 представляет полную неопределенность, а 1 представляет собой полную определенность.

Понятно, что наиболее вероятным будет случай, когда 10 человек выбирают (2, 2, 2, 2, 2, 2, 2, 2, 2, 2), в то время как случай, когда выбирают 10 человек (0, 0, 0, 0, 0, 4, 4, 4, 4, 4) было бы наименьшим. (0, 1, 1, 2, 2, 2, 2, 3, 3, 4) будет где-то посередине.

ответ

6

Стандартное отклонение не запросило свойств. Это нуль, когда каждый выбирает один и тот же ответ и может быть таким же большим, как sqrt (40/9) = 2.11, когда есть пять 0 и пять 4 сек.

Я предлагаю вам использовать 1-stdev (x)/sqrt (40/9), который будет принимать значение 1, когда все согласятся, и значение 0, когда есть пять 0 и пять 4 секунд.

+0

Я тоже думал об этом, но я не знал, был ли статистический расчет, который конкретно затрагивает этот тип вопроса. Я ждал, чтобы пойти в Google и найти что-то очевидное, связанное с вычислением «степени согласия» в ответах на субъективные вопросы опроса, но не повезло. Спасибо за ваш ответ. Я попробую ваше предложение и посмотрю, как это работает. –

3

Функция, которой вы пользуетесь здесь, является standard deviation.

Стандартные отклонения трех ваших примеров: 0 (это означает отсутствие отклонений), 2.1 (большое отклонение) и 1,15 (между ними).

+0

Jinx, вы должны мне кокс. : P –

0

Вы должны рассмотреть, является ли среднее значение подходящей статистикой для такого рода информации. т. е. есть ли фильм с рейтингом 2 звезды в два раза выше, чем один рейтинг 4 звезды?

Вам может быть лучше, если использовать меру пропорциональности (например, медианную), чтобы представить центральную тенденцию, и диапазон процентилей (например, IQR) для измерения «уверенности». Как и в вышеприведенных ответах, определенность будет наибольшей при значении 0, так как вы действительно делаете измерение отклонения от центральной тенденции.

Кстати, опрос, состоящий из 10 человек, слишком мал, чтобы значительно улучшить значимый статистический анализ.