2013-10-14 4 views
1

В качестве статистиков мы сталкиваемся с множеством распределений под баннерами «дискретный», «непрерывный» и «одномерный», «многомерный». Но может ли кто-нибудь предложить мне хорошую причину существования и мотивации так много распределений. Как мы их получаем? и что может понять непрофессионал?Мотивация для статистических распределений

Какова логика существования дистрибутивов?

Пожалуйста, помогите ...

+3

Этот вопрос не по теме, мы (жители SO-land) не являются, как правило, статистиками, и этот веб-сайт не стремится устраивать вопросы, представляющие интерес для статистиков, если вопросы не связаны конкретно с программированием , –

+2

[Cross validated] (http://stats.stackexchange.com/) - это, вероятно, подходящее место, чтобы задать этот вопрос. – Carsten

+0

Этот вопрос не соответствует теме, потому что он принадлежит stats.stackexchange.com –

ответ

0

Discrete/непрерывный/одномерной/многомерной фактически описывает переменные вас интересуют, а не само распределение вероятностей.

1

Какова логика существования дистрибутивов?

Со случайными событиями результат не может быть предсказан с уверенностью. Чтобы попытаться количественно определить, что может случиться, мы описываем его с точки зрения множества возможных результатов и их относительной вероятности возникновения. Также принято преобразовывать случайные события в Случайные переменные путем сопоставления событий с числовой строкой, чтобы мы могли выразить результаты как функции. В общем, дистрибутивы - всего лишь модель для количественной оценки того, что мы можем видеть перед лицом неопределенности.

Для дискретных распределений мы перечисляем (либо явно, либо как функцию) все результаты и их пропорциональность возникновения. Например, если вы бросаете монету, мы описываем два возможных результата: «хвосты» и «головы». Общее отображение - представлять «хвосты» нулем и головами на единицу. Если головки имеют долю p того времени, тогда хвосты будут происходить в остальное время, то есть с долей (1-p). Если это честная монета, то p = (1-p) = 0.5. Если монета поддерживает одну или другую сторону, вы соответствующим образом корректируете значения p.

Обобщение этого на k результатов, вы описываете распределение с точки зрения результатов и их относительных пропорций, p1,…,pk. Существуют два строгих требования: pi> = 0 для всех i и сумма всех pi = 1. Вам даже не нужно k быть конечным, если оба требования выполнены.

Непрерывные распределения немного сложнее, но не слишком много. Мы описываем множество возможных результатов как диапазон и их относительную правдоподобие как функцию плотности f (x). Функция плотности имеет по существу те же два требования: f (x)> = 0 для всех x, а площадь под f (x) = 1.

Почему так много распределений?

В основном потому, что на протяжении многих лет мы наблюдаем, как подобные обстоятельства возникают в различных контекстах, и построили модели распределения для описания этих повторяющихся обстоятельств. Распределение Бернулли описывает любой эксперимент, который дает один из двух возможных результатов (отображается на 0/1) с фиксированной вероятностью для каждого результата, например, пример броска монет, приведенный ранее. Распределение Бернулли является строительным блоком для нескольких других распределений. Например, если вы собираетесь выполнять фиксированное число независимых, но идентичных экспериментов Бернулли, число 1, которое вы наблюдаете, моделируется с использованием биномиального распределения с параметрами n (число проб Бернулли) и p (вероятность получения одного в каждом испытании). Это достойная модель того, сколько голов вы могли бы наблюдать, если вы перевернули монету n раз или сколько предметов может не пройти проверку, если вы проверите n предметов, каждая из которых имеет вероятность p быть плохим.В качестве альтернативы, возможно, вы хотите описать, сколько монетных флагов необходимо до того, как появятся первые головы или сколько рыбы вам нужно намотать, прежде чем вы получите форель - в этом случае геометрическое распределение будет разумной моделью.

По существу, каждое распределение описывает множество возможных результатов и их относительных правдоподобия при определенных предположениях о том, что вы хотите наблюдать и какие правила или ограничения применяются к экспериментам или испытаниям, которые будут генерировать эти наблюдения. В той степени, в которой вы выбираете подходящую модель и предположения, эти распределения позволяют нам правильно определить вероятный набор результатов.

Об этом написано тысячи книг, так что это, безусловно, очень глянцевый обзор. Я надеюсь, что это даст вам представление о том, что это такое.

Смежные вопросы