2008-08-04 3 views
12

Я пишу приложение, чтобы помочь в проведении некоторых исследований, и часть этого включает в себя некоторые статистические вычисления. В настоящее время исследователи используют программу под названием SPSS. Часть продукции, что они заботятся о том, как это выглядит:Как рассчитать эти статистические данные?

[Part of the SPSS output

Они действительно только о значениях F и Sig.. Моя проблема в том, что у меня нет фона в статистике, и я не могу понять, какие тесты вызывают или как их вычислять.

Я думал, что значение F может быть результатом F-test, но после выполнения действий, приведенных в Википедии, я получил результат, который отличался от того, что SPSS дает.

+0

Может кто-то исправить изображение, оно нарушает форматирование –

ответ

4

This website может помочь вам немного больше. Также this one.

Я работаю с довольно ржавый памяти курса статистики, но здесь идет ничего:

Когда вы делаете дисперсионный анализ (ANOVA), вы на самом деле вычислить F статистики как отношение от среднеквадратичные отклонения «между группами» и среднеквадратичные отклонения «внутри групп». Вторая ссылка выше кажется довольно хорошей для этого расчета.

Это делает статистическую меру F именно тем, насколько мощна ваша модель, поскольку дисперсия «между группами» является объяснительной, а дисперсия «внутри групп» является случайной ошибкой. Высокий F подразумевает очень значительную модель.

Как и во многих статистических операциях, вы возвращаете Sig. используя статистику F. Вот где ваша информация в Википедии поставляется немного под рукой. То, что вы хотите сделать, - использование степеней свободы, предоставляемых вам SPSS, - найти правильное значение P, при котором F table даст вам статистику F, которую вы рассчитали. Значение P, где это происходит [F (таблица) = F (вычислено)], является значением.

Концептуально меньшее значение значения показывает очень сильную способность отклонять нулевую гипотезу (которая для этих целей означает, что ваша модель имеет объяснительную силу).

Извините, если кто-либо из них ошибается. Я вернусь, чтобы внести изменения!

Удачи вам. Статистика - это весело, возможно, не эта часть. =)

+0

Это многомерная таблица результатов, которая исключает ANOVA. Это может быть MANOVA, анализ дискриминантных функций или один из многих других многомерных тестов. Короче говоря, статистика жесткая, тесно сотрудничайте с профессионалами и скриптом SPSS через python вместо того, чтобы кататься самостоятельно. –

2

Статистика сложная :-). После года чтения и перечитания книг и газет и могу только с уверенностью сказать, что я понимаю его основы.

Возможно, вы захотите исследовать готовые библиотеки для любого языка программирования, который вы используете, потому что они много полезны в математике в целом и, в частности, в статистике (ошибки округления являются очевидным примером).

В качестве примера вы можете посмотреть the R project, который является одновременно интерактивной средой и библиотекой, которую вы можете использовать из вашего кода на C++, распространяемого под GPL (т. Е. Если вы используете его только внутри страны и публикуете только результатов, вам не нужно открывать код).

2

Вкратце: не делайте этого вручную, связывайте/используйте существующее программное обеспечение. И ответ sain_grocen неверен.:(

Это все тесты для значимости оценок параметров, которые обычно используются в многорежимном ответе Множественные регрессии. Это не было бы простыми вещами, которые можно было бы сделать за пределами среды статистического программирования. Я бы предложил либо получить вывод из pre существующей статистической программы или используя тот, с которым вы можете ссылаться и использовать этот код.

Я боюсь, что первый ответ (sain_grocen's) приведет вас к неправильному пути. Его объяснение, скорее всего, имеет частный случай то, что вы на самом деле имеете в виду. Анова объяснила в своих ссылках, что для одного ответного ответа в сбалансированном дизайне. Это не статистика F, которую вы видите. Имена в вашем выводе (Trace Pillai, Trace Hotell, .. .) - некоторые из доступных мульти ivariate. Они имеют F-распределения при определенных предположениях. Я не могу объяснить здесь учебники, в которых стоит материал, я бы посоветовал вам начать с рассмотрения «Прикладной многомерный статистический анализ» Джонсона и Вичерна

0

Можете ли вы объяснить, почему сам SPSS не является прекрасным решением к проблеме? Это то, что он генерирует сводные таблицы как выходные данные, которые трудно манипулировать? Это стоимость программы?

F-статистика может возникать из любого количества конкретных тестов. F является просто распределением (свободно: описание «частот» групп значений), как нормальный (гауссовский) или униформа. В целом они возникают из-за соотношения дисперсий. Мнение: многие статистики (включая меня), считают, что тесты на основе F нестабильны (жаргон: не прочный).

Конкретная статистика выхода (трассировка Пиллаи и т. Д.) Предполагает, что исходный анализ является примером MANOVA, который, как описывают другие плакаты, является сложной и труднодоступной процедурой.

Я также предполагаю, что на основе MANOVA и использования SPSS это проект психологии или социологии ... если не пожалуйста, просветите. Возможно, другие более простые модели могут быть легче понятны и более повторяемы. Проконсультируйтесь с вашей местной статистической консультационной группой, если таковой имеется.

Удачи вам!

3

Я полагаю из вашего вопроса, что ваши коллеги-исследователи хотят автоматизировать процесс, с помощью которого выполняются определенные статистические анализы (то есть, они хотят выполнять пакетные наборы данных процесса). У вас есть два варианта:

1) SPSS теперь доступен для сценариев через python (начиная с версии 15) - перейдите на spss.com и выполните поиск python. Вы можете писать скрипты python для автоматизации анализа данных и извлечения ключевых значений из сводных таблиц, а затем обрабатывать ответы любым способом. Это позволяет точно сравнивать результаты вашего сценария python и усилия, рассчитанные вручную на SPSS ваших сотрудников. Таким образом, вам не нужно будет действительно знать какую-либо статистику для выполнения этой работы (что является ключевым преимуществом)

2) Вы можете сделать это в R - свободной статистической среде, которая, вероятно, может быть написана сценарием. Это имеет тот недостаток, что вам придется изучать статистику, чтобы убедиться, что вы делаете это правильно.

+0

Приятно знать, что SPSS теперь доступен для сценариев через Python напрямую! Может ли он также выводить результаты в виде обычного текста? Кроме того, R также доступен для сценариев (хотя R или через Python, используя RPy). –

0

Вот объяснение MANOVA ouptput, с очень хороший сайт по статистике и SPSS:

Выход с объяснением: http://faculty.chass.ncsu.edu/garson/PA765/manospss.htm

Как и почему делать MANOVA или многомерный GLM: (такой же путь как указано выше, но заканчивается в '/ manova.htm ')

Написание программного обеспечения с нуля для расчета этих выходов было бы продолжительным и сложным; существует множество числовых задач и инверсий матрицы.

Как сказал Генри, используйте скрипты Python или R. Я бы предложил работать с кем-то, кто знает SPSS, если скрипты. Кроме того, сам SPSS способен экспортировать выходные таблицы в файлы, используя что-то, называемое OMS. Скрипт в SPSS может это сделать.

Узнайте, кто в вашей исследовательской группе знает SPSS и работает с ними.

Смежные вопросы