2012-06-05 5 views
-2

В настоящее время я разрабатываю систему опроса (где в опросе много вопросов, вопрос имеет много ответов, а ответ принадлежит пользователю, опрос, вопрос и ответ).Как подготовить данные для будущих статистических программ?

у меня будет много демографических данных в модели пользователя и ожидать 100 из тысяч ответов на различные вопросы и т.д.

В конце концов, мы хотим, чтобы проанализировать ответы, например. 80% мужчин, таких как бананы, 20% женщин владеют Фордом и еще много чего.

Я изучаю статистические языки, такие как R, SAS и SPSS, и мне интересно, нужно ли каким-либо образом структурировать мои данные для использования этими программами? Или все они принимают файлы csv?

Есть ли какой-либо совет, который у вас есть в отношении статистических данных и структурирование моделей данных для него?

И, наконец, сколько стоит SAS, SPSS и Stata?

+2

Этот вопрос является слишком широким, особенно в последней части. Если вы создадите хорошую структурированную базу данных для хранения вашей информации, я бы предположил, что любой достойный статистический пакет сможет взаимодействовать с ней. Я знаю, что R может, я был бы шокирован, если бы SAS не мог, не знаю о SPSS. –

+0

Я согласен, что любой пакет статистики может обрабатывать этот материал. Однако файлы данных Stata особенно умеют хранить метаданные опроса. Вы можете получить идеи о том, как реплицировать в R (или в более кросс-платформенном виде) в следующих вопросах: http://stackoverflow.com/questions/5335745/how-do-i-handle-multiple-kinds-of- missingness-in-r http://stackoverflow.com/questions/7979609/automatic-documentation-of-datasets –

+0

Вам нужно будет спросить компании, сколько стоит их продукция. – mdsumner

ответ

2

CSV files более чем достаточно. R - мощный инструмент для управления всеми вашими данными, упорядоченными по строкам и столбцам.

Например: вы можете упорядочить все столбцы csv как переменные/ответы с заголовками, а ваши строки могут быть данными или наоборот.

Это не имеет значения, если они расположены в строках и столбцах. Comma, Space Слишком ограниченные столбцы в файлах CSV можно легко обрабатывать. Не то чтобы я конкретный, вы можете иметь любые delimiter и R имеет мощное соответствие regular expression.

Только предложение заключается в том, что вы должны просто создавать разные CSV-файлы для разных наборов данных, чтобы упростить работу, и все это можно было легко импортировать из файла CSV .

После того, как вы получите это сделать, вы можете раскрыть потенциал R

Смежные вопросы