2014-09-17 3 views
0

У меня есть очень большой (949 000 обс.) Набор данных (длинная форма). Я хотел бы выбрать случаи, основанные на наличии данных в одной переменной, но сохранить остальные данные в стеке для этого уникального идентификатора. Имеет ли это смысл?Как выбрать случаи в SPSS в наборе данных с множеством

У вас есть мысли?

+0

Не могли бы вы описать, что вы подразумеваете под «сложным набором данных»? Или еще лучше, укажите пример структуры данных и ожидаемого результата? – mirirai

+0

Конечно, другой термин для структуры данных называется длинной формой. Таким образом, для каждого человека есть несколько записей (строк). Допустим, что во время 1 человек А принял определенную меру (Y), но никогда не делал этого, даже если есть еще двенадцать наблюдений. Я хочу только выбирать случаи отдельными лицами, которые приняли меру Y, но мне нужно держать этих конкретных лиц другими наблюдениями, несмотря на отсутствие данных для Y в строке. – Jake

+0

Мое форматирование не задерживалось, не обращайте внимания на это сообщение – Jake

ответ

0

Вы, конечно, можете сделать это в статистике. Используйте AGGREGATE с идентификатором человека как переменной разрыва и, скажем, средним значением как итоговой статистикой. Выберите, чтобы агрегат был добавлен в дела. Затем просто выберите те случаи, когда агрегат не пропал.

-1

SPSS - это пакет приложений для статистики и не является языком программирования. Я бы использовал другой член семейства stackoverflow.

Попробуйте Cross ПРОВЕРЯЕМЫЕ (https://stats.stackexchange.com/)

+0

Woops, спасибо! – Jake

+0

1) Это не ответ, поэтому лучше оставить его в качестве комментария. 2) Это не по теме в CrossValidated, потому что это чисто программный вопрос, поэтому он по теме. OP [cross-published] (http://stats.stackexchange.com/q/115833/1036), и он был закрыт! –

Смежные вопросы