(первая публикация)
У меня есть набор данных, где мне нужно создать новую переменную (в SAS), исходя из условия, связанного с другой переменной. Таким образом, данные содержат три переменные из опроса: сайт, IDnumb (человек) и дата. Может быть несколько ответов от разных людей, но на том же сайте (см. Личность 1 и 3 с сайта A).Новая переменная SAS, зависящая от наблюдений
Site IDnumb Date
a 1 6/12
b 2 3/4
c 4 5/1
a 3 .
d 5 .
Я хочу создать новую переменную под названием Complete, но она не может содержать дубликаты. Поэтому, когда я перехожу к proc freq, я хочу, чтобы сайт A был подсчитан один раз, используя 6/12 Date of Completed Survey. Поэтому в основном, если сайт представлен дважды и содержит дату в одном, я хочу только считать это и игнорировать дублированный сайт без даты.
N %
Complete 3 75%
Last Month 1 25%
Мой вопрос может быть вокруг возможностей NODUP и NODUPKEY. Если я сделаю Proc Sort (nodupkey) по сайту и дате, это устранит obs «a 3»?
Любая помощь была бы принята с благодарностью. Извините за беспорядочную «таблицу», так как это мой первый пост (намеки на то, что это лучше, также приветствуются).
Вы решаете, как записывать эти данные или у вас есть данные, с которыми вам нужно работать? –
Чтобы отправить код или таблицу, введите ее без БР, выделите ее, а затем нажмите control-K. – Joe
Можете ли вы разместить желаемый выходной стол? Вы говорите, что хотите новую переменную, вы действительно этого хотите? Что бы это содержало? – Joe