У меня есть три набора данных в стационарных, амбулаторных и профессиональных заявлениях. Я хочу найти количество уникальных людей, которые претендуют на употребление табака (1 = да табак, 0 = табак) в ЛЮБОЙ из этих трех наборов данных.Слияние, но сохранение всех наблюдений?
Таким образом, наборы данных в значительной степени все:
data inpatient;
input Patient_ID Tobacco;
datalines;
1 0
2 1
3 1
4 1
5 0
;
run;
Я пытаюсь объединить стационарную, амбулаторную и профессионально, так что я остался с теми идентификаторами пациентов, у которых есть претензии табака в любой из три набора данных с помощью:
data tobaccoall;
merge inpatient outpatient professional;
by rid;
run;
Однако перезапись некоторые из 1-й с 0 в новом наборе данных. Как лучше объединить наборы данных, чтобы найти, имеет ли пациент претензии в ЛЮБОЙ из наборов данных?
Хороший ответ. Вы могли бы добавить что-то об использовании COALESCE или логических операторов, чтобы получить одну переменную в конце, а также, что, вероятно, то, что они действительно хотят. – Joe