Я думаю, что это вопрос, который очень специфичен для ваших данных и того, чего вы пытаетесь достичь. Вам не следует комбинировать наборы данных вообще, пока вы не узнаете достаточно о данных, чтобы узнать, можете ли вы их комбинировать (установить) или хотите совместить их. Там не может быть общим правило, потому что это просто зависит от ваших данных - если бы я имел два набора данных
data have_1;
input x y;
datalines;
1 2
2 3
3 4
;;;;
run;
data have_2;
input x y z;
datalines;
1 2 3
2 3 4
3 4 5
;;;;
run;
Вы могли бы догадаться, что have_1 и have_2 тех же наблюдение, только с дополнительным переменным г; но они легко могли быть и другими наблюдениями. Если бы я сказал вам, что «х» - уникальный идентификатор, то вы подозреваете, что это одни и те же записи; но если бы я сказал вам, что «х» и «у» являются качественными характеристиками, то они могут легко быть разными наблюдениями, которые кажутся схожими качественно.
Пункт здесь: знайте свои данные, прежде чем что-либо делать с ним. Если вы не знаете свои данные, вы не должны работать с ним в первую очередь.
Да, я согласен. Я работаю с данными для класса в школе, но когда я искал больше информации о данных, мне отказали. Думаю, это просто подтверждает мою мысль о том, что мне не дали должной информации, чтобы на самом деле сделать это с уверенностью. Спасибо за ваш совет, хотя! –