2013-04-06 2 views
0

У меня есть общий вопрос о методологии. Как узнать, подходит ли объединение совпадений (MERGE) или чередование (SET) для объединения наборов данных? Если у меня есть два связанных набора данных, которые, как представляется, содержат многие из тех же переменных (но не все), но я не знаю, является ли информация в указанных переменных одинаковой, что лучше?Выбор между MERGE и SET для объединения данных в SAS

Есть ли какое-то общее правило принятия решения, которое лучше?

Спасибо за ваш совет.

ответ

0

Я думаю, что это вопрос, который очень специфичен для ваших данных и того, чего вы пытаетесь достичь. Вам не следует комбинировать наборы данных вообще, пока вы не узнаете достаточно о данных, чтобы узнать, можете ли вы их комбинировать (установить) или хотите совместить их. Там не может быть общим правило, потому что это просто зависит от ваших данных - если бы я имел два набора данных

data have_1; 
input x y; 
datalines; 
1 2 
2 3 
3 4 
;;;; 
run; 

data have_2; 
input x y z; 
datalines; 
1 2 3 
2 3 4 
3 4 5 
;;;; 
run; 

Вы могли бы догадаться, что have_1 и have_2 тех же наблюдение, только с дополнительным переменным г; но они легко могли быть и другими наблюдениями. Если бы я сказал вам, что «х» - уникальный идентификатор, то вы подозреваете, что это одни и те же записи; но если бы я сказал вам, что «х» и «у» являются качественными характеристиками, то они могут легко быть разными наблюдениями, которые кажутся схожими качественно.

Пункт здесь: знайте свои данные, прежде чем что-либо делать с ним. Если вы не знаете свои данные, вы не должны работать с ним в первую очередь.

+0

Да, я согласен. Я работаю с данными для класса в школе, но когда я искал больше информации о данных, мне отказали. Думаю, это просто подтверждает мою мысль о том, что мне не дали должной информации, чтобы на самом деле сделать это с уверенностью. Спасибо за ваш совет, хотя! –

1

На этот вопрос действительно нет хорошего ответа; существуют фундаментальные различия между тем, что делают «слияние» и «чередование». Возьмите несколько минут и прочтите пример в руководстве SAS Concepts, particularly here.

Смежные вопросы