Я пытаюсь найти записи, которые не группируются аналогично в соответствии с двумя разными переменными (все переменные имеют формат символов).SAS сравнивает записи символов по двум различным группам переменных
Мои переменные appln_id
(уникальный) earliest_filing_id
(группировки) docdb_family_id
(группировки). Набор данных содержит около 25 000 различных appln_id
, но только 15446 разных earliest_filing_id
и 15755 docdb_family_id
. Теперь вы видите, что есть разница ок. 300 записей среди этих 2 групп (потенциально больше, потому что группы могут также меняться).
Теперь то, что я хотел бы сделать, это увидеть все случаи, которые не сгруппированы. Здесь приведен пример:
appln_id earliest_filing_id docdb_family_id
10137202 10137202 30449399
10272131 10137202 30449399
10272153 10137202 !!25768424!!
Вы можете видеть, что последний случай отличается и должен быть в моем списке, который я надеюсь создать. Я пытался решить его либо с помощью сравнения Proc, либо с сортировкой вызовов, либо с помощью + if ... затем кодирования, но до сих пор не удалось найти хорошее решение. Я еще не пользуюсь SAS ...
Ваша помощь очень ценится!
Grazie
Annina
Вы хотите сказать, что если значение EARLIEST_FILING_ID или DOCDB_FAMILY_ID изменится, вы хотите сделать новый номер группы? Вы пытались использовать обработку группы BY на шаге данных? – Tom