Рассмотрите вымышленные данные, чтобы проиллюстрировать мою проблему, которая содержит в действительности тысячи строк.Создание идентификатора на основе коэффициента и заполнения Stata
Рисунок 1
Каждый человек характеризуется значениями, присоединенных к А, В, С, D, E. На рисунке 1 показаны 3 человека, для которых отсутствуют некоторые характеристики. Вы знаете, как я могу получить следующую заполненную таблицу (рисунок 2)?
Рисунок 2
С ID на рисунке 1, я мог бы использовать команду carryforward
для заполнения значений. Но так как у каждого человека есть другое количество строк, я не знаю, как создать идентификатор.
Редактировать: Все индивидуальные делятся характеристикой «А».
Редактировать: существующий порядок наблюдений информативен.
Спасибо @timat. Я думал о «заполнении», и я мог что-то пропустить. Но для 'fillin' вам нужно указать более одной переменной. Поэтому, если быть более точным, я не хочу создавать наблюдения с отсутствующими значениями для всех комбинаций символов и значений, я просто хочу добавить недостающие характеристики, чтобы получить 5 строк на идентификатор. – emeryville
Я не вижу здесь точной спецификации того, что мы можем и не можем принять. Кажется, что существующий порядок наблюдений («строки» не является стандартным термином Stata) информативен, но здесь нет указателя на переменную идентификатора. –
Спасибо, Ник за комментарий. Правильно, существующий порядок наблюдений носит информативный характер. Наивный вопрос: есть ли причина, почему Stata использует «наблюдение» вместо «строки»? Или почему не оба? – emeryville