2015-04-10 5 views
-1

Вот пример данных я в настоящее время хранится под одной переменной, complications в Stata:Подсчет количество раз цифра происходит в колонке чисел в Stata

осложнения: 1; 1 10; 1 3 10

Периодичность: 320; 10; 5

Каждый номер связан со специфическим осложнением, и у человека может быть одно или несколько осложнений. Мне нужно сгенерировать 10 категориальных переменных, чтобы зафиксировать количество людей, которые не имеют/не имеют каждого осложнения. Например, для осложнения 1, complication_1 = 0 для тех, у кого его нет, а complication_1 = 1 для тех, кто его имеет. Каков наиболее эффективный способ сделать это для каждого осложнения в Stata?

+1

Слишком много догадок, необходимых здесь. Пожалуйста, покажите воспроизводимый пример с кодом для ввода данных. Откуда вы знаете, кто из них? –

ответ

0

Echoing @ Комментарий Ник: пожалуйста, приложите достаточно много усилий при публикации вопросов. Прочтите внимательно https://stackoverflow.com/help/asking. Исследования также ожидаются, но вы не видите их в своем оригинальном посте.

Мое предположение:

clear 
set more off 

*----- example data ----- 

input /// 
id str12 comp 
1 "1" 
2 "1 10" 
3 "1 3 10" 
4 "4" 
5 "4 22 10" 
end 

list 

*----- what you want ? ----- 

// split 
split comp, gen(comp) 
drop comp 

// reshape 
reshape long comp, i(id) 
drop if missing(comp) 

// create indicators 
tab comp, gen(comp) 

list, sepby(id) 

Почему вам нужны эти индикаторные переменные другое дело. Новые версии Stata (начиная со Stata 11) подсчитываются с с переменной переменной. См. help factor variables, если уместно.