У меня проблема с иерархической структурой данных для получения простой описательной статистики; для каждого 1-го уровня наблюдения, у меня есть несколько 2 наблюдения (но не такое же число) уровня, такие как:Иерархические данные и описания
Level 1 Level2 x y z k
1 a 0.12 1 debt 0
1 b 0.08 1 debt 0
1 c 0.22 1 debt 0
2 d 0.32 0 credit 1
2 e 0.17 0 credit 1
3 f 0.20 1 credit 1
3 g 0.11 1 credit 1
3 h 0.05 1 credit 1
3 i 0.01 1 credit 1
Хотя некоторые переменные зависят от уровня 2 (х) другие (у, z, k) зависит от уровня 1. Если я могу получить описательную статистику - например, table(k)
- сгруппирован для уровня 1, а не уровня 2?
Исх. table(k)
дает 6 в данном конкретном случае, но я хотел бы, чтобы получить 2, такие как число кластеров на уровне 1 при к = 1, что-то вроде table(k ~ study)
Заранее спасибо за помощь
Marco
dplyr package имеет функцию group_by(), которая может быть использована здесь: 'k%>% group_by (Уровень 1)%>% summary (COUNTS = n(), SUM = sum (x))' –
Спасибо за ваша помощь. Это дает 'Ошибка в UseMethod (" group_by_ "): не применимый метод для 'group_by_', примененный к объекту класса" c ('integer', 'numeric') "' –
Была ли установлена и загружена библиотека 'dplyr' ? Кроме того, функция '' group_by() '. 'group_by _()', вероятно, не то, что вы хотите. –