Мне нравится переформатировать набор данных от длинного до широкого. В частности, новый широкий набор данных должен состоять из строк, соответствующих уникальному количеству идентификаторов в длинном наборе данных, а количество столбцов кратно уникальным значениям другой переменной.R Частичная переформатировка данных от длинного до широкого
Допустим, это оригинальный набор данных:
ID a b C d e f g
1 1 1 1 1 2 3 4
1 1 1 2 5 6 7 8
2 2 2 1 1 2 3 4
2 2 2 3 9 0 1 2
2 2 2 2 5 6 7 8
3 3 3 3 9 0 1 2
3 3 3 2 5 6 7 8
3 3 3 1 1 2 3 4
В новом наборе данных, количество строк, это число идентификаторов, число столбцов равно 3 плюс кратное уникальных элементов найдены в переменной C
и значения от переменных d
до g
заселяются после сортировки переменной C
в порядке возрастания. Это должно выглядеть примерно так:
ID a b d1 e1 f1 g1 d2 e2 f2 g2 d3 e3 f3 g3
1 1 1 1 2 3 4 5 6 7 8 NA NA NA NA
2 2 2 1 2 3 4 5 6 7 8 9 0 1 2
3 3 3 1 2 3 4 5 6 7 8 9 0 1 2
Есть ли способ заполнить данные в соответствии с значениями в переменной 'C' в порядке возрастания? Эта часть была опущена. –
Не видел прямого способа сделать это, но вы можете сортировать имена столбцов по цифре. Например: 'c (имена (dt) [1: 3], имена (dt) [3:15] [порядок (str_extract (имена (dt) [3:15]," \\ d + ")))) [1] "ID" "a" "b" "d1" "e1" "f1" "g1" "d2" "e2" "f2" "g2" "d3" "e3" "f3" "g3" "b "", а затем выберите столбцы в этом порядке. – Psidom