Я пытаюсь понять, как «плавление» работает в сложных ситуациях. Я видел много сообщений и блогов об использовании этих пакетов в очень простых случаях - но не в более сложных. Например:Комплексное плавление с dplyr, tidyr, reshape2 in R
Допустим, у меня есть следующие данные в dataframe:
CA UNIT SCP DATE1 TIME1 DESC1 ENTRIES1 EXITS1
1 A002 R051 02-00-00 07-27-13 00:00:00 REGULAR 4209603 1443585
2 A002 R051 02-00-00 07-28-13 08:00:00 REGULAR 4210490 1443821
3 A002 R051 02-00-00 07-29-13 16:00:00 REGULAR 4211586 1444302
4 A002 R051 02-00-00 07-30-13 14:01:46 LOGON 4213192 1444700
5 A002 R051 02-00-00 07-30-13 16:00:00 REGULAR 4213333 1444737
6 A002 R051 02-00-00 08-01-13 00:00:00 REGULAR 4215894 1445274`
и продолжение столбцов вправо (к сожалению, я не мог отформатировать его надлежащим образом в блоке кода):
`DATE2 TIME2 DESC2 ENTRIES2 EXITS2
1 07-27-13 08:00:00 REGULAR 4209663 1443616
2 07-28-13 16:00:00 REGULAR 4210775 1443921
3 07-30-13 00:00:00 REGULAR 4212845 1444369
4 07-30-13 14:02:18 DOOR OPEN 4213192 1444700
5 07-31-13 00:00:00 REGULAR 4214345 1444823
6 08-01-13 08:00:00 REGULAR 4215977 1445362`
, и я хочу, чтобы расплавить это в dataframe в следующем формате:
CA UNIT SCP DATE TIME DESC ENTRIES EXITS
1 A002 R051 02-00-00 07-27-13 00:00:00 REGULAR 4209603 1443585
2 A002 R051 02-00-00 07-28-13 08:00:00 REGULAR 4210490 1443821
3 A002 R051 02-00-00 07-29-13 16:00:00 REGULAR 4211586 1444302
4 A002 R051 02-00-00 07-30-13 14:01:46 LOGON 4213192 1444700
5 A002 R051 02-00-00 07-30-13 16:00:00 REGULAR 4213333 1444737
6 A002 R051 02-00-00 08-01-13 00:00:00 REGULAR 4215894 1445274
7 A002 R051 02-00-00 07-27-13 08:00:00 REGULAR 4209663 1443616
8 A002 R051 02-00-00 07-28-13 16:00:00 REGULAR 4210775 1443921
9 A002 R051 02-00-00 07-30-13 00:00:00 REGULAR 4212845 1444369
10A002 R051 02-00-00 07-30-13 14:02:18 DOOR OPEN 4213192 1444700
11A002 R051 02-00-00 07-31-13 00:00:00 REGULAR 4214345 1444823
12A002 R051 02-00-00 08-01-13 08:00:00 REGULAR 4215977 1445362
Challen ge здесь, что столбцы, которые я хочу «расплавить», имеют разные типы данных. Все прочитанные сообщения очень просты и предполагают, что все расплавленные столбцы имеют один и тот же тип данных и попадут в хорошие пары ключ/значение. Это явно не так.
Я нашел еще одно сообщение, указывающее, что эта реструктуризация может быть выполнена с использованием «замены» из статистики. Я понимаю. Но если dplyr, reshape2 и tidyr нельзя использовать для более сложных реалий реального мира, что такое реальное использование?
Просьба показать, как это сделать с помощью tidyr, dplyr или reshape2.
Спасибо заранее!
Спасибо! Я никогда бы не подумал об использовании этого. – Windstorm1981
Ну, перефразируя Дэвида Святого Хаббинса в * Это спинальный тап *, «Между умными и глупыми линиями есть тонкая грань». – eipi10