2
У меня есть этот data.table:Создать бинарные переменные из категоричен с разреженной матрицей
df <- data.table(u = c(1,2,3,4,5), d = c(1,2,0,1,2), V1 = c(0.3, 0.2, 0.2, 0.1, 0.2),
pred = c(1,2,0,1,0), sec_pred = c(2,1,0,1,0), ones = rep(1,5))
# u d V1 pred sec_pred ones
#1: 1 1 0.3 1 2 1
#2: 2 2 0.2 2 1 1
#3: 3 0 0.2 0 0 1
#4: 4 1 0.1 1 1 1
#5: 5 2 0.2 0 0 1
И я хочу, чтобы получить матрицу, как это:
dcast(df, u + d + V1 ~ pred + sec_pred, fill = 0, value.var = 'ones')
# d V1 u 0_0 1_1 1_2 2_1
#1: 0 0.2 3 1 0 0 0
#2: 1 0.1 4 0 1 0 0
#3: 1 0.3 1 0 0 1 0
#4: 2 0.2 2 0 0 0 1
#5: 2 0.2 5 1 0 0 0
Но у меня есть очень большие данные .table, я хочу создать разреженную матрицу. Но было бы здорово, чтобы создать все возможные комбинации pred
и sec_pred
значения, такие как 0_0, 0_1, 0_2, 1_0, 1_1 ...
Спасибо! если мне нужны все возможные комбинации, как мне изменить код? –
@VitaliyRadchenko В этом случае используйте «combn» на уникальных значениях набора данных. С примером, который вы указали, это было неясно. – akrun
@VitaliyRadchenko Возможно, 'df2 <- expand.grid (rep (list (unique (c (df $ pred, df $ sec_pred))), 2))', 'вставлять 'столбцы вместе и проверять с помощью элементов вставки из оригинала набор данных. – akrun