При попытке воспроизвести пример «Распознавание цифр», приведенный на слайде 28 этого lecture на CART, я не могу понять, как создать набор данных с 200 образцами на основе заданного распределение.Создание данных моделирования на основе указанного распределения
# columns to be used for specified distribution
Digit <- c(1,2,3,4,5,6,7,8,9,0)
X1 <- c(0,1,1,0,1,1,1,1,1,1)
X2 <- c(0,0,0,1,1,1,0,1,1,1)
X3 <- c(1,1,1,1,0,0,1,1,1,1)
X4 <- c(0,1,1,1,1,1,0,1,1,0)
X5 <- c(0,1,0,0,0,1,0,1,0,1)
X6 <- c(1,0,1,1,1,1,1,1,1,1)
X7 <- c(0,1,1,0,1,1,0,1,1,1)
# df is the specified distribution
df <- cbind(Digit,X1,X2,X3,X4,X5,X6,X7)
10 цифр показаны различными комбинациями включения и выключения семи горизонтальных и вертикальных огней. Каждая цифра представлена 7-мерным вектором нулей и единиц.
i th образец . Если , загорается индикатор j; если , j-й свет выключен.
В лекции говорится, что данные для этого примера генерируются неисправным калькулятором. Каждый из семи огней имеет вероятность 0,1 независимо от того, что он находится в неправильном состоянии. Учебный набор содержит 200 образцов в соответствии с указанным распределением.
Не могли бы вы помочь мне понять, как настроить данные моделирования? Спасибо за ваше время.
'матрица (rbinom (70, prob = 0,1, size = 1), ncol = 10)'? –