2015-11-20 3 views
0

Я имею дело с набором данных, имеющим 614 переменных и 1348 транзакций, и пытается запустить его в R, но время процесса слишком велико, что код никогда не показывает конечный результат, а мой ноутбук повешение.алгоритм apriori занимает время в r

a <- read.csv("v.csv") 
library(arules) 
for(i in 1:ncol(a)) 
    a[i]<- as.factor(a[,i]) 
rules <- apriori(a,parameter=list(supp = .5 , conf = 0.9, target="rules")) 
summary(g) 

Пожалуйста, расскажите мне, в чем я ошибаюсь.

+1

Сначала попробуйте небольшое подмножество, а затем постройте его. Я подозреваю, что вы не сможете много сделать, поскольку у вас есть 2 точки данных для каждого параметра. –

+0

Он работал над небольшими наборами данных. Но также в встроенном наборе данных «Взрослый», имеющем 2127 общ и 4 vbls. Не могу понять, почему он здесь не работает. – tuhin

+0

Встроенный набор данных для взрослых тщательно переработан и гарантирует, что перевод в двоичные элементы в транзакциях. Сделайте следующее: как (a, «транзакции»). Он должен сказать вам, сколько элементов создано ... –

ответ

1

Я думаю, что ваша проблема может быть связана с данными. Я думаю, что некоторые из ваших переменных в a могут быть непрерывными переменными, а as.factor создаст значение коэффициента для каждого из уникальных значений. apriori попытается преобразовать каждое значение фактора в отдельный элемент, создавая чрезвычайно большую матрицу, которая заставляет ваш ноутбук висеть.

Примечание: Это чистая спекуляция, так как я не знаю, как выглядят ваши данные.

Смежные вопросы