2016-07-29 2 views
0

Я использовал команду apriori из пакета arules на объекте транзакции, а один процессор поднялся примерно до 97% в течение примерно 20 минут. Затем он опустился на велосипед между 0,7% и 0,3% и делал это около 24 часов. и у меня нет приглашения в RStudio; просто мигает. У меня 2666 транзакций и 376 наименований. Вероятно, существует много сходства между некоторыми транзакциями, что означает, что некоторые транзакции могут делиться более чем 100 элементами.arules apriori command висит или просто берет длинный

Это первый раз, когда я использовал этот пакет, поэтому мне было интересно, нормальное ли это поведение или что мне делать.

Я работаю на CentOS 7 с 24 ГБ оперативной памяти и 16 процессорами и с помощью RStudio Server.

Моя команда:

rules <- apriori(adjacdmMtrans, parameter =list(support = 0.002, confidence=0.75)) 

Некоторая информация потушить arules после ввода вышеуказанной команды:

Apriori 

Parameter specification: 
confidence minval smax arem aval originalSupport support minlen maxlen target ext 
     0.75 0.1 1 none FALSE   TRUE 0.002  1  10 rules FALSE 

Algorithmic control: 
filter tree heap memopt load sort verbose 
    0.1 TRUE TRUE FALSE TRUE 2 TRUE 

Absolute minimum support count: 5 

set item appearances ...[0 item(s)] done [0.00s]. 
set transactions ...[376 item(s), 2666 transaction(s)] done [0.03s]. 
sorting and recoding items ... [376 item(s)] done [0.01s]. 
creating transaction tree ... done [0.00s]. 
checking subsets of size 1 2 3 4 

ответ

0

Ваша машина, вероятно, не хватает памяти для процесса R и начинает выгружать. В худшем случае, априори должен создать для 376 предметов в порядке 10^12 кандидатов длины 4. Начните с более высокого значения поддержки.

Смежные вопросы