2013-08-08 3 views
2

У меня есть большой набор данных (матрица из 0s и 1s) с 200 переменными (каждая переменная является элементом) и почти 1M строк (каждая строка является транзакцией). Я использую пакет «arules» в R для разработки правил ассоциации. Я считал 2 штуки и хочу создать все правила, которые имеют хотя бы один из них на слева стороны правила. Код, который я написал это:Создание специальных правил с помощью arules в r

rules <- apriori(data, parameter = list(support = 0.1, confidence = 0.1, 
minlen =2),appearance = list(lhs=c("itemA=1","itemB=1"),default="rhs")) 

Но этот код создает правила, которые имеют только Itema, только itemB, или только оба из них в левой части правил. Я очень признателен, если вы можете мне помочь.

+0

когда вы сказали minlen = 2, как можно вернуть правила один запись как Itema или itemB? – MTT

+0

minlen для обоих LHS и Rhs. Так, например, он возвращает itemA -> itemC. Которая его длина равна 2, потому что у нас есть 2 предмета. –

ответ

3

Я думаю, этот код работает для вас:

rules <- apriori(data, parameter = list(support = 0.1, confidence = 0.1,minlen =2)) 
subrules <- subset(rules, subset = lhs %in% c("itemA=1","itemB=1")) 
Смежные вопросы