Я бегу алгоритм априорной так:R - ассоциативные правила - априорные
rules <-apriori(dt)
inspect(rules)
где дт мой data.frame с этим форматом:
> head(dt)
Cus T C B
1: C1 0 1 1
2: C2 0 1 0
3: C3 0 1 0
4: C4 0 1 0
5: C5 0 1 0
6: C6 0 1 1
Идея набора данных заключается в том, чтобы захватить клиента и купил ли он три разных предмета (T, C и B) при определенной покупке. Например, на основании вышеприведенной информации мы видим, что C1 купил C и B; клиенты C2-C5 купил только C и C6 клиент купил только C и B.
выход заключается в следующем:
lhs rhs support confidence lift
1 {} => {T=0} 0.90 0.9000000 1.0000000
2 {} => {C=1} 0.91 0.9100000 1.0000000
3 {B=0} => {T=0} 0.40 0.8163265 0.9070295
4 {B=0} => {C=1} 0.40 0.8163265 0.8970621
5 {B=1} => {T=0} 0.50 0.9803922 1.0893246
6 {B=1} => {C=1} 0.51 1.0000000 1.0989011
Мои вопросы:
1) как я могу избавиться от правил где T, C или B равны 0. Если вы думаете об этом, то правило {B = 0} => {T = 0} или даже {B = 1} => {T = 0} действительно не делает смысл.
2) Я читал об априорном алгоритме и в большинстве примеров, каждая строка представляет собой фактические сделки так в моем случае, это должно быть что-то вроде:
C,B
C
C
C
C
C, B
вместо моих наборов единиц и нули, это правило? Или я могу работать с моим форматом?
Благодаря
Только что увидели, что ваш запрос с 2015 года: (Что бы это ни могло помочь кому-то:) – n01dea