Мой входной файл содержит транзакцию на каждой строке. В следующем примере показана структура моего входного файла:Как я могу вычислить частоты наборов элементов с помощью R?
Вышеупомянутый входной файл содержит 11 элементов и 8 наборов предметов. Этот входной файл имеет 3 уникальных элемента и 5 уникальных наборов предметов. Я хотел бы вычислить частоты каждого уникального набора предметов. Для приведенного выше входного файла, я хотел бы написать сценарий R, который генерирует выходной сигнал, похожий на следующий CSV файл:
"a",0.25
"a,b",0.25
"c",0.25
"b",0.125
"a,c",0.125
В докладе показано количество вхождений каждого уникального НИКАКИХ гарантий в файле ввода операций разделенного по общему количеству наборов элементов на входе. Обратите внимание, что отчет отсортировал элементы на основе их частот. Как я могу использовать R для вычисления частот наборов предметов в файле входных транзакций?
UPDATE: Я уже вычислил ассоциативные правила с использованием read.transactions и apriori методы. Могу ли я повторно использовать результаты этих методов для вычисления частот входных наборов.
Этот фрагмент кода не сортируется по частотам. – reprogrammer
@reprogrammer Прошу прощения. Обновлено. –
Может ли кто-нибудь мне помочь, почему я получаю ошибку, когда пытаюсь выполнить первую строку кода? Ошибка в read.table (header = TRUE, text = "\ nitemset \ na \ na \ na, b \ nb \ na, b \ na, c \ nc \ nc"): неиспользуемый аргумент (ы) (текст = "\ nitemset \ na \ na \ na, b \ nb \ na, b \ na, c \ nc \ nc") – moldovean