2013-05-14 3 views
2

Я бы хотел использовать Apriori для анализа аффинности данных транзакций. У меня есть таблица со списком заказов и их информацией. Я в основном нужно использовать OrderID и атрибуты ProductID, которые находятся в следующем форматеАлгоритм Weka Apriori

КодЗаказа ProductID
1 А
1 B
1 С
2 A
2 С
3 А

Weka требует создать номинальный атрибут для каждого идентификатора продукта и указать, присутствует ли элемент в заказе с использованием значения true или false, например:

1, TRUE, TRUE, TRUE
2, TRUE, FALSE, TRUE
3, TRUE, FALSE, FALSE

Мой набор данных содержит около 10к записей ... около 3к различных продуктов. Может ли кто-нибудь предложить способ создания набора данных в этом формате? (Помимо ручного времени ...)

ответ

0

Как насчет написания сценария для его преобразования?

Должно быть менее 10 строк на хорошем языке написания сценариев, таком как Python.

Или вы можете изучить варианты поворота отношения по своему усмотрению.

В любом случае, это простая задача программирования, поэтому я не вижу здесь вашего вопроса.

+0

хорошо я студент, который только начинает экспериментировать с этими вещами, поэтому на самом деле это не казалось «задачей прямого программирования» мне и, возможно, многие другие там, поскольку у меня есть очень похожие вопросы без ответа. так что спасибо. – user2275504

+0

Да, здесь есть много вопросов вне темы. Сайт предназначен для программирования вопросов, и вы, по-видимому, даже не пытались решить это с помощью простого кода, но сами. –

0

Вам, очевидно, необходимо преобразовать ваши данные. Самый простой способ: написать программное обеспечение, которое читает файл на языке программирования, с которым вы наиболее знакомы, и затем записать файл в соответствующем формате. Поскольку это текстовые файлы, это не должно быть слишком сложным.

Кстати, если вы хотите больше алгоритмов для добычи полезных ископаемых образов и горнодобывающей промышленности ассоциации, чем просто Apriori в Weka, вы можете проверить мое программное обеспечение SPMF (http://www.philippe-fournier-viger.com/spmf/), который также находится в Java, может читать ARFF файлы тоже, и предлагает около 50 алгоритмов специализирующийся на разработке шаблонов (Apriori FPGrowth и многие другие).

0

Ваши данные отформатированы правильно как есть для реализации в R, используя пакет ARULES (и функцию apriori). Вы можете рассмотреть возможность его проверки, если вы хотите, я не участвую в написании сценариев.

Смежные вопросы