Каковы приемлемые значения для минимальной достоверности и минимальных значений поддержки для Apriori algorithm? Как вы могли бы их подстроить? Являются ли они фиксированными значениями или они меняются во время работы алгоритма? Если вы использовали этот алгоритм раньше, какие значения вы использовали?Минимальная уверенность и минимальная поддержка Apriori
ответ
Я бы предложил начать со значений 0.05 для поддержки и 0.80 для уверенности. Но я согласен с тем, что вы должны понимать, что именно они представляют, чтобы иметь возможность правильно определить их. Для правила A => B (где A, B непустых множеств)
Support (A ⇒ B): s = P(A, B)
Confidence (A ⇒ B): c = P(B | A)
Lift (A ⇒ B): L = c/P(B)
Lift важно оценить интересности из правила (потому что вы, как правило, приходят с сотнями из них). Было предложено более двадцати интересных соображений. К ним относятся Ф-коэффициент, каппа, взаимная информация, J-мера и индекс Джини. Я лично заказываю свои правила в соответствии с J-мерой.
J.measure (A ⇒B): J = s/c * (c*log(L) + (1-c)*log((L-c)/L))
Перед запуском алгоритма вы должны установить значения minsup и minconf, и они не изменяются во время процесса добычи.
Выбор параметров minsup зависит от ваших данных.
Для некоторых данных я использую 80%. Для некоторых других данных я использую 0,05%. Все зависит от набора данных. Обычно я начинаю с большого значения, а затем я уменьшаю значения до тех пор, пока не найду значение, которое будет генерировать достаточное количество paterns.
Для уверенности, это немного легче, потому что это представляет собой уверенность, которую вы хотите в правилах. Обычно я использую что-то вроде 60%. Но это также зависит от данных.
Кроме того, если вы не хотите использовать параметры minsup, вы можете использовать алгоритм top-k mining. В этом случае вы, например, укажете k = 1000, и алгоритм будет обнаруживать 1000 правил, например, вместо использования minsup. Я разработал один такой алгоритм для разработки правил объединения. Он называется TopKRules, и вы загружаете source code. Бумага, описывающая его, скоро будет опубликована. Он использует только два параметра: k и minconf.
- 1. Соответствующая минимальная поддержка набора предметов?
- 2. SYMFONY2 Минимальная минимальная конфигурация
- 3. Минимальная поддержка версии iOS для RoboVM
- 4. Минимальная поддержка версии SDK для деятельности
- 5. http: минимальная поддержка кодирования контента для клиентов?
- 6. Минимальная минимальная конфигурация для RESTful WCF
- 7. Минимальная и максимальная проверка
- 8. GridBagLayout и минимальная ширина
- 9. минимальная дата
- 10. R - поддержка apriori() и покрытие?
- 11. Минимальная обложка и функциональный зависимости
- 12. ширина CSS и минимальная ширина
- 13. Минимальная ширина CSS и процент
- 14. Минимальная и максимальная длина прочности
- 15. Максимальная и минимальная глубина сортировки
- 16. Минимальная тема для Eclipse
- 17. MoveWindow - минимальная ширина/высота?
- 18. GenemuFormBundle select2 минимальная конфигурация
- 19. Минимальная ожидаемая длина сообщения
- 20. Минимальная стоимость окраски дома?
- 21. Минимальная длина регулярного выражения
- 22. Настройка QListWidget Минимальная высота
- 23. Минимальная функция трубчатой трубы?
- 24. Минимальная высота двоичного дерева
- 25. Минимальная реализация алгоритма gmtime?
- 26. Минимальная установка Python
- 27. Минимальная конфигурация log4net
- 28. Самая минимальная LISP?
- 29. Предпочитаемая/минимальная высота
- 30. Минимальная бит-программа
Я не думаю, что это ответственно без дополнительной информации о вашей проблемной области. Цель этих параметров состоит в том, чтобы обрезать пространство поиска, поэтому будет достигнута компромисс между эффективностью и качеством результатов. Нет единого набора значений, которые будут разумными для всех проблемных областей. –