Я хочу провести анализ: какой элемент не прошел хорошо в анализе корзины. В основном выяснение, какой элемент вместе не вышел из очереди. У меня есть ситуация, когда запись (содержащая 13 атрибутов/столбцов) является неполной из-за различных комбинаций атрибутов. для: a1, a2 .... a13. Все вышеуказанные атрибуты могут иметь или не иметь значений. Но любой атрибут, не имеющий значений, сделает запись неполнойОбратный анализ рыночной корзины с помощью R
В этой ситуации мне нужно увидеть, какая комбинация неполных записей в основном происходит на моих наборах записей. Знание этой модели поможет моей команде уделять первоочередное внимание отчетам, которые требуют наибольшего внимания. Я вижу, что алгоритм Apriori принимает только значения, которые доступны, но мне нужно проанализировать комбинацию, которая не происходит. Я уверен, что эта проблема должна была быть решена в прошлом, но я не вижу никаких намеков на форуме. Есть ли у кого-нибудь опыт такого рода? Или вы предлагаете любой другой алгоритм, который я должен использовать? Я использую R для этого анализа. И общее количество записей: 218k
Если вам нужна помощь в выборе подходящего метода статистического анализа для ваших данных, вы должны отправить свой вопрос в [stats.se] или [datascience.se]. Это не совсем конкретный вопрос программирования. Тот факт, что вы хотите использовать R, не имеет значения для выбора правильного способа анализа ваших данных. – MrFlick