У меня есть ФР, который выглядит как:Создание кластеров в R
selection.body selection.hair selection.eyes selection.breasts selection.butt selection.skin
normal blonde other large medium tanned
normal blonde other xl medium tanned
normal blonde other large medium tanned
chubby blonde blue xl large tanned
slim blonde other medium small white
Давайте представим этот набор данных в качестве ответа на опрос:
- каждая строка представляет собой выбор одного ответчика, выбрав его предпочтение от закрытого набора предпочтений.
То, что я уже делал, проверяет частоты каждого выбора, но я хочу двигаться вперед с этим.
Моя цель состоит в том, чтобы:
определить наиболее распространенные комбинации вариантов.
группировать пользователей на основе этой комбинации.
корреляции между параметрами
Спасибо за ваши подсказки.
Попробуйте 'data.table'. Следующего синтаксиса должно быть достаточно, чтобы ответить на первые два вопроса: 'dt [,. (Count = .N),. (Col1, col2 ... и т. Д.)]'. Для третьего вопроса попробуйте '? Cor' из базы и' corrplot'. –
Мне кажется, вы просто передаете свои задания другим! – 989
Я не просил какого-либо кода. Я просто прошу мозгового штурма и начинаю намекать. Мне кажется, у вас много времени на ваших руках. – xxxvinxxx