0

Я ищу несколько советов по проблеме классификации пользователей в разных группах, основываясь на ответах на процесс регистрации.Рекомендации по классификации пользователей в сценарии машинного обучения

Идея состоит в том, что в этих классификациях будут группироваться люди с похожими привычками путешествий, то есть авантюрные, расслабляющие, foodie и т. Д. Это не должно быть классификация, известная пользователю, поэтому не так просто, как просто спросить, праздники, которые им нравятся (смысл состоит в том, чтобы удалить предвзятость пользователя/не зная, где разместить себя).

Способ, которым я вижу работу, задает такие вопросы, как приложения, которые они используют, учетные записи, с которыми они взаимодействуют в социальных сетях (gopro, рестораны и т. Д.), Давая некоторые сценарии и спрашивая, какие звуки лучше всего, они будут выбраны из набора к ним, следовательно, мы контролируем переменные. Основная проблема, с которой я сталкиваюсь, - это получить числовые значения, связанные с каждым из них.

Я изучил различные алгоритмы машинного обучения и понял, что это скорее всего проблема кластеризации, но я не могу понять, как использовать этот стиль вопроса для присвоения значения каждому измерению, которое фактически даст полезный категоризации.

Еще один вопрос: есть ли какие-то ресурсы, где я могу найти информацию о типах вопросов, чтобы попросить пользователей получить информацию, которая позволила бы классифицировать это.

Вид процесса, который я представляю, похож на https://www.thread.com/signup/introduction, если кто-то знаком с ним.

Любые советы приветствуются.

ответ

0

Проблема, которую вы имеете под рукой, заключается в том, что вы хотите вычислить меру подобия, основанную на категориальных переменных, которая является выбором их приложений, учетных записей и т. Д. Если вы не оцениваете сходство этих приложений в отношении атрибута, такого как как foodie является приложением, было бы трудно определить. Кроме того, вам нужно знать все возможные состояния, которые категориальная переменная может принимать для создания подобной меры, подобной этой. Если конечная цель - рекомендовать то, что понравилось или понравилось аналогичным людям (на основе выбора приложений или выбора учетной записи в социальных сетях), вы должны изучить совместную фильтрацию. Если ваше пространственное пространство хорошо определено и статично (известные приложения, известные учетные записи, ограниченный набор с несколькими отсутствующими значениями), то посмотрите на системы рекомендаций, основанные на контенте, что-то простое, как анализ рыночной корзины, может дать вам разумную рабочую модель. Иначе, если вы действительно хотите смоделировать систему с набором функций, которые могут принимать случайные состояния, это можно сделать с помощью многомерных вероятностных моделей, если структура (отношения и влияния между функциями) хорошо определена, вы можете воспользоваться вероятностной графикой Модели, такие как байесовские сети. Вам действительно нужно определить вашу проблему лучше, прежде чем вы начнете ее решать.

+0

Извините, что я должен был упомянуть, что приложения/учетные записи и т. Д. Будут из заданного набора, поэтому я рассмотрю анализ рыночной корзины –

0

Вы можете использовать простые числа. Если каждому варианту в списке всех возможных вариантов присваивается другой премьер, и выбор пользователя сохраняется как продукт, тогда вы всегда будете знать, сделал ли пользователь конкретный выбор, если по модулю выбора/выбора - 0. Красота простых чисел, вуаля!

+0

Thats really clever, thanks! Как я мог тогда использовать это, чтобы создать модель, хотя, если она не является «строгой» с выборами, сделанными для определения как дерева решений, но более того, что несколько маршрутов могут дать одну и ту же классификацию? –

Смежные вопросы