2016-10-31 1 views
1

Я пытаюсь внедрить новую систему ранжирования поставщиков для сайта онлайн-рынка. То, что я хочу сделать, - это сортировать продавцов на чем-то вроде сводного счета от самого высокого до самого низкого. На данный момент, я имею в виду только с помощью линейной модели для расчета баллов, вроде какКак вы используете назначение весов для функций в взвешенном составном балла?

score = w1 * f1 + w2 * f2 + w3 * f3.... 

где f1, f2, .... являются различные функции (например, средний балл обзора, порядок отмены скорость, скорость ответа и т. д.), а w1, w2 ... - соответствующий вес для этих функций.

Я хочу забрать продавцов от 0 до 100 для каждого элемента и отсортировать предметы на основе этого показателя.

У меня возникают проблемы с поиском способа назначения оптимальных весов для каждой функции. Есть ли способ назначить весы, чтобы оптимизировать что-то вроде: скажем, вероятность того, что пользователь совершит покупку или что-то более неосязаемое, как качество? После некоторого поиска в Google я нашел несколько статей, которые показывают использование PCA для создания составного индекса. Но поскольку я не слишком хорошо знаком с PCA, я не совсем уверен, подходит ли это для этого случая.

Я был бы очень благодарен, если бы кто-нибудь мог любезно провести меня по правильному пути. Если я подхожу к этой проблеме совершенно неправильно, я был бы признателен, если бы кто-то мог это указать.

ответ

0

Кажется, что ваша проблема с кукурузой контролирует проблему обучения. В зависимости от того, есть ли у вас достаточное количество помеченных данных, вы можете применить что-то легкое для обучения, например, линейную регрессию (http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LinearRegression.html) или что-то более сложное, как усиление (http://xgboost.readthedocs.io/en/latest/python/python_intro.html). Ярлыками для ваших данных может быть то, как часто пользователь купил что-то, что делает проблему регрессией.

+0

Я вижу. Я попробовал линейную регрессию с обзорными звездами, поскольку ярлык и результаты выглядят несколько многообещающими. Я не знаком с повышением, поэтому немного почитаю. Спасибо за помощь. – suzzant

Смежные вопросы