2013-02-25 8 views
-1

Я хочу порекомендовать элементы, которые помечены и классифицируются по трем ценовым категориям (дешевые, регулярные и дорогие). Я знаю, что с рекомендацией Маху может быть достигнута, но вот почему я не знаю, как ее использовать.Должен ли я использовать mahout для этого?

Mahout основывается на мнениях других пользователей, но все новые элементы, которые я хочу порекомендовать, - это только те новые, у которых пока нет никаких настроек.

Является ли Mahout правильным инструментом для этого? Является ли это контентным? (который mahout еще не поддерживает?) или мне следует использовать классификацию?

Спасибо!

+1

Вы уверены, что хотите модель рекомендации, а не какой-то метод кластеризации? (из вашего вопроса Кажется, что все ваши данные новы - так что в основном у вас нет тренировочного набора) – xhudik

+0

Я действительно еще не знаю, хочу ли я этого или классифицировать. Я все еще читаю, и я даже не знаю, что делать –

ответ

1

Поскольку я никогда не строил какую-либо рекомендательную систему - не берите этот ответ очень серьезно (никто не ответил, поэтому я стараюсь)

система рекомендации должна быть построены на некоторых из них уже известно (или частично известные данные). Если у вас есть только новые (невидимые) данные, есть возможность использовать некоторый алгоритм кластеризации , чтобы создать некоторые кластеры.

И если эти кластеры будут в порядке, их можно использовать для обучения некоторой системе рекомендаций.

Mahout - это просто инструмент, который реализует различные методы ML. Вы можете использовать другие инструменты, такие как Weka, R, ...

+0

Ну, этот алгоритм, который я пытаюсь создать, будет основываться на данных, собранных ранее, но должен применяться к новым. –

+0

Я думаю, я поеду с кластеризацией, потому что это то, что мне кажется лучше :) –

+0

Я рекомендую уроки о рекомендательных системах в coursera: https://class.coursera.org/ml-2012-002/lecture/index (неделя IX: Рекомендуемые системы) - вам необходимо зарегистрироваться – xhudik

0

Если у вас нет данных о новом пользователе, вы ничего не можете сделать, чтобы делать рекомендации, независимо от того, что вы делаете. Существует нулевой ввод, который бы отличал человека от кого-либо еще.

Хорошие системы, однако, должны иметь возможность сделать что-то разумное после того, как будет доступен первый вход.

Это не проблема классификатора по своей природе, нет. Это также не инструмент кластеризации, несмотря на другие ответы.

Ценовые категории не являются основными для любого процесса rec, который вы использовали бы. Предположительно, у вас есть другие данные, что это такое? Это важно.

Наконец, следует ли использовать Mahout в зависимости от вкуса. Вы бы использовали его, если хотите использовать Java и Hadoop. И, в свою очередь, вы только рассмотрите Hadoop, если бы у вас был очень большой вклад, и у немногих людей было столько данных (например,> 10 М данных).

(ну, не совсем - мои рекомендательные штук в Mahout предшествуют Hadoop и для он-лайн, меньшего масштаба приложений Вы действительно могли бы быть заинтересованы в этом, если вы работаете в Java.).

Смежные вопросы