2015-01-30 4 views
1

Я пытаюсь сделать несколько замечательных мероприятий с использованием mahout.Какая польза от значения предпочтений в рекомендации (mahout)

На практике я попытался следующие ПРИМЕР-

https://github.com/RevBooyah/Static-mahout-recommender-tutorial/blob/master/ItemRecommend.java

У меня есть сомнения, что есть 3 вещи, которые используются в модели данных UserId, ItemId и Предпочтение, как

ценам ниже

enter image description here

Но когда я запускаю код с или без настроек, результаты таковы, поэтому я сомневаюсь, что использование настроек? Если здесь бесполезно, то как его можно использовать для лучшей рекомендации?

Я попытался найти его, но ничего не нашел.

Может ли кто-нибудь мне помочь?

ответ

1

Вы используете сходство Танимото в соотношении прав на журнал? В образце кода используется Tanimoto, поэтому он должен показывать разные рекомендации в зависимости от сильных сторон предпочтений. Это попытается сделать что-то вроде прогнозирования оценок пользователей. Это не повлияет на все веса, поэтому для проверки вы можете случайно назначить весы и сравнить с данными образца. Но на самом деле это не так важно, чтобы беспокоиться об ИМО.

Это старый метод, который восходит к тому, когда Netflix и другие думали, что они хотят угадать ваши рейтинги. Netflix и большинство других отошли от этого, потому что это действительно намного важнее ранг правильно, поэтому пользователь получает правильный набор рекордов в лучшем порядке.

Ранжирование всегда лучше при использовании показателя подобия журнала правдоподобия - по всем данным, которые я видел, и несколько раз измерял разницу в качестве. LLR игнорирует силу предпочтений и вычисляет рекомендации на основе вероятностного метода, пытаясь предсказать, что пользователь, скорее всего, предпочтет.

Тед Даннинг описывает LLR here

+0

[pferrel] (https://stackoverflow.com/users/1162751/pferrel) я соответствовали весов resuls в обоих случаях, но его все же !!! –

+0

Пример, который вы используете, может иметь ошибку. Вы пытались подать вопрос на github? Вопрос: вам все равно? Вы действительно хотите прогнозировать рейтинги? Это единственное использование для значений предпочтений. – pferrel

+0

[pferrel] (http://stackoverflow.com/users/1162751/pferrel) Да, я хочу включить значение предпочтения в свой файл ввода, т. Е. Data.csv, чтобы получить лучшие результаты? и я еще не пробовал это на github. –

Смежные вопросы