2014-02-10 4 views
0

MapReduce: Найти похожие фильмыMapReduce похожих фильмов

После создания пары кандидатов похожи кинофильмов как я вычислить Jaccard сходство между ними, так что я нашел подобные фильмы?

например. идентификатор пользователя, фильм ID1, ID2 фильм НОМИНАЛ1, rating2

1,  1  , 2   5  , 4 
2,  1  , 4   4  , 3 
3,  1  , 2   4  , 5 

таблица показывает, что movie1 и кино 2 похожи, потому что они были оценены от 2 разных пользователей (user1 и user3) в аналогичном рейтинге.

ответ

0

Прочитать "неотрицательная матричная факторизация" в Википедии.

On MapReduce level: стохастический градиентный спуск - это мое разделение учебного набора на подмножества, обработанные редукторами, а затем усредняющие параметры между подмножествами.

См. Совместную фильтрацию в Mahout для справки.

Смежные вопросы