Кто-нибудь знает, как получить числовое значение сходства между любыми двумя пользователями данного набора данных в Apache Mahout?Отображение сходства корреляции pearson между двумя пользователями в Apache Mahout
ответ
Есть несколько способов, как ваши данные выглядят? Это данные взаимодействия, такие как покупки или мнения или рейтинги?
Если это может привести к повреждению элементов или искрам-деталям, то вместо того, чтобы подгружать элементы и идентификаторы пользователя. Если вы кодируете данные как разреженную матрицу, по одной строке для каждого пользователя, вы также можете использовать ряды, сходные друг с другом, или искра-ряды.
Для заданий hadoop идентификаторы должны быть идентификаторами Mahout, номерами ненулевых строк и столбцов для элементов и пользователей. Для заданий Spark вы можете использовать любые идентификаторы, которые вы хотите - они будут считаны как текст и поэтому должны быть уникальной строкой.
Pearson поддерживается только рабочими местами hadoop. Работа Spark использует только коэффициент логарифмической правдоподобия. В совместных фильтрационных приложениях LLR почти всегда лучше других показателей «подобия».
- 1. Кластеризация основана на корреляции pearson
- 2. Расчет сходства косинусов в mahout
- 3. Результаты коэффициента корреляции Odd Pearson
- 4. Pearson Корреляция между двумя колонками
- 5. Функция корреляции Pearson, возвращающая Nan
- 6. Отображение сообщений между двумя пользователями. Laravel
- 7. Python: поиск сходства между пользователями в кластере
- 8. Множественные независимые корреляции (Pearson) с R
- 9. Оценка сходства между двумя неспаренными наборами данных
- 10. Несоответствие при расчете коэффициента корреляции pearson
- 11. Как совместить два экземпляра сходства в Apache mahout
- 12. Вычисление коэффициента корреляции между двумя многомерными массивами
- 13. Использование word2vec для расчета сходства между пользователями
- 14. Измерение сходства между двумя векторами
- 15. Поиск сходства между двумя документами
- 16. Процент сходства между двумя colulmns
- 17. Мера сходства между двумя изображениями
- 18. Мера сходства между двумя списками
- 19. Поиск сходства между двумя профилями пользователя
- 20. Связь между двумя пользователями
- 21. Совместная фильтрация - Матричная факторизация против корреляции pearson
- 22. API для сбора коэффициентов корреляции pearson
- 23. Сессия между двумя пользователями
- 24. Поиск корреляции между двумя переменными
- 25. Отображение корреляции между двумя переменными с помощью диаграммы рассеяния
- 26. Какова мотивация когерентности Пирсона в Apache Mahout
- 27. Pearson Корреляция из нескольких строк
- 28. Замена экранов между двумя пользователями
- 29. rsyncing между двумя пользователями нерегистрированная
- 30. Противоречие между Pearson и Pairwise.prop.test