2015-03-30 2 views
2

Я участвую в конкурсе на программирование, где у меня есть данные, и где первый номер является пользователем, второй номер - это фильм, а третий - числом в рейтинге очков.Система рекомендаций и предсказатели базовой линии

0 0 9 
0 1 8 
1 1 4 
1 2 6 
2 2 7 

Эти данные в таблице: Ряды пользователей 0, 1 и 2; столбцы - фильмы 0, 1 и 2; Клетки оценки, "-" не проголосовали:

enter image description here

И я должен предсказать третий номер для следующих данных (пользователь, кино,?):

0 2 
1 0 
2 0 
2 1 

Я использую этот путь для нахождения значений смещения https://youtube.com/watch?v=dGM4bNQcVKI и таким образом для прогнозирования https://www.youtube.com/watch?v=4RSigTais8o.

Значение смещения для пользователя 0: 9 + 8/2 = 8.5 - 1.5 = 7.

enter image description here

значение смещения для фильма № 2: 6 + 7/2 = 6.5 - 1.5 = 5.

enter image description here

и базовые предикторы:

https://intern.contest.yandex.ru/testsys/tex/render/XGhhdCByX3t1bX0gPSBcbXUgKyBiX3UgKyBiX20s.png

1.5 + 7 + 5, где результат 13.5, но в конкурсе результат: 7.052009.

И результат для всех данных чисел должно быть (где первое число является пользователем, второй номер фильма, а третий ряд в тогдашних пунктов рейтинга):

0 2 7.052009 
1 0 6.687943 
2 0 6.995272 
2 1 6.687943 

Где моя ошибка?

ответ

1

Среднее значение для ВСЕХ настоящих оценок ((9 + 8 + 4 + 6 + 7)/5 = 6.8), я не вижу этого числа в любом месте, поэтому, я думаю, это ваша ошибка.

В видеоролике Prof. использовал среднее среднее значение 3.5 во всех вычислениях, включая расчетное смещение, он пропустил, как достичь этого числа, если вы добавите все числа на таблицу видео и разделите, вы получите 3.5.

0 2 9.2 - это ответ на первый, используя ваши видео в качестве руководства. Видео утверждает, что избегало исчисления, разные окончательные ответы на конкурс, вероятно, исходят из использования «полного» метода. ?

0 2, пользователь 0 (строка 0: 9 8 х), фильм 2 (колонка 2: х 6 7)

raw average = 6.8 
bias user 0: (9+8)/2 - 6.8 = 1.7 
bias movie 2: (6+7)/2 - 6.8 = -0.3 
prediction: 6.8+1.7-0.3 = 8.2 

Проблема выглядит как вариации Netflix конкурс, конкурс» хозяин знает фактические ответы (рейтинги), он не дает их вам, вы должны угадать/предсказать их, победителем конкурса является тот, который ближе всего подходит к фактическим ответам.

Победитель вашего конкурса получил самое близкое место, но он попал туда с использованием неизвестного метода или его собственной вариации метода знания, если ваша цель - точно соответствовать его ответу, вам лучше спросить его, какой метод он и как он его модифицировал, и попытаться воспроизвести его результаты.

Если это была домашняя работа, а не конкурс, тогда учитель ожидал, что вы будете использовать «правильный» метод, которым он учил вас (нет установленного метода, только многие методы, которые работают с разной точностью), вам придется используйте его точно так, как он вас учил. Но это конкурс, ваша цель - найти базовый метод, который приближается к лучшему (тот, который вы использовали, очень мал по точности), и немного поработать с ним, чтобы получить еще лучшие результаты.

Если вы хотите понять ссылку, я предлагаю вам исследовать, а затем задать вопрос статистики, потому что это просто статистика. Вы можете попытаться понять связь или исследование Матрица-факторизация самостоятельно. Помните, что для получения результатов конкурса (или закрытия) вы не сможете использовать простой метод, подобный тому, который вы нашли в видео на YouTube, но требуете метода с гораздо большей математикой.

+0

в видео Профессор Mung Chiang обнаруживает смещение для D (вычисляет числа в строке D), а затем для 3 (вычисляет числа в столбце 3). – rel1x

+0

raw average = 6.8, bias user 0: (9 + x + x)/1 - 6.8 = 2.2 bias movie 2: (x + x + 7)/1 - 6.8 = 0.2 оценка: 6.8 + 2.2 + 0.2 = 9.2 Я сказал 8.2 изначально, потому что я ввернул и пошел с пользователями = строки и фильмы = столбцы: P – gia

+0

bleh был прав в первый раз, все же я использую ваше видео и обновил математику, а не только результат. Результаты конкурса исходят от использования другого метода, если вы можете удалить нисходящее направление, которое было бы оценено – gia

Смежные вопросы