2017-02-21 5 views
1

Я изучаю алгоритм PageRank и от Wikipedia, он дает следующую формулу:Вычислить ранг страницы

enter image description here

Из формулы, рейтинг страницы вычисляется из рядов страниц, ссылки на него. Кроме того, они дают простой пример четырех узлов A, B, C, D. Первоначально каждый узел имеет ранг страницы 0,25. Поэтому, если узлы B, C, D связаны с узлом A, а других ссылок нет, PR(A) = 0.15 + 0.85*(0.25 + 0.25 + 0.25) = 0.7875 и PR(B) = PR(C) = PR(D) = 0.15. Но сумма рядов страниц не равна 1, которая является суммой рангов на начальном шаге. Неужели я ошибаюсь для этого расчета?

Я читал another tutorial, и в их вычислении сумма рангов всегда одинакова. Может ли кто-нибудь объяснить мне, где я ошибаюсь? Большое спасибо.

ответ

1

Формула, в которой хранится сумма, равная 1, равна (1 - d)/N + d * (...), а не та, что в вашем посте (это нормально, что сумма не соответствует вашей формуле). В статье Википедии ясно:

Коэффициент демпфирования регулирует производное значение вниз. Оригинальный бумага, однако, дал следующую формулу, которая привела к некоторой путанице :

... (ваша формула здесь идет)

Разница между ними заключается в том, что значения PageRank в первый сумма формулы равна единице, тогда как во второй формуле каждый PageRank равен , умноженному на N, и сумма становится N.

+0

Да, я вижу. Но дело в том, что сумма (1 или что-либо) ранга страниц не должна изменяться по итерациям. В уроке, о котором я упоминаю, сумма всегда равна 5. – lenhhoxung

Смежные вопросы