2011-01-20 8 views
1

я покажу вам 2 сценариев (нотабене d = коэффициент затухания = 0,5)Pagerank - Trouble

Первый сценарий: предположим, иметь 4 узлов A, B, C, D:

  • B, C, D ссылку на A.

PageRank является: PR(A)=0.5 + 0.5*(PR(B)+PR(C)+PR(D))

я могу решить это уравнение, положив 0.25 на PR(B)=PR(C)=PR(D) и я буду получать 0.875as значение. Я не нужно, чтобы решить какую-либо систему

Второй сценарий: предположим, иметь 4 узлов A, B, C, D:

  • A ссылка на B и C
  • B ссылка на C
  • C ссылка на A

В этом пути PageRank будет:

PR(A)=0.5 + 0.5 * PR(C)

PR(B)=0.5 + 0.5 * ((PR(A))/(2))

PR(C)=0.5 + 0.5 * ((PR(A))/(2) + PR(B))

Я должен решить эту систему, чтобы получить результат. Я не поставил 1/N на PR(A), PR(B), PR(C) and PR(D)

На самом деле, я поиск в Интернете решения и значения:

$ PR (A) = 14/13 = 1.07692308 $

$ PR (B) = 10/13 = 0,76923077 $

$ PR (C) = 15/13 = 1,15384615 $

Так почему два подобных сценариев я использую 2 разное поведение?

Надежда кто-то может мне помочь :) Ура

+1

Хороший вопрос. Но это связано с математикой. – shamittomar

+0

Uhm ... есть форум Maths, такой StackOverflow? :) – markzzz

+0

Нашел математический «переполнение». Невероятно: нет тега pagerank o_O – markzzz

ответ

1

Два сценария различаются в силу симметрии в первой задаче: B, C и D ссылка и связаны с теми же страницами (т.е. они все пункты A и ничего не указывает на них). Поэтому их ранжирование по страницам будет одинаковым, это даст вам дополнительное ограничение: PR (B) = PR (C) = PR (D), что позволяет легко решить проблему.

Вторая проблема не имеет симметрии и должна быть решена длинной рукой.

1

Предположим, что небольшая вселенная из четырех веб-страниц: A, B, C и D. Связывание страницы с собой или несколько исходящих ссылок с одной страницы на другую страницу игнорируются. PageRank инициализируется с одинаковым значением для всех страниц.В исходной форме PageRank сумма PageRank по всем страницам составляла общее количество страниц в Интернете в то время, поэтому каждая страница в этом примере имела бы начальный PageRank из 1. Однако более поздние версии PageRank и оставшейся части этого раздела, предположим распределение вероятности между 0 и 1. Следовательно, начальное значение для каждой страницы составляет 0,25.

PageRank, перенесенный с заданной страницы в целевые объекты исходящих ссылок на следующей итерации, поделен поровну между всеми исходящими ссылками.

Если единственные звенья в системе были со страниц B, C и D до A, каждая ссылка перенесет 0,25 PageRank в A на следующую итерацию, в общей сложности 0,75.

PR-(А) = ПР (В) + PR (С) + PR (D)

Предположим, вместо того, чтобы эта страница Б имела ссылку на страницах C и A, страница С имеет ссылку на страницу A, а на странице D были ссылки на все три страницы. Таким образом, на следующей итерации страница B переведет половину своего существующего значения, или 0,125, на страницу А, а другую половину, или 0,125, на страницу C. Страница C переведет все свое существующее значение 0,25 на единственное страница, на которую она ссылается, A. Поскольку D имела три исходящие ссылки, она передавала бы треть своей существующей ценности или приблизительно 0,083 на A. По завершении этой итерации страница A будет иметь PageRank 0,458.

PR-(А) = \ гидроразрыва {ПР (В)} {2} + \ гидроразрыва {ПР (С)} {1} + \ гидроразрыва {PR (D)} {3}. \,

Другими словами, PageRank, присвоенный исходящей ссылкой, равен собственной оценке PageRank документа, деленной на количество исходящих ссылок L().

PR (A) = \ frac {PR (B)} {L (B)} + \ frac {PR (C)} {L (C)} + \ frac {PR (D)} {L (D)}.

В общем случае, значение PageRank для любой страницы и может быть выражена как:

PR (и) = \ sum_ {v \ в B_u} \ гидроразрыва {PR (v)} {L (V)},

То есть значение PageRank для страницы u зависит от значений PageRank для каждой страницы v, содержащихся в наборе Bu (набор, содержащий все страницы, ссылающиеся на страницу u), деленные на число L (v) ссылок со страницы v.

For further queries visit here

Смежные вопросы