Здесь есть трасса для TextRank:Почему собственные значения adajcency матрицы фактически приговаривают баллы в Textrank
- документ резюмировать выражается в тс-IDF матрица
- (тс-IDF матрица) * (тс-IDF матрица) .Transpose = матрица смежности некоторого графа, вершинами которого являются фактически приговоры выше документа
- ранг страницы применяется на этом графике -> возвращает значения PR каждого предложения
Теперь эти значения PR фактически являются собственными значениями этой матрицы смежности
Каков физический смысл или интуиция за этим.?
Почему значения Eigen на самом деле являются рядами?
Вот ссылка для Page Rank: http://www.cs.princeton.edu/~chazelle/courses/BIB/pagerank.htm
Вот выдержка сверху страницы:
PageRank или PR-(А) может быть вычислена с использованием простого итеративного алгоритма, и соответствует основной собственный вектор нормализованной матричной матрицы.
Ссылка для TextRank: https://joshbohde.com/blog/document-summarization
Спасибо .... Итак, мы получаем некоторый собственный вектор, используя это выше уравнение ... НО ЗАМЕЧАНИЕ: ** Как найти некоторый собственный вектор, связанный с алгоритмом PageRank ..? ** Что такое интуиция/физический смысл это отношение ...?. Не могли бы вы рассказать об этом? – mach
Последняя часть * есть * Pagerank, в основном: она находит значение, решая для стационарного собственного вектора стохастической матрицы * P *. Текстовый ранг в основном заимствует эту идею для приложений ранжирования предложений и указывает, как построить * P * для этого случая. –
И как получается, что матрица P является стохастической (значения tf-idf могут быть любыми и не могут быть добавлены к 1)? – mach