2015-03-15 2 views
0

Я хочу сделать проект по сводке документов. Может ли кто-нибудь объяснить алгоритм суммирования документов с использованием подхода, основанного на графике? Также, если кто-то может предоставить мне ссылки на несколько хороших научных работ ???объясняет алгоритм суммирования документов

ответ

1

Посмотрите на TextRank и LexRank.

LexRank - это алгоритм, по существу идентичный TextRank, и оба используют этот подход для обобщения документа. Эти два метода были разработаны разными группами одновременно, и LexRank просто сосредоточился на суммировании, но также мог быть легко использован для извлечения ключевой фразы или любой другой задачи ранжирования NLP.

В обоих алгоритмах предложения ранжируются путем применения PageRank к полученному графику. Сводка формируется путем объединения предложений верхнего рейтинга с использованием ограничения порога или длины для ограничения размера сводки.

https://en.wikipedia.org/wiki/Automatic_summarization#Unsupervised_approaches:_TextRank_and_LexRank

Смежные вопросы