2010-09-12 3 views
3

Я помню, как однажды посетил веб-сайт, который представляет интересную книгу . Он будет показывать список слов , которые чаще всего повторялись в этой книге и которые были уникальными/необычными. Другими словами, в нем будут отображаться слова максимальной частоты, но не такие общие слова, как я, я и т. Д. Тогда у него должны быть такие вещи, как показ фразы, если это повторяется часто. Например, Остров Сокровищ, вероятно, имел бы такие слова, как: пираты, шторм, битва, сокровище, куски восьми, остров, Лонг Джон Сильвер, Джим, предзнаменование и т. Д.Программное обеспечение для поиска наиболее встречающихся уникальных слов в файле

Это был самый интересный способ быстро почувствовать себя о том, хочу ли я читать эту книгу или нет. Я больше не могу найти этот сайт. Поэтому я подумал о поиске программного обеспечения, которое будет выполнять эту работу. У меня есть несколько книг в формате pdf и doc, которые я бы хотел проанализировать. Кто-нибудь знает о хорошем инструменте/программном обеспечении, который может это сделать?

Конечно, я мог бы это сделать сам, но было бы неплохо не изобретать велосипед. Так что мой вопрос, " вы знаете любого такого программного обеспечения? "

Спасибо,
Mugen
(библиофил)

+2

хорошо, если вы можете скопировать весь текст книги, возможно, http://www.wordle.net/ будет работать для вас. Он создает облака тегов и визуализирует их по-разному, что довольно круто. – Dave

+0

У Amazon есть версия этого, называемого [Статистически невероятные фразы] (http://en.wikipedia.org/wiki/Statistically_Improbable_Phrases). –

+0

Простая проблема, чтобы сделать интересную утечку: [Code golf: Частотная диаграмма слов] (http://stackoverflow.com/questions/3169051/) – dmckee

ответ

1

Попробуйте Wordle.net. Он создает облака тегов и визуализирует их по-разному.

Ответ атрибуции: Dave