2010-12-27 3 views

ответ

0

Mechanize, Hpricot также очень полезны. Обратитесь к следующим ссылкам, чтобы узнать, как начать с этих инструментов -

http://rorguide.blogspot.com/2011/04/simple-ruby-screen-scraper-using.html (Simple Рубиновый Скребок экрана с помощью Mechanize, Hpricot и XPath)

http://rorguide.blogspot.com/2011/04/simple-ruby-screen-scraper-in-just-5.html (Simple Рубиновый Скребок экрана всего за 5 строк без использования XPath)

1

Пробовал как ScrAPI, так и Nokogiri для моего применения.

Nokogiri более устойчив к различным кодировкам (utf, windows-XXXX и т. Д.). Это просто работает.

С ScrAPI мне пришлось сначала определить кодировку, как описано in this article. Не стоит беспокоиться с Nokogiri, поскольку он обрабатывает кодировку изящно.

Смежные вопросы