2014-01-23 2 views

ответ

2

Чтобы выполнить очистку веб-страниц, вы должны использовать драгоценный камень mechanize с nokogiri для разбора dom.

+0

Я использовал механизатор для утилизации, но библиотека котлов работает лучше, чтобы извлечь только содержимое статьи веб-страницы в python. Я хочу знать, есть ли драгоценный камень, похожий на котел. – Mothirajha

+0

'Mechanize' - это самая быстрая библиотека для работы, и' nokogiri' позволит вам просто очистить часть страницы, которую вы хотите. (статья) – fyz

+0

Можно ли отказаться от контента с разных сайтов без прохождения css или html-тегов с использованием mechanize и nokogiri ???? – Mothirajha

0

Я бы порекомендовал Scrapy. Это Python, а не Ruby, но это потрясающе, что вы можете сделать с очень небольшими усилиями.

+0

Спасибо, я пройду через Scrapy. – Mothirajha

Смежные вопросы