В то время как выскабливание вы не загружайте изображения, но ссылочное IMG
тег вместе со всей body
. Вы всегда можете удалить тег IMG
на стороне сервера, прежде чем хранить в своей базе данных/рендеринг для представления. Я предлагаю вам использовать nokogiri для анализа полученного контента и удаления всех вхождений тега IMG
.
Это, однако, не ускоряет процесс. Его просто старый старый html
, который царапается. Если вы хотите, чтобы быстрая выборка и синтаксический анализ отправлялись на Feedzirra
, если вы имеете дело с фидами или Typhoeus
для получения только содержимого html.
lol ............ – hoju