Я новичок в scrapy framework, и я видел несколько уроков, используя LinkExtractors
и несколько, используя SgmlLinkExtractor
. Я попытался найти различия/плюсы для обоих, но результаты не были удовлетворительными.Разница между LinkExtractor и SgmlLinkExtractor
Может ли кто-нибудь сказать мне разницу между обоими? Когда мы должны использовать вышеуказанные экстракторы?
Спасибо!
Что касается различий, 'SgmlLinkExtractor' основан на [' sgmllib.SGMLParser'] (https://docs.python.org/2/library/sgmllib.html) (модуль 'sgml' устарел с Python 2.6 , и недоступен в Python3), тогда как по умолчанию 'LinkExtractor' реализован поверх' lxml', который несколько быстрее и хорошо поддерживается. –