Я пишу простой паук с помощью scrapy, в котором я хочу добавить какой-то механизм, чтобы узнать, какой контент я сканирую.python web scraping with scrapy spider
Скажем, например, у меня есть список строк:
The resource you are looking for has expired
The resource is not available
Как что у меня есть тысячи строк. Теперь я хочу проверить, есть ли у этого обходного контента один из них. Как я могу сделать этот python?
def process_item(self, item, spider):
try:
content = items['body']
----------------------------- // How can i proceed further.
except pymssql.Error, e:
print ("error")
в «содержании» у меня есть информация об обходе.
у меня есть:
- с помощью сравнения строк
- должны создать файл поиска и сделать соответствующий
Но я хотел бы знать, является их какой-либо способ сделать это эффективно?
Hi alecxe, Спасибо за ответ и как я могу переместить этот шаг на уровень паука. Я новичок в этом Можете ли вы мне помочь – Backtrack
@Backtrack вы могли бы показать код своего паука? Благодарю. – alecxe
Я использую портию, чтобы построить своего паука. Так что я немного запутался сейчас, например, какую часть кода я должен делиться – Backtrack