В моем коде я установил путь для файла txt к пути к скрипту, но по какой-то причине после того, как программа записывает некоторые файлы txt для нескольких ссылок, она бросает эта ошибка «FileNotFoundError: [Errno 2] Нет такого файла или каталога:« Я действительно не понимаю, почему для некоторых ссылок он работает, но для других он не может найти каталог.Нет такой ошибки в файле или каталоге (python)
from lxml import html
import requests, os.path
spath = os.path.dirname(__file__) ## finds path of script
main_pg = requests.get("http://www.nytimes.com/") ## input site here
with open(os.path.join(spath, "Main.txt"),"w", encoding='utf-8') as doc:
doc.write(main_pg.text)
tree = html.fromstring(main_pg.content)
hrefs = tree.xpath('//a[starts-with(@href, "http:") or starts-with(@href,"https:") or starts-with(@href,"ftp:")]/@href') ## To avoid non-absolute hrefs
for href in hrefs:
link_pg = requests.get(href)
tree2 = html.fromstring(link_pg.content)
doc_title = tree2.xpath('//html/head/title/text()') ## selects title of text from each link
with open(os.path.join(spath, "%s.txt"%doc_title), "w", encoding ='utf-8') as href_doc:
href_doc.write(link_pg.text)
использования скорее 'spath = os.path.dirname (sys.argv [0])' – SIslam
Какой файл он не находит? Что такое каталог? Что такое файл? Неверно ли символы 'doc_title' содержат символы в окнах? –
Например, на главной веб-странице New York Times она выдает эту ошибку «FileNotFoundError: [Errno 2] Нет такого файла или каталога:« ['Hereâ \\ x80 \\ x99s, что вы пропустили в дискуссии - The New York Times'] .txt "", но по какой-то причине он может создавать документы txt для других ссылок, а не только этот. Также SIslam, я попытался изменить имя dirname и по-прежнему получил ту же ошибку. – JJ47