BeautifulSoup python throwing errno22 error invalidmode ('r')

Я пытаюсь написать архиватор изображений в виде python, который загружает изображения с определенного сайта, и я продолжаю получать неправильный режим ioerror errno22 ('r') или имя файла ошибка, которая появляется на моем BeautifulSoup линииBeautifulSoup python throwing errno22 error invalidmode ('r')

soup = BeautifulSoup(open(pahealUrl)) 

aTagList = soup.findall("a") 

for randomTag in aTagList: 
    if randomTag.find(text="Image Only"): 
    imageList.append(randomTag) 

print randomTag

самого URL является действительной, и я не вижу, в чем проблема. любая идея относительно того, почему он выбрасывает неверную ошибку errno22/filename?

источник

2013-04-02 j.gooch

Вы не можете просто открыть такой URL. Вам нужно получить доступ к странице, например, с помощью urlib2 –

, поэтому, если бы у меня был URL-адрес страницы, которую я хотел разобрать, используя BeautifulSoup и urllib2, что бы я сделал? вроде нового для python, так что ... –

Чтобы получить HTML веб-страницы, используйте urllib2 библиотеку:

import urllib2 
html = urllib2.urlopen(myurl).read()

open() не используется для открытия веб-страниц, но и для файлов. Вот почему вы получаете ошибку имени файла.

Тогда вы можете BeautifulSoup() HTML, чтобы получить ваш суп.

источник

2013-04-02 07:01:48 TerryA

это отлично работает, всего лишь несколько простых вопросов. что такое this data called? и как я могу проверить его, как только у меня есть ссылки? –

обычно ассоциируется со ссылками. т. е. ваш прямо там будет ссылаться на страницу blahblah, но на веб-странице будет отображаться «эти данные называются?». Чтобы получить «эти данные», вы можете сначала найти все (используя findAll()), а затем '.text' – TerryA

BeautifulSoup python throwing errno22 error invalidmode ('r')

ответ

Смежные вопросы