2013-04-02 3 views
0

Я пытаюсь написать архиватор изображений в виде python, который загружает изображения с определенного сайта, и я продолжаю получать неправильный режим ioerror errno22 ('r') или имя файла ошибка, которая появляется на моем BeautifulSoup линииBeautifulSoup python throwing errno22 error invalidmode ('r')

soup = BeautifulSoup(open(pahealUrl)) 

aTagList = soup.findall("a") 

for randomTag in aTagList: 
    if randomTag.find(text="Image Only"): 
    imageList.append(randomTag) 

print randomTag 

самого URL является действительной, и я не вижу, в чем проблема. любая идея относительно того, почему он выбрасывает неверную ошибку errno22/filename?

+1

Вы не можете просто открыть такой URL. Вам нужно получить доступ к странице, например, с помощью urlib2 –

+0

, поэтому, если бы у меня был URL-адрес страницы, которую я хотел разобрать, используя BeautifulSoup и urllib2, что бы я сделал? вроде нового для python, так что ... –

ответ

1

Чтобы получить HTML веб-страницы, используйте urllib2 библиотеку:

import urllib2 
html = urllib2.urlopen(myurl).read() 

open() не используется для открытия веб-страниц, но и для файлов. Вот почему вы получаете ошибку имени файла.

Тогда вы можете BeautifulSoup() HTML, чтобы получить ваш суп.