Я хочу получить ссылку для скачивания. Например, в http://www.brothersoft.com/windows/top-downloads/Как получить ссылку для загрузки в python с помощью beautifulsoup?
поэтому ожидаемый результат должен быть:
List of url:
1. http://www.brothersoft.com/photoscape-64604.html
2. http://www.brothersoft.com/orbit-downloader-54366.html
3. ....
4. ...
till 100.
Я попробовал этот код:
import urllib
from bs4 import BeautifulSoup
pageFile = urllib.urlopen("http://www.brothersoft.com/windows/top-downloads/")
pageHtml = pageFile.read()
pageFile.close()
soup = BeautifulSoup("".join(pageHtml))
sAll = soup.findAll("a")
for i in range (0,100)
for link in sAll:
print i,link
Но дать неправильный вывод. Спасибо
я получил эту ошибку: Файл "C: \ Documents и Settings \ Fairuz \ Desktop \ soup.py", строка 13, в печати я, Салль [я] [ "HREF"] Файл «C: \ Python27 \ lib \ encodings \ cp437.py ", строка 12, в коде return codecs.charmap_encode (вход, ошибки, encoding_map) UnicodeEncodeError: кодек 'charmap' не может кодировать символ u '\ u2013' в позиции 115: символьные карты на –
Как насчет 'print i, sAll [i] [" href "]. encode ('utf-8')'? –
Файл «C: \ Documents and Settings \ Fairuz \ Desktop \ soup.py», строка 13, в печать i, sAll [i] ["href"] Файл "C: \ Python27 \ lib \ encodings \ cp437 .py», строка 12, в кодирования возврата codecs.charmap_encode (вход, ошибки, encoding_map) UnicodeEncodeError: 'CharMap' кодек не может кодировать символ и '\ u2013' в позиции 115: символ сопоставляется –