2016-07-22 2 views
-1

Данные соскабливания в Pyhton. Код работает нормально, но он показывает ошибку, о которой я упоминал ниже. В чем может быть причина?Python Data Scraping

import urllib2 
from bs4 import BeautifulSoup 
from xlwt import workbook 

wb = Workbook() 
sheet1 = wb.add_sheet('Sheet1') 

soup = BeautifulSoup(urllib2.urlopen("http://en.wikipedia.org/wiki/List_of_Indian_satellites").read()) 

for row in soup('table', {'class': 'wikitable sortable jquery-tablesorter’})[0].tbody('tr'): 
    tds = row('td') 
    sheet1.write(row, 0, tds[0].string) 
    sheet2.write(row, 1, tds[1].string)  

wb.save('Performance Project.xls')  

Error: File "ProcessingProject.py", line 12 SyntaxError: Non-ASCII character '\xe2' in file ProcessingProject.py on line 12

, но без кодирования не заявлено; см http://python.org/dev/peps/pep-0263/ подробности

ответ

0
#!/usr/bin/env python 
# -*- coding: utf-8 -*- 

Добавить это в начало файла

0

для строки в супе ('стол', { 'класс': 'wikitable сортировкой JQuery-TableSorter'}) [0] .tbody ('tr'):

Вы использовали неправильный символ в качестве разделителя одиночной кавычки после jquery-tablesorter