У меня возникли проблемы с добавлением чисел в связанном HTML-файле (суммирование).Не удается добавить вместе извлеченные целые числа из HTML-файла
Я получаю эту ошибку в данный момент:
Line 26 b=sum(y) typeError unsupported operand types for +: int and str
Вот мой код
import urllib
from BeautifulSoup import *
import re
counter = 0
added = 0
url = "http://python-data.dr-chuck.net/comments_42.html"
html = urllib.urlopen(url).read()
soup = BeautifulSoup(html)
# Retrieve all of the span tags
spans = soup('span')
for comments in spans:
print comments
counter +=1
#y = re.findall('(\d+)', comments) -- didnt work
#print y
#added += y
y = re.findall('(\d+)', str(soup))
print y
b = sum(y)
print b
print "Count", counter
print "Sum", added
Мой желаемый результат что-то вроде:
Count: 50
Sum: 2482
Как вы можете видеть, где Я прокомментировал свой код - я попытался добавить их так или iginally. Не знаю, почему это не сработало.
#y = re.findall('(\d+)', comments) -- didnt work
#print y
#added += y
Я также не знаю, почему это помещает найденные числа в списке
y = re.findall('(\d+)', str(soup))
вы суммированием строк. Попробуйте с 'b = sum (map (int, y))' – Pynchia
Итак, что случилось? Вы получили сообщение об ошибке? И работает ли 'b = sum (y)'? –
@zetysz: Я знаю, но тогда OP получит ошибку в 'b = sum (y)'. Но OP только сказал, что он получил ошибку в части комментария. –