Это beautifulsoup
процедура, которая захватывает содержимое во всех <p>
тегах html. После захвата содержимого с некоторых веб-страниц я получаю сообщение об ошибке, указывающее, что максимальная глубина рекурсии превышена.Beautifulsoup, максимальная глубина рекурсии достигнута
def printText(tags):
for tag in tags:
if tag.__class__ == NavigableString:
print tag,
else:
printText(tag)
print ""
#loop over urls, send soup to printText procedure
Дно следа:
File "web_content.py", line 16, in printText
printText(tag)
File "web_content.py", line 16, in printText
printText(tag)
File "web_content.py", line 16, in printText
printText(tag)
File "web_content.py", line 16, in printText
printText(tag)
File "web_content.py", line 16, in printText
printText(tag)
File "web_content.py", line 13, in printText
if tag.__class__ == NavigableString:
RuntimeError: maximum recursion depth exceeded in cmp
Не могли бы вы объяснить. Это пример вывода из предыдущего URL-адреса, который он выдает. «И то, что раньше было двухмесячным процессом , для многих компаний в настоящее время является пятидневным процессом. Проблема с повышением 1 до 2 миллионов на конвертируемом ...» это содержит строки, а также строки длиной 1 , – yayu
Какую часть вы не понимаете, итерацию или итерацию? Конечно, все это зависит от того, как вы понимаете, как работает код. –
Можете ли вы пояснить, что значит «вы ударили по строке»? Что значит «удар»? Разве весь HTML-документ, который разбирается Beautiful Soup в DOM изначально, является строкой - и не являются ли сами теги строк символов? Мы столкнулись с той же ошибкой, просто пытающейся подставить значения на простую HTML-страницу с 12 привязками, но неясно, что вызывает рекурсию. – Praxiteles