0
Я создал сценарий для получения каждого тега H1 со всех 76 страниц веб-сайта. Но в этом процессе моя программа копирует очень конкретную строку «Текущие события в январе 2015 года», так как эта строка присутствует на каждой странице. Могу ли я редактировать код, чтобы его можно было распечатать 1 раз?Удаление повторяющегося содержимого тегов с помощью BeautifulSoup
Вот мой код:
from bs4 import BeautifulSoup as bs
import urllib
for i in range(2,77):
url1="http://currentaffairs.gktoday.in/month/current-affairs-january-2015/"+"page/"+str(i)
soup = bs(urllib.urlopen(url1))
for link in soup.findAll('h1'):
print link.string
Спасибо заранее.
спасибо. Он отлично работал. –