0
Я хочу удалить дубликат url из файла со списком url. она имеет «http://www.naver.com/나눔글꼴.jpg» и они повторяют .. вот мой код:Удалить дубликат url python beautifulsoup
from bs4 import BeautifulSoup
import lxml
import re
import urllib.request
p = re.compile('나눔글꼴')
html = 'http://www.naver.com'
data = urllib.request.urlopen("http://www.naver.com").read()
soup = BeautifulSoup(data, 'lxml')
links = p.findall(str(soup))
i = set()
for i in links:
link = 'http://www.naver.com/' + str(i) + '.jpg'
print(link)
Вы забыли включить ваш код – jasonszhao
хорошо я сделал заново -загрузить –