Я создал веб-скребок, который извлекает все изображения на веб-сайте. Мой код должен печатать каждый URL-адрес img на стандартный вывод и записывать csv-файл со всеми этими функциями, но прямо сейчас он записывает только последнее изображение, найденное в файл, и номер этого результата в csv.Невозможно записать более одной строки в CSV
Вот код, который я сейчас использую:
# This program prints a list of all images contained in a web page
#imports library for url/html recognition
from urllib.request import urlopen
from HW_6_CSV import writeListToCSVFile
#imports library for regular expressions
import re
#imports for later csv writing
import csv
#gets user input
address = input("Input a url for a page to get your list of image urls ex. https://www.python.org/: ")
#opens Web Page for processing
webPage = urlopen(address)
#defines encoding
encoding = "utf-8"
#defines resultList variable
resultList=[]
#sets i for later printing
i=0
#defines logic flow
for line in webPage :
line = str(line, encoding)
#defines imgTag
imgTag = '<img '
#goes to next piece of logical flow
if imgTag in line :
i = i+1
srcAttribute = 'src="'
if srcAttribute in line:
#parses the html retrieved from user input
m = re.search('src="(.+?)"', line)
if m:
reline = m.group(1)
#prints results
print("[ ",[i], reline , " ]")
data = [[i, reline]]
output_file = open('examp_output.csv', 'w')
datawriter = csv.writer(output_file)
datawriter.writerows(data)
output_file.close()
webPage.close()
Как получить эту программу, чтобы написать все изображения, найденную в файл CSV?
Объект 'data', как указано в 7-й строке снизу, содержит только одну строку. – bernie
@bernie Итак, как я могу распознать все данные в reine? –
@Celeo Извините, я пытаюсь распечатать все данные –