я следующую таблицу на веб-сайте, который я экстракцию BeautifulSoup Это гиперссылка (я также придает картину Получить содержимое таблицы в BeautifulSoup
В идеале я хотел бы, чтобы каждая компания в одном строка в формате CSV, однако я получаю его в разных строках. Пожалуйста, смотрите изображение прилагается.
Я хотел бы, чтобы он, как и в поле «D», но я получаю его в A1, A2, A3 ...
Это код, я использую для извлечения:
def _writeInCSV(text):
print "Writing in CSV File"
with open('sara.csv', 'wb') as csvfile:
#spamwriter = csv.writer(csvfile, delimiter='\t',quotechar='\n', quoting=csv.QUOTE_MINIMAL)
spamwriter = csv.writer(csvfile, delimiter='\t',quotechar="\n")
for item in text:
spamwriter.writerow([item])
read_list=[]
initial_list=[]
url="http://www.nse.com.ng/Issuers-section/corporate-disclosures/corporate-actions/closure-of-register"
r=requests.get(url)
soup = BeautifulSoup(r._content, "html.parser")
#gdata_even=soup.find_all("td", {"class":"ms-rteTableEvenRow-3"})
gdata_even=soup.find_all("td", {"class":"ms-rteTable-default"})
for item in gdata_even:
print item.text.encode("utf-8")
initial_list.append(item.text.encode("utf-8"))
print ""
_writeInCSV(initial_list)
Может кто-то помочь, пожалуйста?
Было бы еще лучше, я мог бы повторить всю таблицу в формате CSV, но я борюсь с тем, как сделать это – Nant