Я пытаюсь очистить часть данных с китайского сайта. На сайте я хочу, чтобы очистить это: http://data.10jqka.com.cn/market/yybzjsl/HTZQGFYXGSCDSJLZQYYBСкремблирование таблицы данных с китайского веб-сайта с использованием Python
Я хочу получить всю таблицу данных ниже:
Есть 86 страниц. Код ниже не подходит. Может кто-нибудь дать мне руку?
import urllib2, pandas,json
baseurl="http://data.10jqka.com.cn/interface/market/yybzjsl/desc/%s/20/"
def getdata(pgnum):
cururl = baseurl % str(pgnum)
##print cururl
cn=urllib2.urlopen(cururl)
jstbl=json.load(cn,encoding='gbk')['data']
return pandas.read_html('<table>'+jstbl+'</table>')[0]
dataout=pandas.DataFrame()
for pgnum in range(86):
print pgnum
totaltry=0
while True:
try:
curdata=getdata(pgnum+1)
curdata['pgnum']=pgnum+1
break
except:
totaltry+=1
print 'failed: %s' % totaltry
dataout=dataout.append(curdata, ignore_index=True)
dataout.to_csv('~/Desktop/dataout.csv')
Можете ли вы дать мне код, чтобы сделать это? Спасибо! –
Это потрясающе! Но можете ли вы написать код, чтобы отказаться от всех страниц не только на первой странице? –