я первым использовать BeautifulSoup:Панды pd.DataFrame превращается в кортежи вместо Dataframe
mydivs = soup.findAll('div', {"class": "content"})
так, что каждый mydiv
в mydivs
выглядит следующим образом, например:
<div class="content">A number of hats by me <br/><br/>three now though ... </div>
Затем я хочу, чтобы хранить каждый текстовых блоков в каждом div
в виде строк в кадре данных. Я хочу dataframe, чтобы выглядеть примерно так:
index posts
0 <div class="content">A number of <br/><br/>three ... </div>
1 <div class="content">Stack ... <br/><br/>overflow ... </div>
...
Это код, который я попытался
A=[]
indices=[]
j=0
for div in mydivs:
A.append(div)
indices.append(j)
j+=1
DF = pd.DataFrame({'index': indices, "posts": A})
Когда я затем распечатать shape
я
print DF.shape()
TypeError: 'tuple' object is not callable
Однако, я хочу DF
быть файловым кадром, а не tuple
. Как я могу это исправить?