2016-09-05 2 views
2

я первым использовать BeautifulSoup:Панды pd.DataFrame превращается в кортежи вместо Dataframe

mydivs = soup.findAll('div', {"class": "content"}) 

так, что каждый mydiv в mydivs выглядит следующим образом, например:

<div class="content">A number of hats by me <br/><br/>three now though ... </div> 

Затем я хочу, чтобы хранить каждый текстовых блоков в каждом div в виде строк в кадре данных. Я хочу dataframe, чтобы выглядеть примерно так:

index posts 
0  <div class="content">A number of <br/><br/>three ... </div> 
1  <div class="content">Stack ... <br/><br/>overflow ... </div> 
... 

Это код, который я попытался

A=[] 
indices=[] 
j=0 

for div in mydivs: 
    A.append(div) 
    indices.append(j) 
    j+=1 

DF = pd.DataFrame({'index': indices, "posts": A}) 

Когда я затем распечатать shape я

print DF.shape() 
TypeError: 'tuple' object is not callable 

Однако, я хочу DF быть файловым кадром, а не tuple. Как я могу это исправить?

ответ

3

shape является признаком DF. Этот атрибут - tuple. Вы пытаетесь вызвать его с помощью (), который выдает ошибку. Если вы хотите, чтобы форма вобще DF.shape

print DF.shape 

не

print DF.shape() 
Смежные вопросы