Tweepy. сохранение твитового текста в python pandas dataframe

Я следую онлайн-учебнику (http://adilmoujahid.com/posts/2014/07/twitter-analytics/), и я застрял, несмотря на то, что написал сценарий python. Я не очень разбираюсь в python, и мне сложно понять документацию на картах (которые используются в учебнике). Прямо сейчас я получаю «valueError Не могу установить фрейм без определенного индекса и значение, которое нельзя преобразовать в серию», и не может определить исправление. У меня создается впечатление, что в DataFrame будет 3 столбца. Один со всеми твитами, один с твитами, которые упоминают facebook и один со всеми твитами, в которых упоминается Microsoft. Я также понимаю, что учебник рассчитан на два года, поэтому, возможно, существует синтаксис, который устарел? Любая помощь приветствуетсяTweepy. сохранение твитового текста в python pandas dataframe

import json 
import pandas as pd 
import re 

tweets_data_path = "Desktop/twit_dat/tweet1.txt" 
tweets_data = [] 

tweets_file = open(tweets_data_path, "r") 
for line in tweets_file: 
    try: 
     tweet = json.loads(line) 
     tweets_data.append(tweet) 
    except: 
     continue 


tweets = pd.DataFrame() 


tweets['text'] = map(lambda tweet: tweet['text'], tweets_data) 
tweets['Facebook'] = tweets['text'].apply(lambda tweet: word_in_text('Facebook', tweet)) 
tweets['Microsoft'] = tweets['text'].apply(lambda tweet: word_in_text('Microsoft', tweet)) 



def word_in_text(word,text): 
    if text == None: 
     return False 
    word = word.lower() 
    text = text.lower() 
    match = re.search(word,text) 
    if match: 
     return True 
    else: 
     return False

Вот пример данных я использую: http://charon.kean.edu/~jonathan/exampledata.txt

источник

2017-02-15 overboard182

Я думаю, что было бы проще импортировать непосредственно текстовый файл в фреймворк данных без необходимости добавления данных в список. Если вы разместите некоторые исходные данные вашего исходного файла, мы можем попытаться вам помочь. –

@FabioLamanna Спасибо, новая ссылка с образцами данных, добавленными к оригинальному вопросу – overboard182

Может быть, ваша панды версия ниже. Я копирую код и отлично работаю над своим компилятором. Посмотрите, полезно ли это.
https://github.com/pandas-dev/pandas/issues/5632
- это скорее комментарий, но у меня нет этой привилегии.

источник

2017-02-15 15:02:08

Tweepy. сохранение твитового текста в python pandas dataframe

ответ

Смежные вопросы