Я следую онлайн-учебнику (http://adilmoujahid.com/posts/2014/07/twitter-analytics/), и я застрял, несмотря на то, что написал сценарий python. Я не очень разбираюсь в python, и мне сложно понять документацию на картах (которые используются в учебнике). Прямо сейчас я получаю «valueError Не могу установить фрейм без определенного индекса и значение, которое нельзя преобразовать в серию», и не может определить исправление. У меня создается впечатление, что в DataFrame будет 3 столбца. Один со всеми твитами, один с твитами, которые упоминают facebook и один со всеми твитами, в которых упоминается Microsoft. Я также понимаю, что учебник рассчитан на два года, поэтому, возможно, существует синтаксис, который устарел? Любая помощь приветствуетсяTweepy. сохранение твитового текста в python pandas dataframe
import json
import pandas as pd
import re
tweets_data_path = "Desktop/twit_dat/tweet1.txt"
tweets_data = []
tweets_file = open(tweets_data_path, "r")
for line in tweets_file:
try:
tweet = json.loads(line)
tweets_data.append(tweet)
except:
continue
tweets = pd.DataFrame()
tweets['text'] = map(lambda tweet: tweet['text'], tweets_data)
tweets['Facebook'] = tweets['text'].apply(lambda tweet: word_in_text('Facebook', tweet))
tweets['Microsoft'] = tweets['text'].apply(lambda tweet: word_in_text('Microsoft', tweet))
def word_in_text(word,text):
if text == None:
return False
word = word.lower()
text = text.lower()
match = re.search(word,text)
if match:
return True
else:
return False
Вот пример данных я использую: http://charon.kean.edu/~jonathan/exampledata.txt
Я думаю, что было бы проще импортировать непосредственно текстовый файл в фреймворк данных без необходимости добавления данных в список. Если вы разместите некоторые исходные данные вашего исходного файла, мы можем попытаться вам помочь. –
@FabioLamanna Спасибо, новая ссылка с образцами данных, добавленными к оригинальному вопросу – overboard182