У меня есть список объектов Словаре {key,value}
следующим образом:список питон dicts к dataframe
recd = [{'Type': 'status'}, {'Origin': 'I just earned the Rookie badge on #Yelp!'},
{'Text': 'I just earned the Rookie badge on'}, {'URL': ''},
{'ID': '95314179338158080'}, {'Time': 'Sun Jul 24 21:07:25 CDT 2011'},
{'RetCount': '0'}, {'Favorite': 'false'},
{'MentionedEntities': ''}, {'Hashtags': 'Yelp'}]
Я пытался любое количество способов, чтобы переместить это в панд dataframe объекта, где ключ является столбец имя и значение - это значение записи.
s = pd.Series(data=recd) ## try #1
tweets = tweets.append(s, ignore_index=True)
tweets = tweets.append(recd, ignore_index=True) #try #2
tweets.from_items(recd) #try #3
mylist = [item.split(',') for item in recd] #try #4 (stack overflow)
tdf = pd.DataFrame(mylist)
tweets.from_records(recd) #try #5
tweets.concat(recd, axis=1, etc) # tries 6-20
Конечно, ни одна из этих работ не работает. На данный момент я пробовал очевидное и использовал все различные параметры columns=
, ignore_index
и т. Д.) Я пропускаю что-то очевидное. Обычно я работаю со структурированными дампами данных, так что это для меня ново. Я подозреваю, что не правильно форматирую свои данные, но решение ускользает от меня.
Фон: Я строю каждый объект recd по одному из большого проанализированного файла данных с нестандартным форматом в единую полную запись, а затем пытаюсь преобразовать его в кадр данных pandas, где я могу его сохранить в любом количестве используемых форматов. Этот процесс также удаляет кучу ошибок данных. Код, который делает это:
k = line.split(":",1)
key = str(k[0].strip())
val = str(k[1].strip())
if key in TweetFields:
d = {key : val} # also tried d = [key:val]
recd.append(d)
Спасибо за ваш совет.
Вы имеете в виду что-то вроде 'df = pd.DataFrame.from_records (recd)'? –
Я тоже это пробовал. это не сработало. – HarveyS
Не работал как, какой результат вы ожидаете? –