У меня есть набор данных с проектами Kickstarter 13k и их твиты в течение всего проекта. Каждый проект содержит список с количеством твитов за каждый день, , например. [10, 2, 4, 7, 2, 4, 3, 0, 4, 0, 1, 3, 0, 3, 4, 0, 0, 2, 3, 2, 0, 4, 5, 1, 0, 2, 0, 2, 1, 2, 0]
.Как построить гистограмму нескольких списков?
Я взял подмножество данных, установив продолжительность проектов на 31 день, чтобы каждый список имел одинаковую длину, содержащую 31 значение.
Этот фрагмент кода гравюр каждый список твитов:
for project in data:
data[project]["tweets"]
Что это самый простой способ построить гистограмму с Matplotlib? Мне нужно частотное распределение общего количества твитов за каждый день. Как подсчитать значения из каждого индекса? Их простой способ использовать Pandas для этого?
списки также доступны в кадре данных панды:
df = pd.DataFrame.from_dict(data, orient='index')
df1 = df[['tweets']]
Вы пробовали поиск в googling 'matplotlib histogram'? – cel
Да, примеры показывают только, если у вас есть один список. Необходимо собрать около 3000 списков до одного путем накопления значений для каждого индекса в списках @cel –