Пример агрегирования:
Я хотел сделать что-то вроде следующего, если у панд была такая эстетика цвета, как ggplot:
aggregated = df.groupby(['model', 'training_examples']).aggregate(np.mean)
aggregated.plot(x='training_examples', y='accuracy', label='model')
(столбцы: модель является строкой, training_examples представляет собой целое число, точность десятичный)
Но это только создает беспорядок.
Благодаря ответ JORIS, я закончил с:
for index, group in df.groupby(['model']):
group_agg = group.groupby(['training_examples']).aggregate(np.mean)
group_agg.plot(y='accuracy', label=index)
Я обнаружил, что title=
просто замена одного названия участка на каждой итерации цикла, но label=
делает то, что вы ожидали бы - после пробег plt.legend()
, конечно.
Графики будут отображаться на независимых фигурах даже без 'plt.figure()' first. – gented
еще один хороший учебник по использованию 'groupby' находится здесь: https://chrisalbon.com/python/pandas_apply_operations_to_groups.html – glS