Каков правильный способ оценки бинарного классификатора с использованием оценочных показателей scikit-learn?category_report vs f1_score в показателях классификации scikit-learn
Учитывая, что y_test и y_pred как золотые и предсказанные ярлыки, не должна ли оценка F1 в выводе классификации_репортажей быть такой же, как и для f1_score?
Вот как я это делаю:
print(classification_reprot(y_test, y_pred)
дает следующую таблицу:
precision recall f1-score support
0 0.49 0.18 0.26 204
1 0.83 0.96 0.89 877
avg/total 0.77 0.81 0.77 1081
Однако
print(f1_score(y_test, y_pred)
дает F1 балл = 0,89
Теперь, с учетом вышеупомянутых выходов, является производительность этой модели F1 оценка = 0,89 или это 0,77?