Я использую Spark 2.0.2. Я также использую библиотеку «мл» для машинного обучения с наборами данных. То, что я хочу сделать, это запустить алгоритмы с перекрестной проверкой и извлечь указанные показатели (точность, точность, отзыв, ROC, матрица замешательства). Мои метки данных двоичные.Как получить точность точности, вспомнить и ROC от перекрестной проверки в Spark ml lib?
Используя MulticlassClassificationEvaluator, я могу получить точность алгоритма, обратившись к «avgMetrics». Кроме того, используя BinaryClassificationEvaluator, я могу получить область под ROC. Но я не могу использовать их обоих. Итак, есть ли способ, чтобы я мог извлечь все нужные показатели?
спасибо, но это РДД-Based и он использует «mllib "библиотека. Я работаю с dataframes и наборами данных и "ml" lib. – user3309479
О, извините за это. Проверьте это [link] (https://www.mapr.com/blog/predicting-breast-cancer-using-apache-spark-machine-learning-logistic-regression), может быть, вы что-то получите. Я не очень хорошо знаком с мл. – Darshan