Я использую модель LinearRegression в Spark ML для прогнозирования цены. Это регрессия с одной вариацией (x=time, y=price)
.Spark ML Линейная регрессия - какие гипер-параметры для настройки
Предположим, что мои данные чисты, каковы обычные шаги для улучшения этой модели?
До сих пор я пытался настраивать regularization parameter
с помощью cross-validation, и получил rmse=15
stdev=30
дал.
Есть ли какие-либо другие важные гиперпараметры, о которых я должен заботиться? Похоже, Спарк ML не очень хорошо документированы для настройки гипер-параметров ...
Update
я смог заиграть параметры с помощью ParamGrid
и Cross-Validation
. Однако есть ли способ увидеть, как выглядит соответствующая линия после правильной подготовки модели линейной регрессии? Как я могу узнать, есть ли линия quadric
или cubic
и т. Д.? Было бы замечательно, если бы был способ визуализировать установленную линию со всеми точками данных обучения.
Пожалуйста, добавьте некоторые детали/объяснение вашего ответа, не сваливать только код. – Vasan