2015-01-22 3 views
2

Я проектирую архитектуру аналитической системы. У меня есть модель ансамбля классификации, разработанная в scikit learn. Я хочу переместить это в производственную среду, чтобы новые входящие данные можно было классифицировать «на лету» с использованием этой модели. В идеале система должна поддерживать загрузку вручную «модели» в производственную систему. У меня нет опыта работы с системами производства аналитики. Любые предложения были бы очень полезнымиПеремещение классификации в производственную среду

Я проверил Py2PMML Но он не поддерживает все модели. В первую очередь я ищу усиленные регрессии деревьев. PS: Я не прошу ввести код или образцы. Только в правильном направлении.

+0

Зачем голосовать? его законный вопрос с правильными тегами. –

+0

Я не тот, кто ниспроверг, но я думаю, это потому, что это слишком широкий вопрос. –

+0

Я понимаю. Но я не могу помочь. Я сделал моделирование данных более 5 лет, просто не знаю, как переместить его в производство. –

ответ

2

В настоящий момент нет official way для экспорта моделей scikit в PMML. Рекомендуемый способ - использовать рассол или joblib.dump. См. Раздел model persistence в документах. Идея заключается в том, чтобы сохранить модель на диске с:

>>> from sklearn.externals import joblib 
>>> joblib.dump(model, 'saved_model.pkl') 

Затем загрузите его на сервер в производстве и загрузить его с:

>>> model = joblib.load('saved_model.pkl') 

Важно, что вы пытаетесь иметь аналогичные среды, модели сохраненный в одной версии scikit-learn, может не загружаться в другой версии.

+0

Спасибо. Позвольте мне проверить это. –

+0

Спасибо за помощь. С этим я могу работать. Помощь приветствуется @ !! –

Смежные вопросы