2015-03-10 3 views
0

У меня есть задание, для которого я планирую использовать машинное обучение (в частности, обучение, например, дерево принятия решений). Окончательный код будет запущен на компьютере преподавателя, который не имеет обучения scikit или других внешних библиотек.Код дерева дерева решений/алгоритм

Как таковой, мне нужно либо написать что-то вроде классификатора дерева решений с нуля, либо использовать внешнюю библиотеку локально, и сохранить окончательный алгоритм.

Подводя итог: если задан набор помеченных данных обучения, как сохранить окончательный алгоритм в коде python, не полагаясь на внешние библиотеки для запуска окончательного алгоритма в будущем?

Например, дерево решений можно разбить на ряд операторов if/then, я хочу сгенерировать эти операторы if/then и сохранить их таким образом, чтобы их можно было запускать на компьютере, где ничего не было установлено, кроме python.

Какова наилучшая рекомендация по достижению этого. Если это неправильный форум, пожалуйста, сообщите.

+0

Я думаю, что это правильный форум, так как ваша проблема связана главным образом с внедрением алгоритма машинного обучения на языке (Python). –

+0

Я не уверен, в чем вопрос. Является ли это «как я инкапсулирую свои зависимости, чтобы код мог быть запущен на другом компьютере, не устанавливая ничего (кроме python)?»? –

+0

Да, в принципе, я хочу серию операторов if/then для алгоритма дерева решений (в качестве примера). – jfalkson

ответ

0

Вы можете использовать случайный пакет лесной Python sklearn.ensemble следующим образом:

# Import the random forest package 
from sklearn.ensemble import RandomForestClassifier 

# create a random forest object with 100 trees 
forest = RandomForestClassifier(n_estimators = 100) 

predictors = [[0, 0], [1, 1]] 
response = [0, 1] 

# fit the model to the training data 
forest = forest.fit(predictors, response) 

# you can reuse the forest model you built to make predictions 
# on other data sets 
test_data = [[0, 1], [1, 0]] 
output = forest.predict(test_data) 

Обратите внимание, что я импортировал RandomForestClassifier здесь, но вы могли бы также использоваться RandomForestRegressor в случае, если вы хотели запустить случайный лес в режиме регрессии вместо этого.

Смежные вопросы