Я знаю, что можно использовать язык python над Hadoop.Возможно ли запустить алгоритмы Python scikit-learn над Hadoop?
Но можно ли использовать алгоритмы машинного обучения scikit-learn на Hadoop?
Если ответ отрицательный, есть ли какая-то компьютерная библиотека обучения для python и Hadoop?
Спасибо за вашу помощь.
ОК, поэтому, если я понимаю, мы обязаны написать собственный код карты/подтверждения. Существует некоторая библиотека High Level для прямого вызова алгоритмов машинного обучения для hadoop в python, правильно? –
Нет, вы не можете написать какой-то общий код в python, а затем волшебным образом преобразовать его в масштабируемое задание MapReduce. Конечно, такой технологии нет. –
@shanks_roux только что нашел его сегодня и подумал, что вам может быть интересно. ** [MLlib] (https://spark.incubator.apache.org/mllib/) ** является частью проекта Apache Spark, он позволяет вам разрабатывать ** алгоритмы машинного обучения ** в ** Python ** (lib взаимодействует с NumPy) и запускает их на ** Hadoop ** (или без него). Попробуйте. –