2015-03-09 5 views
0

Я построил контролируемую модель обучения в R и экспортировал правила модели/решения в формате PMML. Я надеялся, что могу напрямую связать PMML с MongoDB, используя что-то вроде библиотеки JPMML (поскольку JPMML хорошо интегрируется с PostgreSQL).Интегрируйте PMML в MongoDB

Однако, кажется, единственный способ связать MongoDB с моим XML-файлом PMML - использовать Cascading Pattern через Hadoop. Поскольку мой набор данных невелик (< 50GB), мне не нужен Hadoop.

Кто-нибудь использовал PMML с MongoDB, прежде чем это не связано с необходимостью идти по маршруту хаоса? Большое спасибо

ответ

0

В принципе, у вас есть два варианта здесь:

  1. Преобразование файла PMML к чему-то, что вы можете выполнить в MongoDB.
  2. Разверните файл PMML «изначально» для некоторых внешних служб и подключите MongoDB к нему.

50 ГБ по-прежнему довольно много данных, поэтому вариант №1 явно предпочтительнее с точки зрения простоты установки и скорости выполнения. Возможно ли написать пользовательскую функцию Java (UDF) для MongoDB? Если это так, тогда можно будет запустить библиотеку JPMML внутри MongoDB. В противном случае вы можете увидеть, можно ли преобразовать модель PMML в SQL-скрипт. Например, последние версии KNIME software (2.11.1 и новее) содержат узел преобразования «PMML to SQL».

Если вы вернетесь к опции № 2, то следующая техническая статья может дать вам некоторое вдохновение: Applying predictive models to database data: the REST web service approach.

+0

спасибо за это. У MongoDB есть драйвер Java, поэтому я предполагаю, что библиотека JPMML должна работать прямо в этом? – qwerty

+0

Драйвер Java позволяет внешним приложениям получать доступ к данным, хранящимся в MongoDB. Вам нужно что-то, что позволяет выполнять Java внутри MongoDB. Или, говоря иначе, вам нужно написать «хранимую процедуру» MongoDB на языке Java. – user1808924

Смежные вопросы