0

Я хочу внедрить систему музыкальных рекомендаций, которая может создавать рекомендуемые музыкальные плейлисты в реальном времени. Я считаю, что это может быть реализовано в Prediction.io ...Realtime Prediction.io со штормом Apache

Однако из-за дизайна Prediction.io мне нужно вызвать pio train, pio deploy, чтобы обновить модель обучения новыми действиями, сделанными пользователь (например, музыка и т. д.). Поэтому мне нужно будет запускать эти команды каждые 2 часа (или другой соответствующий временной интервал).

Недавно я столкнулся с Apache Storm, и мне очень нравится концепция обработки «реального времени». Следовательно, я думал, могу ли я включить Prediction.io в Apache Storm, чтобы обучение стало «онлайн», что позволит моему приложению рекомендовать музыку в нескольких понравившихся/действиях пользователя, вместо того, чтобы ждать пользователя пока модель обучения не будет обновлена.

Если это нецелесообразно, то можно включить Mllib Spark в болт Apache Storm (java), так как я могу создавать с ним системы рекомендаций (и также кажется, что Prediction.io сам построен на Apache Spark)?

Заранее благодарен!

ответ

0

Вариант использования кажется жизнеспособным, но я бы не счел «нужно что-то запускать каждые несколько часов» в качестве хорошей мотивации для использования шторма. С другой стороны, если ваши учебные данные «потоковая передача», вы можете смоделировать свою топологию шторма, чтобы обновлять свою внутреннюю базу знаний каждый раз, когда поступают новые данные. Это позволит вам использовать самую обновленную базу знаний каждый раз, когда пользователь запрашивает что-то.

Что касается библиотек, которые могут использоваться со Storm, любая java-библиотека (на самом деле любая библиотека на любом языке, если она может взаимодействовать с java) должна работать.

Смежные вопросы