как бы я построить Рекомендация Двигатель с амазонки Redshift как данные source.is там любую модель Погонщик данных для амазонок или красного смещения S3погонщик DataModel для амазонки Рекомендации Двигатель красного смещения
ответ
Mahout использует Hadoop для чтения данных, за исключением нескольких поддерживаемые NoSQL dbs и JDBC dbs. Hadoop, в свою очередь, может использовать S3. Вам нужно будет настроить Hadoop для использования файловой системы S3, а затем Mahout должен отлично читать и писать на S3.
Redshift - это решение для хранения данных на основе Postgres и поддержка JDBC/ODBC. Mahout 0.9 поддерживает модели данных, хранящиеся в хранилищах, совместимых с JDBC, поэтому, хотя я этого не сделал, он должен поддерживаться
Рекомендаторы Mahout v1 работают на Spark, а ввод и вывод - текст по умолчанию. Все операции ввода-вывода проходят через Hadoop. Таким образом, данные S3 отлично подходят для ввода, но созданные модели также являются текстовыми и должны быть проиндексированы и запрошены с помощью поисковой системы, такой как Solr или Elasticsearch. Вы можете легко написать читателю, чтобы получить данные из любого другого магазина (Redshift), но вы, возможно, не захотите сохранять модели в хранилище данных, так как они должны быть проиндексированы solr и должны иметь супер быстрый поиск в поисковой системе.
- 1. Column/Sum (колонка) в амазонки красного смещения
- 2. IsNumeric в SQL Server() эквивалент в амазонки красного смещения
- 3. Пункт Рекомендации погонщик Java ошибка
- 4. FileNotFountException для intro.csv в погонщик userbased Collaborative рекомендации фильтрации
- 5. анзибль модуля для настройки пользователей красного смещения
- 6. Количество красного смещения с переменной
- 7. Контекстная ссылка рекомендации двигатель
- 8. Получение рекомендации по книге «Амазонки»
- 9. обработка числовых значений нуля с помощью команды копирования в амазонки красного смещения
- 10. Точность и отзыв оценка для рекомендации Двигатель
- 11. Копирование таблицы из одного кластера красного смещения в другой кластер красного смещения (без использования s3)
- 12. Вакцинация Клавиши сортировки с чередованием красного смещения
- 13. Хочет подключиться к R красного смещения
- 14. подстрока матч в базе данных красного смещения
- 15. Эффективность красного смещения: кодировка в столбце объединения
- 16. Месячный сохранение в Амазонии красного смещения
- 17. Запрос красного смещения для подсчета показателей на 10-минутные окна
- 18. Искра для красного смещения. Свести массив в строку
- 19. Косинус сходства - Недостатки в качестве рекомендации Двигатель?
- 20. подключить Google электронной таблицу амазонки красного смещение с помощью JDBC MySQL против PostgreSQL
- 21. Как достичь версии на уровне строк в режиме красного смещения?
- 22. Как запросить общедоступный набор данных S3 с использованием красного смещения
- 23. программирование в погонщик
- 24. Любой способ редактировать таблицы красного смещения в Excel?
- 25. не удается подключиться к базе данных красного смещения
- 26. Рассчитать изменение значений в базе данных красного смещения amazon
- 27. datamodel для склада
- 28. Добавление автоматической инкрементной колонки в существующую таблицу красного смещения
- 29. копия с s3 до красного смещения с нестандартным разделителем
- 30. Производительность красного смещения на столбцах с различными типами сжатия (кодирования)
Спасибо, pferrel. Мои данные находятся в sql-сервере, мы создаем хранилище данных на redshift.we не используют Hadoop, EMR-кластеры. мы хотим использовать mahout для рекомендаций в реальном времени (или в режиме реального времени). Пожалуйста, дайте мне несколько идей, мой технический набор (Redshift, sql server, S3, Mahout, R). –
Рекомендации NRT, используйте Mahout v1 (использует Spark) + Solr или Elasticsearch. Во время выполнения запрос представляет собой историю предпочтений текущего пользователя для Solr, что очень быстро, это возвращает упорядоченный список рекомендуемых элементов. Модель, которую вы индексируете в Solr, создается Mahout v1 «spark-itemsimilarity» Ссылки здесь: http://mahout.apache.org/users/recommender/intro-cooccurrence-spark.html Презентации и записи в блогах здесь: https://occamsmachete.com/ml Краткая книга на эту тему: https://www.mapr.com/practical-machine-learning – pferrel