У вас есть установка Cloudera на AWS. Попытка настроить его так, чтобы он имел несколько именованных очередей, и я могу подключиться к очередям с помощью JDBC и выполнить запрос.Подключение к именованной очереди в Hadoop с помощью JDBC
Из того, что я был в состоянии собрать до сих пор, когда очереди там, подключаясь к ним с JDBC довольно просто, потому что он просто имеет формат:
http://<server name>:<port>/<queue name>
Однако, не ясно, беготни глядя на множество различных документов, как установить очереди в первую очередь. Кажется, что если у вас есть файл hadoop-site.xml, вы заходите туда и добавляете свойство mapred.queue.name и строку, разделенную запятой. Но у Клаудера нет этого файла. Он имеет mapred-site.xml, но добавляет это свойство, а затем переходит в командную строку и запрашивает список очередей, которые все еще просто возвращаются по умолчанию.
Затем мы попытались использовать FairScheduler, но это новая на основе пряжи, которая имеет понятие балансировки между именованными очередями.
Так что я ищу это:
- способ просто создать 2 очереди, например, Инжиниринг и маркетинг
- показывают, что когда-то я их, я могу подключиться с помощью JDBC либо один
- и выполнить запрос
После, я могу беспокоиться об использовании списков ACL, чтобы очереди имеют неодинаковый доступ к различные части данных и, возможно, управлять доступом к ресурсам. Пока что просто хочу показать, что я могу получить данные, выставленные через именованные очереди.