2015-02-16 3 views
1

мне нужно добавить модули хранения для Apache Drill (в основном PSVs), но я не могу найти файл конфигурации, где я мог бы добавить следующие строки: -Apache конфигурации Drill

"formats": { 
    "psv": { 
    "type": "text", 
    "extensions": [ 
     "tbl" 
    ], 
    "delimiter": "|" 
    } 
} 

Обратите внимание, что текущие решения, чтобы открыть локальный URL-адрес хоста в веб-браузере невозможен. Я не хочу показывать порт и IP-адрес в Интернете. В настоящее время я двойной хмелевой SSH, чтобы достигнуть моего сервера, который хостинг дрель

ответ

1

Вы можете оставить Сверлить отдохнем API:

curl -X POST -H “Content-Type: application/json” -d ‘{ “name”:dfs, “config” {“type”: “file”, "connection": "hdfs:///", “enabled”: true, "workspaces": {"root": {"location": "/", "writable": false, "defaultInputFormat": null}}, "formats": { "psv": { "type": "text", "extensions": [ "tbl" ], "delimiter": "|" }}}’ http://localhost:8047/storage/dfs.json 

Вы также можете создать bootstrap-storage-plugins.json файл и включить его на пути к классам при запуске Drill и должен загружаться при загрузке дрели.

+0

Спасибо за помощь. Однако я решил не использовать сверло Apache. Я принимал это за замену Улья. –

+0

Apache Drill, безусловно, можно считать заменой для Hive. Что Дрилл не делает, что Улей? Просто любопытно. –

+0

Я довольно новичок в стеке Big Data, но я понял, что Drill является заменой Infobright. В Hive вы можете загрузить csv во время выполнения, выполнить карту, чтобы уменьшить SQL-запросы. В целом SQL-запросы занимают больше времени, так как Hive не индексирует, обрабатывая таблицу, в которую мы импортировали csv. В упражнении я понял, что вы создаете хранилище данных, указав конфигурацию csv. Затем Drill создаст свой хранилище данных, скопирует данные в свои таблицы, обработает. Я считаю, что дрель будет потреблять больше дискового пространства, но будет выполнять запросы очень быстро. [1/2] –

0

Также вы можете использовать интерфейс сверла. После запуска Drill пользовательский интерфейс Drill доступен на порту 8047 (по умолчанию). После того, как в пользовательском интерфейсе нажмите «Хранение», вы увидите все плагины с включенным и отключенным хранилищами, и вы можете добавить/создать дополнительные плагины для хранения.

Смежные вопросы