мне нужно добавить модули хранения для Apache Drill (в основном PSVs), но я не могу найти файл конфигурации, где я мог бы добавить следующие строки: -Apache конфигурации Drill
"formats": {
"psv": {
"type": "text",
"extensions": [
"tbl"
],
"delimiter": "|"
}
}
Обратите внимание, что текущие решения, чтобы открыть локальный URL-адрес хоста в веб-браузере невозможен. Я не хочу показывать порт и IP-адрес в Интернете. В настоящее время я двойной хмелевой SSH, чтобы достигнуть моего сервера, который хостинг дрель
Спасибо за помощь. Однако я решил не использовать сверло Apache. Я принимал это за замену Улья. –
Apache Drill, безусловно, можно считать заменой для Hive. Что Дрилл не делает, что Улей? Просто любопытно. –
Я довольно новичок в стеке Big Data, но я понял, что Drill является заменой Infobright. В Hive вы можете загрузить csv во время выполнения, выполнить карту, чтобы уменьшить SQL-запросы. В целом SQL-запросы занимают больше времени, так как Hive не индексирует, обрабатывая таблицу, в которую мы импортировали csv. В упражнении я понял, что вы создаете хранилище данных, указав конфигурацию csv. Затем Drill создаст свой хранилище данных, скопирует данные в свои таблицы, обработает. Я считаю, что дрель будет потреблять больше дискового пространства, но будет выполнять запросы очень быстро. [1/2] –