Мне нужно переместить большой объем данных из базы данных Oracle в Hadoop без подключения двух систем. Возможно ли экспортировать данные из Oracle через Sqoop непосредственно в локальную файловую систему без импорта в HDFS. Я хотел бы экспортировать в ORC, а затем просто переместить файлы через внешние диски в кластер Hadoop.Экспорт из RDBMS в Hadoop Совместимый формат
0
A
ответ
1
Вы не можете использовать SQOOP в своем случае. SQOOP работает в hadoop и использует JDBC для соединения с БД. Если узлы hadoop не могут подключиться к серверу БД, вы не сможете его использовать.
ORC - очень специфический формат, используемый Hive, вам нужно будет найти, как использовать библиотеки hive для создания файлов ORC за пределами кластеров хаоса, если это возможно.
По вашим ограничениям я предлагаю экспортировать БД с использованием возможностей дампа DB в CSV-файл, сжать файл и затем скопировать его в HDFS.
Если вы планируете использовать Hive, вы можете LOAD текстовый файл в таблицу, предназначенную для хранения данных с помощью ORC.
Смежные вопросы
- 1. Hadoop и RDBMS
- 2. Сравнение Hadoop с RDBMS
- 3. Совместимый формат специальной валюты
- 4. RDBMS таблицы выдержки Hadoop или искра.?
- 5. Проблема: Экспорт таблицы из Hadoop в MySQL
- 6. Экспорт данных из Hbase в hadoop
- 7. Экспорт Flash в HTML5, совместимый с Android2.3
- 8. Формат CSV Экспорт из radGrid
- 9. Экспорт из gridview в формат csv
- 10. Формат namenode Hadoop не работает на mac
- 11. Невозможно преобразовать time.struct_time в JSON-совместимый формат
- 12. Hadoop Формат ввода
- 13. SAS Экспорт формат даты
- 14. RDBMS VS MAP СНИЖЕНИЯ
- 15. Являются ли RDBMS плохой, как описано в Hadoop: окончательное руководство?
- 16. C# Экспорт в формат Excel
- 17. Формат ввода hadoop для потоковой передачи hadoop. Формат ввода Wikihadoop
- 18. настраиваемый формат ввода hadoop
- 19. Экспорт Excel в формат макета
- 20. Экспорт данных в формат .BRW
- 21. Экспорт в xls формат файла
- 22. вебкамера Невозможно найти совместимый формат палитры
- 23. rdbms & большие данные в datamart?
- 24. Предприятие Хранилище данных с NOSQL/Hadoop - «NO RDBMS»
- 25. Hadoop MapReduce: Пользовательский Формат ввода
- 26. Экспорт в формат CSV неправильный в scrapy
- 27. Экспорт в формат PEM с использованием CryptoAPI
- 28. Экспорт OS X-приложения, совместимый со старыми версиями
- 29. Hadoop mapreduce Пустой формат ввода
- 30. Hadoop формат NameNode не работает
Я согласен с предложением избегать ORC-CSV, TSV или другого общего нейтрального формата, который ваша база данных Oracle может создавать для промежуточных файлов, упростит возможную загрузку в Hadoop, после чего вы сможете использовать любой подходящий формат Hadoop. –
Единственная проблема с форматами CSV - это могут быть линейные каналы в данных, и мы пытаемся сохранить данные точно так, как они есть. Я могу застрять в использовании xml, но я действительно не хочу из-за его размера. – Shawn
Вы можете использовать различные строки в CSV, например, «|», «@@», «^ A» или что-то другое и то же самое для разделителя столбцов. Проблема состоит в том, что не все компоненты в инструментах DBO и DB dunps позволяют вам указывать эти параметры, и вам потребуется реализовать свой собственный сценарий/читатель. В улье вы можете указать оба параметра при создании таблицы. – RojoSam