Я использовал Sqoop для сбора данных от Oracle до Hadoop, и это сработало хорошо. Прошло всего 4 минуты, чтобы собрать 86 миллионов записей из Oracle в таблицу Hive без использования разделов на Sqoop. Может кто-нибудь дать некоторые подробности о разъемах Oracle Hadoop, будет ли он работать лучше, чем Sqoop?Oracle Hadoop Connectors vs Sqoop
ответ
Большинство соединителей будут иметь производительность, близкую к той же, что и у вас есть набор заданий MapReduce в самом конце рабочего процесса, и это будет играть основную роль в вашей общей производительности.
Oracle предоставляет набор различных разъемов для доступа к улей, и вы могли бы проверить хороший обзор о стандартных решениях, но я сомневаюсь, что на самом конце вы будете ожидать значительные различия в производительности другие, то вы видите Sqoop:
https://docs.oracle.com/cd/E37231_01/doc.20/e36961/start.htm#BDCUG119
Sqoop - это общий инструмент для работы с реляционными базами данных из области Hadoop, и это не ограничивается только Oracle. Кроме того, он имеет интеграцию с другими решениями Hadoop, такими как Oozie, для создания сложных рабочих процессов, что делает его хорошим кандидатом на другие типы разъемов.
Лично я предпочитаю Sqoop для операций импорта-экспорта с поддержкой Hadoop и подхода к подключению для запроса данных в Hadoop.
Sqoop будет использовать стандартное соединение JDBC. Коннектор Oracles будет работать с классом fastloader/fastexport, интегрированным в соединение sqoop. Это должно быть быстрее, чем Sqoop.
- 1. Netsuite Salesforce Integration ESB vs Prebuilt Connectors
- 2. Прямой импорт из Oracle в Hadoop с использованием Sqoop
- 3. Ошибка подключения Oracle с Hadoop с использованием Sqoop
- 4. Использование Sqoop для загрузки данных Oracle в Hadoop
- 5. Sqoop Oracle Export Очень медленно
- 6. Sqoop импорт для Hadoop 2.5.0
- 7. sqoop hadoop-mapreduce не существует
- 8. Установка Sqoop с hadoop 2.2.0?
- 9. Команды Sqoop vs Sqoop2
- 10. sqoop vs hdfs команды
- 11. Импорт данных Oracle в Hadoop
- 12. Oracle Sqoop Извлекает 0 Запись
- 13. Извлечение записи с помощью SQOOP в Hadoop
- 14. Hadoop API VS. Hadoop Streaming
- 15. Sqoop: импорт данных из Oracle
- 16. Очистка каталога/tmp/sqoop-hadoop/compile/
- 17. Hadoop Sqoop export to Teradata Error
- 18. Какая версия Sqoop работает с Hadoop 0.20.2?
- 19. Stratio Sqoop жалуется на отсутствие Hadoop библиотеки
- 20. Aster Database для Hadoop с помощью Sqoop
- 21. hadoop sqoop загрузить csv файл в mysql
- 22. Какая версия Sqoop работает с Hadoop 1.0.4?
- 23. Sqoop Oracle Import не создает таблицу
- 24. JSPlumb Line Connectors
- 25. Импорт данных из Oracle в Hive с использованием SQOOP
- 26. Hadoop vs Hazelcast
- 27. Spark vs Hadoop
- 28. Hadoop Vs Data Lake
- 29. sqoop import multiple tables
- 30. Sqoop import failiing
Согласно документации Oracle: Oracle Loader for Hadoop - это программа MapReduce, которая работает в кластере Hadoop для предварительной обработки данных. Он может разбивать, сортировать и преобразовывать данные в типы данных Oracle при подготовке к загрузке. Это разгружает некоторые циклы базы данных на Hadoop, так что при загрузке используется меньший процессор ЦП. В онлайн-режиме предварительно обработанные данные непосредственно загружаются в базу данных. В автономном режиме Oracle Loader for Hadoop записывает предварительно обработанные данные в виде файлов данных накачки на HDFS. В онлайн-режиме есть два варианта загрузки, JDBC и прямой путь. –