Я новый bie для Sqoop. По моему пониманию, команды Sqoop предназначены для импорта данных из базы данных, таких как MySql в HDF, а наоборот, а команды HDFS предназначены для обработки данных в HDFS, таких как получение данных из HDFS в локальную файловую систему и наоборот. Не будем использовать команды sqoop для обработки данных в HDFS - чтобы получить данные из локальной файловой системы в hdfs и наоборот. Пожалуйста, дайте мне знать точные различия между командами Sqoop и HDFS. Почему у нас есть две разные вещи. Почему они не поместили все эти команды в один набор. Извиняюсь, если мой вопрос не имеет смысла.sqoop vs hdfs команды
ответ
Команды Sqoop служат для следующих целей: 1) Импорт/экспорт данных из любой базы данных в hdfs/hive/hbase и наоборот. Он не ограничивает импорт и экспорт hdfs. 2) данные могут быть заброшены за один раз, если нам нужно переместить всю базу данных/список таблиц. 3) только инкрементные данные могут быть импортированы с помощью команд sqoop. 4) Он также требовал подключения драйвера для подключения к базам данных. Вкратце это касается таблиц/баз данных.
hdfs команды: 1) Он используется только для передачи любого типа (csv, text, xls) файла из локального в hdf или наоборот. Он просто служит базовой функциональности перемещения или копирования данных из одной системы в другую, как и команды unix.
Sqoop только функции для импорта и экспорта данных из СУБД (структурированных) в Hadoop. Он не предоставляет каких-либо других функций HDFS. После того, как если вы получите данные с помощью Sqoop в HDFS, HDFS команды будут использоваться для обработки данных (копирование, перемещение, и т.д.)
Для более Sqoop функциональных http://hortonworks.com/apache/sqoop/
Да ваше понимание правильно.
командыSqoop предназначены для:
импорта данных из любой реляционной базы данных (например, MySQL), чтобы HDFS/улей/Hbase
экспорта данных из HDFS/улей/Hbase к любой реляционной базе данных (например, MySQL)
HDFS команды для:
Копирование/передача любых файлов (например: .txt, .csv, .xls, .. и т.д.) от местного до HDFS или наоборот.
для:
Почему у нас есть две разные вещи. Почему они не поместили все эти команды в один набор.
Ответ:
Sqoop команда (для копирования структурированных данных B/W два различных систем)
HDFS команд (для копирования файлов б/ш местной и HDFS)
с помощью sqoop мы не может копировать файлы из локального в HDFS и наоборот
, а также
, используя команды hdfs, мы не можем копировать данные из hdfs в любые другие внешние базы данных (например, mysql) и наоборот.
- 1. Команды Sqoop vs Sqoop2
- 2. перезаписать hdfs каталог Sqoop import
- 3. экспорта Sqoop из HDFS в Teradata
- 4. Ошибки при экспорте sqoop команды
- 5. sqoop экспорт из HDFS в оракул Ошибка
- 6. Команды Sqoop не выполняются
- 7. Oozie действия оболочки - бег команды sqoop - необходимость регистрации деталь sqoop
- 8. Sqoop, экспорт HDFS в MySQL в Java
- 9. Ошибка: sqoop для добавления записей в hdfs
- 10. Ошибка Sqoop при импорте в hdfs
- 11. Перемещение данных Sqoop из HDFS в Hive
- 12. Sqoop MySQL импорт в HDFS провален
- 13. Загрузка данных на HDFS с использованием Sqoop
- 14. команды pyspark и HDFS
- 15. Выход команды HDFS fsck
- 16. Каковы следующие команды в sqoop?
- 17. команды Sqoop для импорта таблицы
- 18. Hdfs put VS webhdfs
- 19. Потребление HDFS: «hdfs dfs -du /» vs «hdfs dfsadmin -report»
- 20. Oracle Hadoop Connectors vs Sqoop
- 21. Sqoop vs Informatica Большая редакция данных для источника данных
- 22. Результат команды hdfs dfs -ls
- 23. результат обработки результата команды hdfs
- 24. ошибка в формате команды hdfs
- 25. Hadoop standalone - команды hdfs медленны
- 26. Команды экспорта sqoop для данных, которые имеют пробелы раньше в hdfs
- 27. FTP vs SFTP vs HDFS vs NTFS vs EXT2, EXT3
- 28. Apache Spark-SQL vs Sqoop-бенчмаркинг при передаче данных из RDBMS в hdfs
- 29. Spark coalesce vs HDFS getmerge
- 30. Sqoop Окончание линии окончания поля команды не работает из hue