У меня есть файл.txt, который имеет 3 блока (блок a, блок b, блок c). Как hasoop записывает эти блоки в кластер. Мой вопрос: Does hadoop следовать параллельной записи? Или блок b должен ждать, пока блок a не будет записан в кластер? Или блок А и блок б и блок с являются паралельно writtten и Hadoop кластера ...Распределенная файловая система Hadoop
ответ
При копировании файла из локальной файловой системы HDFS или при создании нового файла в HDFS: блоки копируются последовательно - во-первых, первый блок копируется в datanode, затем второй блок копируется в datanode и так далее.
То, что делается параллельно, однако, заключается в размещении реплик: в то время как дататод принимает данные блока от клиента, datanode сохраняет данные в файле, который представляет блок, и одновременно пересылает данные к другому datanode, который должен создать другую реплику блока.
При копировании файла из одного места в другое место внутри кластера HDFS или между двумя кластерами HDFS: вы делаете это параллельно с использованием DistCp.
. Итак, вы говорите, что из локальной файловой системы в HDFS записывает репликацию одного блока (блок a) на другие узлы данных выполняются параллельно и записывают блок a в узел данных, а блок ba datanode выполняется последовательно? –
Да, это правильно. –
При попытке скопировать файл или создать новый файл из локальной системы любых HDFS: блоки СКОПИРОВАНЫ как последовательность DATA-NODES, это очень же, как в массиве. ЭТО КОНСУКЦИОННО-ПОСЛЕДОВАТЕЛЬНОЕ РАСПОЛОЖЕНИЕ ДАННЫХ-БЛОКОВ.
Когда это рукопожатие происходит, в тот момент, DataNode получает первый запрос, это получает реплицируется в файл, создавая SAVEPOINT, а затем тот же процесс происходит последовательно для других блоков, что делает излишним и сохраненное состояние используется для сравнения.
Принимая во внимание, что при копировании файла из одного сегмента в один и тот же блок или между двумя различными блоками вы используете AHDC (Apache Hadoop DistCp).
Hadoop предназначен для сохранения состояния данных до завершения транзакции.
Итак, в этом случае блоку b нужно подождать, пока блок a не будет записан в HDFS? Я прав? –
Да, это механизм последовательной копии, вам придется – D3X
- 1. Распределенная файловая система для .NET.
- 2. Распределенная файловая система для linux
- 3. Распределенная файловая система в Ubuntu
- 4. Файловая система в hadoop
- 5. BigData - Hadoop (Файловая система)
- 6. Как mock файловая система hadoop
- 7. PHP-распределенная файловая система, файловая система для загрузки из сетевого хранилища
- 8. Распределенная файловая система для высокоскоростного доступа к небольшим файлам
- 9. Лучшая распределенная файловая система для товарной фермы хранения linux
- 10. Какая лучшая распределенная файловая система для Apache Mesos у HDFS?
- 11. Распределенная файловая система для кэша приложений и журналов
- 12. Любая распределенная файловая система, поддерживающая постоянное клонирование времени
- 13. Хорошо распределенная файловая система общего назначения в моем случае?
- 14. В чем разница между грид-вычислениями и HDFS (распределенная файловая система Hadoop)?
- 15. Как мы можем разработать прокси для HDFS (распределенная файловая система Hadoop)
- 16. Есть ли распределенная файловая система, которая работает на Windows, кроме Hadoop?
- 17. Поддерживает ли распределенная файловая система Hadoop любую операцию обновления в качестве файловой системы Google?
- 18. faking файловая система/виртуальная файловая система
- 19. Логическая файловая система vs Физическая файловая система
- 20. Распределенная система: выборы руководителя
- 21. Является ли файловая система Hadoop используемой всеми NoSQL Framework?
- 22. Файловая система Hadoop считывает файловую систему Linux вместо hdfs?
- 23. Трассировка Журналированная файловая система
- 24. Boost файловая система итератор
- 25. Встраиваемая файловая система?
- 26. Простая виртуальная файловая система
- 27. Файловая система с тегами
- 28. Файловая система Toy OS
- 29. файловая система с C++
- 30. Django файловая система
Не могли бы вы рассказать о том, что вы подразумеваете под «блоками»? –
file.txt разделен на блоки. Здесь file.txt разделен на три блока. скажем, например, размер файла.txt составляет 192 МБ, тогда файл .txt будет разделен на 3 блока eac 64 МБ. –