Я использовал hadoop в течение некоторого времени. Когда я настраивал hadoop, я пришел через свойство, называемое dfs.replication. Но я не могу понять, как это работает. Пожалуйста, помогите мне.Фактор репликации Hadoop
ответ
Одним из преимуществ Hadoop является то, что он позволяет хранить надежно большие файлы в вашем кластере, поэтому даже если один файл поврежден, вы не потеряете данные. Это работает с репликацией: каждый файл разделяется на блоки данных (размер которых настраивается через свойство dfs.blocksize
), которые хранятся в разных узлах вашего кластера, и каждый блок будет реплицироваться X раз, будучи X, номером, который вы написали в dfs.replication
. Поэтому, если один из ваших блоков данных поврежден, где-то в вашем кластере будут другие копии, поэтому вы не потеряете данные.
Если вы установите его на 1, то он не будет отказоустойчивым, так как это означает, что на блок имеется только одна копия. Однако, если вы установите его на 2, но один блок будет потерян, появится другая его копия.
Репликация по умолчанию блока. Фактическое количество повторений может быть указано при создании файла. По умолчанию используется, если репликация не указана во время создания. Значение по умолчанию равно 3, что означает, что вы разместите дамп в местоположении HDFS, там будет 3 повтора, так как структура распадет файл в набор блоков (64 МБ или 128 МБ), а затем эти блоки будет реплицироваться через узлы кластера.
В зависимости от необходимости и использования данных и их размера репликация может быть установлена.
- 1. фактор репликации в Hadoop
- 2. Hadoop фактор репликации старшинство
- 3. Фактор репликации в Hadoop BIG-данные
- 4. Изменение коэффициента репликации в hadoop
- 5. Ошибка репликации данных Hadoop
- 6. репликации данных в Hadoop
- 7. фактор HDFS репликации - сведение к минимуму риска потери данных
- 8. Модель репликации Hadoop - DataStreamer/Namenode
- 9. Hadoop конфигурация узла назначения репликации
- 10. Ошибка при создании Kafka Темы- Фактор репликации больше доступных брокеров
- 11. Спарк Автономного режима: Изменение фактор репликации продукции HDFS
- 12. Как увеличивая Cassandra фактор репликации дает больше последовательностей
- 13. Фактор репликации Hdfs 1 переопределяет поведение по умолчанию
- 14. Чтобы изменить коэффициент репликации каталога в hadoop
- 15. как реплицируется фактор HDFS?
- 16. Коэффициент репликации
- 17. Hadoop: Можно ли избежать репликации для определенных файлов?
- 18. Hadoop Коэффициент репликации 1 на кластере из четырех узлов
- 19. Hadoop - Сохранение коэффициента репликации после сбоя и восстановления
- 20. Как сделать изменение коэффициента репликации hadoop для файла постоянным
- 21. Фактор число
- 22. Ошибка репликации PouchDB при репликации
- 23. Как изменить коэффициент репликации во время выполнения команды copyFromLocal?
- 24. Фактор репликации 3, но доля владения всего 100%, а не 300%
- 25. Рекомендация оптимизации Hadoop
- 26. Фактор базы кода приложения Фактор должен быть разделен
- 27. Фактор сжатия Qt WebKit
- 28. Решето Эратосфена - главный фактор
- 29. CGAL: преобразовать фактор двойной
- 30. Фактор в C-рекурсии