Это может быть очень простой. Где единый узел HDFS хранит файлы в отношении фактической файловой системы?Где HDFS хранит его файлы
Я использую виртуальную машину Cloudera для изучения Hadoop.
Для например: Файл с именем sample.txt в/дома/Cloudera могут быть скопированы в HDFS с помощью
hadoop fs -copyFromLocal /home/cloudera/sample.txt hdfs://localhost/user/cloudera/sample.txt
Если я использую Linux для поиска/пользователя/каталог Cloudera в действительности нет такого каталога.
Теперь предположим, что я изменяю содержимое /home/cloudera/sample.txt, чем эти изменения не отражаются в файле, который хранится в HDFS.
У меня есть два вопроса:
- Где один узел HDFS хранить файлы по фактической файловой системе ?
- Почему изменения, внесенные в исходный файл, не являются , отраженным в файле на HDFS.
Значит, у нас есть две копии одного и того же файла? – Geek
Вы должны перестать думать в терминах файлов и начать думать в терминах блоков, фрагментов файлов, которые распределяются между вашими узлами данных. Имеете ли вы две копии одного и того же блока или нет, зависит от коэффициента репликации вашей установки (по умолчанию 3). – kliron
Ничего себе, звучит kool. Предположим, у меня есть кластер из двух узлов, и я копирую на нем свой файл. Как я могу узнать, какие новые блоки были созданы из-за этой копии? – Geek