Я пытаюсь узнать, как Kerberos может быть реализован в Hadoop.
Я прошел через этот документ https://issues.apache.org/jira/browse/HADOOP-4487
Я также прошел через материал Basic Kerberos (https://www.youtube.com/watch?v=KD2Q-2ToloE)Что касается безопасности Hadoop через Kerberos
1) Док Apache использует слово «токен» в то время как общий документ через Интернет использует термин «Билет».
Являются ли токены и билеты одинаковыми?
2) Апач документ также «узлы DataNode не применять никакого контроля доступа на доступах к его блокам данных.
Это делает возможным несанкционированный клиент для чтения блока данных в пор, как она может поставить его Идентификатор блока. Также возможно, чтобы кто-либо написал произвольные блоки данных в DataNodes. "
Мои мысли по этому поводу: -
Я могу принести Id блок из пути к файлу с помощью команды: -
[email protected]:/opt/hadoop/hadoop-1.0.2/bin$ ./hadoop fsck /hadoop/mapred/system/jobtracker.info -files -blocks
FSCK начатое Hadoop от /127.0.0.1 для пути/Hadoop/mapred /system/jobtracker.info в Пн Июл 09 06:57:14 EDT 2012 /hadoop/mapred/system/jobtracker.info 4 байта, 1 блок (ы): OK 0. blk_-9148080207111019586_1001 len = 4 repl = 1
Поскольку у меня было разрешено обращаться к файлу jobtracker .info, я смог найти свой blockID, используя указанную выше команду.
Я думаю, что если я добавлю какое-то смещение к этому идентификатору блока и напишу в этот datanode.
Как я могу явно указать blockID во время записи файла в HDFS. (Что такое команда?)
Любой другой способ записи произвольных блоков данных в DataNodes?
Скажите, пожалуйста, если мой подход неправильный?
Вы нашли какой-либо надлежащий полный способ защиты кластера хаопов? –