2013-12-11 3 views
5

Из-за многих ошибок я не могу понять, почему это происходит в том, что он не подключает ведомый datanode vm в мой мастер vm. Любое предложение приветствуется, поэтому я могу попробовать. И начать, один из них эта ошибка в моем подчиненном журнале Vm:Hadoop Datanode slave не подключается к моему хозяину

WARN org.apache.hadoop.hdfs.server.datanode.DataNode: Problem connecting to server: ubuntu-378e53c1-3e1f-4f6e-904d-00ef078fe3f8:9000 

Из-за этого я не могу выполнить задание, что я хочу в моей главной ВМ:

hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-2.2.0.jar pi 2 5 

которые дают мне эту ошибку

org.apache.hadoop.ipc.RemoteException(java.io.IOException): File /user/ubuntu/QuasiMonteCarlo_1386793331690_1605707775/in/part0 could only be replicated to 0 nodes instead of minReplication (=1). There are 0 datanode(s) running and no node(s) are excluded in this operation. 

и даже так, то hdfs dfsadmin -report (в мастер ВМ) дает мне все 0

Configured Capacity: 0 (0 B) 
Present Capacity: 0 (0 B) 
DFS Remaining: 0 (0 B) 
DFS Used: 0 (0 B) 
DFS Used%: NaN% 
Under replicated blocks: 0 
Blocks with corrupt replicas: 0 
Missing blocks: 0 
Datanodes available: 0 (0 total, 0 dead) 

Для этого я нахожусь на openstack 3 vms ubuntu, один для хозяина и других рабов. в мастера, это создать в etc/hosts

127.0.0.1 localhost 
50.50.1.9 ubuntu-378e53c1-3e1f-4f6e-904d-00ef078fe3f8 
50.50.1.8 slave1 
50.50.1.4 slave2 

колонкового site.xml

<name>fs.default.name</name> 
<value>hdfs://ubuntu-378e53c1-3e1f-4f6e-904d-00ef078fe3f8:9000</value> 
<name>hadoop.tmp.dir</name> 
<value>/home/ubuntu/hadoop-2.2.0/tmp</value> 

HDFS-site.xml

<name>dfs.replication</name> 
<value>3</value> 
<name>dfs.namenode.name.dir</name> 
<value>file:/home/ubuntu/hadoop-2.2.0/etc/hdfs/namenode</value> 
<name>dfs.datanode.data.dir</name> 
<value>file:/home/ubuntu/hadoop-2.2.0/etc/hdfs/datanode</value> 
<name>dfs.permissions</name> 
<value>false</value> 

mapred-site.xml

<name>mapreduce.framework.name</name> 
<value>yarn</value> 

A В моем подчиненном файле vm содержится каждая строка: slave1 и slave2.

Всех журналы от мастера Vm не содержат ошибок, но когда я использую рабский VM, он дает эту ошибку подключения. и nodemanager дает мне ошибку тоже в журнале:

Error starting NodeManager org.apache.hadoop.yarn.exceptions.YarnRuntimeException: java.net.ConnectException: Call From ubuntu-e6df65dc-bf95-45ca-bad5-f8ddcc272b76/50.50.1.8 to 0.0.0.0:8031 failed on connection exception: java.net.ConnectException: Connection refused; 

Из моей ведомой машины: ядра-site.xml

<name>fs.default.name</name> 
<value>hdfs://ubuntu-378e53c1-3e1f-4f6e-904d-00ef078fe3f8:9000</value> 
<name>hadoop.tmp.dir</name> 
<value>/home/ubuntu/hadoop-2.2.0/tmp</value> 

HDFS-site.xml

<name>dfs.namenode.name.dir</name> 
<value>file:/home/ubuntu/hadoop-2.2.0/etc/hdfs/namenode</value> 
</property> 
<property> 
<name>dfs.datanode.data.dir</name> 
<value>file:/home/ubuntu/hadoop-2.2.0/etc/hdfs/datanode</value> 

и на мой/etc/hosts

127.0.0.1 localhost 
50.50.1.8 ubuntu-e6df65dc-bf95-45ca-bad5-f8ddcc272b76 
50.50.1.9 ubuntu-378e53c1-3e1f-4f6e-904d-00ef078fe3f8 

JPS мастер

15863 ResourceManager 
15205 SecondaryNameNode 
14967 NameNode 
16194 Jps 

раб

1988 Jps 
1365 DataNode 
1894 NodeManager 
+0

«Звонок с ubuntu-e6df65dc-bf95-45ca-bad5-f8ddcc272b76/50.50.1.8 до 0.0.0.0:8031 не удалось» - почему он пытается подключиться к 0.0.0.0? – Suman

+0

он должен быть подключен к 50.50.1.9? – fsi

ответ

4

Причиной всех показа ошибки, это ниже ошибка является основной причиной, не в состоянии справиться подключиться к подчиненному:

Error starting NodeManager org.apache.hadoop.yarn.exceptions.YarnRuntimeException: java.net.ConnectException: Call From ubuntu-e6df65dc-bf95-45ca-bad5-f8ddcc272b76/50.50.1.8 to 0.0.0.0:8031 failed on connection exception: java.net.ConnectException: Connection refused; 

В принципе, 0.0.0.0:8031 - это порт yarn.resourcemanager.resource-tracker.address, поэтому я проверил с помощью lsof -i: 8031, порт не был включен/открыт/разрешен.Поскольку я использую OpenStack (облако), добавлено 8031 ​​и другие порты, которые отображали ошибки и voilá, работали как намерены.

+0

Не могли бы вы быть более подробными в своем ответе? –

+0

Отредактировал свой ответ, надеюсь, это помогло вам. Причина предоставления мне 0 узлов, потому что мастер не подключается к ведомому, поэтому необходимо проверить порты, где отображаются журналы. – fsi

0

Я много боролся, наконец, после использования «systemctl stop firewalld» перед этим я также отключил selinux и ipv6.

0

В моем случае я использовал hdfs datanode -format для форматирования сервера datanode, hdfs namenode -format для форматирования сервера datanode. перед этим обязательно удалите все файлы в папке с данными, которые включены в файл hdfs-site.

Смежные вопросы