2016-09-16 3 views
0

Я пытаюсь создать виртуальный кластер для своих классов MPI, чтобы я мог работать дома и не быть в университетских лабораториях целый день. Я не могу понять в течение 2 дней, как решить эту проблему с помощью munge.Torque/PBS не может найти munge.socket.2

Выход проблемы у меня есть эта

[[email protected] lumx]# qmgr -c "set server acl_hosts = mars" 
munge_encode failed: Failed to access "/var/run/munge/munge.socket.2": No such file or directory (6) 
Unable to communicate with localhost(127.0.0.1) 
Communication failure. 
qmgr: cannot connect to server (errno=15009) munge executable not found, unable to authenticate 

Мой хосты файл выглядит следующим образом

127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4 
::1   localhost localhost.localdomain localhost6 localhost6.localdomain6 
127.0.0.1 mpimaster localhost.localdomain localhost 

Я пытался читать столько, сколько я мог, и я закончил с этими руководствами , Getting started with Open MPI on Fedora, Installing Torque/PBS job scheduler on Ubuntu 14.04 LTS, TORQUE Arch Linux, http://juanjose.garciaripoll.com/fedora-cluster/5-torque-pbs-queue

ответ

1

Я решил. Мне просто нужно заставить его запустить и использовать syslogs, потому что на данный момент есть некоторые проблемы с разрешением.

Команда, которую я использую

munged --force --syslog 
Смежные вопросы