Крутящий момент с одним узлом, несоответствие протокола

Я пытаюсь настроить Torque v6.1.1.1 на одном сервере (-> один узел, сам сервер) с Ubuntu 14.04. Я устанавливаю его с параметрами по умолчанию (настроить). После сборки пакетов я установил эти модули: сервер, клиент и мама. Я настраиваю так:

  • server_priv/узлы

hostname

  • имя сервера

hostname

  • mom_priv/config

$pbsserver hostname $logevent 20

Я получаю эту ошибку от mom_log:

LOG_ERROR::read_tcp_reply, Mismatching protocols. Expected protocol 4 but read reply for 0

из журнала_сервера

LOG_ERROR::tcp_connect_sockaddr, Failed when trying to open tcp connection - connect() failed [rc = -2] [addr = 127.0.1.1:15003]

Я пробовал несколько вещей, таких как: указать имя для мамы в файле конфигурации и добавить это имя в /etc/hosts, заменить имя хоста на localhost безрезультатно.

Как я могу это сделать? Большое спасибо


person user7378541    schedule 02.08.2017    source источник


Ответы (2)


Я предлагаю убить процессы pbs_server и pbs_mom, а затем перезапустить их. Вы можете проверить каждый отдельно с помощью pbsnodes и momctl -d0.

person clusterdude    schedule 03.08.2017
comment
У меня с этим с pbsnodes ubuntu state = down power_state = Running np = 1 ntype = cluster mom_service_port = 15002 mom_manager_port = 15003 и с этим с momctl -d0 Host: ubuntu/ubuntu Version: 6.1.1.1 PID: 189950 Server[0]: ubuntu (127.0.1.1:15001) WARNING: no messages received from server WARNING: no messages sent to server HomeDirectory: /var/spool/torque/mom_priv MOM active: 16 seconds LogLevel: 100 (use SIGUSR1/SIGUSR2 to adjust) NOTE: no local jobs detected diagnostics complete It' - person user7378541; 03.08.2017
comment
Если hostname и hostname -f не возвращают один и тот же вывод, вам нужно остановить их обоих (qterm и momctl -s), поместить длинное имя в файл server_name, закомментировать строку $pbsserver, а затем запустить все заново. - person clusterdude; 05.08.2017
comment
Кроме того, вы можете установить короткое имя хоста. Это влечет за собой 1) обновление /etc/hostname, 2) запуск hostname <new short name> и 3) добавление записи короткого имени в /etc/hosts. (Также может потребоваться перезапуск служб pbs_server и pbs_mom.( - person clusterdude; 05.08.2017

Тканков много, я решил это

  • установить v6.0.1

  • беги ./torque.setup localhost root

  • server_priv/узлы: localhost

  • mom_priv/config: $pbsserver <hostname> и $mom_host localhost

  • имя сервера: <hostname>

person user7378541    schedule 07.08.2017