Как проанализировать запись журнала pbs_server, pbs_mom сервера и рабочего узла

Как я могу проанализировать эти записи в журнале, я хочу понять, каков формат этих записей в журнале?

1) PBS_Server; LOG_ERROR:: Невозможно назначить запрошенный адрес (99) в send_job, send_job не удалось отправить на порт 15002 d23818f7

2) pbs_mom;LOG_ALERT::mom_server_valid_message_source, плохое соединение с 210.56.24.244:1023 - неавторизованный сервер


person Rabia Majeed    schedule 29.09.2016    source источник


Ответы (1)


Имя в /var/spool/torque/server_name на вычислительных узлах и на сервере должно совпадать и разрешаться в один и тот же адрес. Если это не так, проверьте /etc/hosts, nsswitch.conf и DNS, чтобы решить эту проблему.

РЕДАКТИРОВАТЬ № 1: также я бы обязательно поместил вывод команды hostname на сервере в файл server_name на всех машинах.

РЕДАКТИРОВАТЬ № 2: также имейте в виду, что $pbsserver в /var/spool/torque/mom_priv/config на вычислительных узлах переопределит значение в файле server_name. (Поэтому лучше не использовать $pbs_server.)

person clusterdude    schedule 03.10.2016