PBS: как распечатать историю выполнения заданий и как использовать имя сценария как PBS_JOBNAME?

Новое для qsub и HPC. У меня есть три небольших вопроса:

Я хочу иметь лучший способ узнать, какой сценарий задания соответствует какому stderr и stdout. Я понимаю, что могу вручную ввести имя задания и их stderr и stdout вот так (ну, прямо сейчас я использую $PBS_JOBNAME.$PBS_JOBID для stderr и stdout), но через 6 месяцев мне будет трудно узнать, из какого сценария задания Генерируются stderr и stdout $PBS_JOBNAME.$PBS_JOBID. Я думаю об использовании имени сценария задания в качестве префикса для stderr и stdout, чтобы я мог легко связать их, но помимо ручного редактирования сценария, есть ли какая-то переменная, которую я могу установить, чтобы сделать это автоматически?

  2 #PBS -N testjob
  3 #PBS -d /home/mydir/projects/test
  4 #PBS -q home
  5 #PBS -V
  6 #PBS -l nodes=1:ppn=1
  7 #PBS -l walltime=1:00:00
  8 #PBS -M [email protected]
  9 #PBS -o $PBS_JOBNAME.$PBS_JOBID.out
 10 #PBS -e $PBS_JOBNAME.$PBS_JOBID.err

В приведенном выше сценарии я указываю рабочий каталог с /home/mydir/projects/test, я пробовал #PBS -d $PWD, но это не сработало. Есть ли способ также автоматически установить рабочий каталог в качестве моего текущего каталога, в котором я вызвал задание PBS?

Наконец, я хотел бы вести учет заданий, которые я выполнял. Я вижу текущие задания/задания в очереди с помощью qstat, но через несколько минут задания завершаются, qstat не дает никаких результатов. Есть ли какая-то команда, которая может распечатать всю историю заданий? Спасибо!


person olala    schedule 03.08.2016    source источник
comment
Что касается -d части вопроса, то обычной практикой является использование cd $PBS_O_WORKDIR в качестве первой команды в сценарии задания.   -  person Dmitri Chubarov    schedule 04.08.2016
comment
Благодарность! Я также понял, что могу использовать #PBS -d .   -  person olala    schedule 05.08.2016


Ответы (1)


Вы можете увидеть большую часть истории выполненных заданий, запустив:

tracejob <job ID>

Запустите его без аргументов, чтобы увидеть сообщение об использовании. Если вы получаете ошибки прав доступа к частям вывода, вы можете использовать доступные параметры для подавления этих частей. Используйте -z, чтобы получить максимальную информацию.

По умолчанию он будет возвращаться только на один день назад, поэтому вам нужно будет указать «-n <days>», чтобы вернуться назад.

person clusterdude    schedule 04.08.2016
comment
благодаря. есть ли команда для просмотра заданий, запущенных конкретным пользователем, то есть я хочу увидеть все задания, которые я выполнял за последние несколько дней. - person olala; 05.08.2016
comment
Не то, чтобы я знал об этом, хотя, если у вас есть доступ к серверу, вы можете искать в журналах учета (и/или журналах заданий, если они включены). - person clusterdude; 05.08.2016