Вопросы по теме 'torque'

Как использовать команду qsub -v в крутящем моменте PBS?
Я хотел бы передать переменные в сценарий csh с помощью команды «qsub -v». Я понимаю, что мы можем перечислить пары параметров-значений, как показано ниже, qsub -v par1=value1 par2=value2 myScript.csh Кто-нибудь знает, могут ли значения этих...
4599 просмотров
schedule 25.03.2022

Как запустить несколько команд в одной отправке задания PBS
Я написал код, который требует всего 1-4 процессора. Но когда я отправляю задание в кластер, я должен взять хотя бы один узел с 16 ядрами на задание. Поэтому я хочу запустить несколько симуляций на каждом узле с каждым заданием, которое я отправляю....
3050 просмотров

Ubuntu: удаленный вход в систему (SSHD) — завершение сеанса и заданий по тайм-ауту
Сценарий сервера: Ubuntu 12.04 LTS Torque с планировщиком Maui Hadoop Я строю небольшой кластер (10 узлов). Пользователи будут иметь возможность подключаться по ssh к любому дочернему узлу (аутентификация LDAP), но в этом нет необходимости,...
338 просмотров
schedule 01.04.2022

Запросить количество заданий, представленных с помощью Torque
Как запросить общее количество заданий, отправленных пользователем в настоящее время? Это могут быть запущенные задания, задания в очереди или и то, и другое. Предпочтительно, я хотел бы видеть все задания, которые у меня есть в настоящее время...
44 просмотров
schedule 26.02.2023

qsub возвращает ошибку при отправке заданий с узла
У меня есть сложное приложение Fortran MPI, работающее в системе Torque/Maui. Когда я запускаю свое приложение, оно выдает огромный уникальный результат (~ 20 ГБ). Чтобы избежать этого, я создал сценарий RunJob, который разбивает выполнение на 5...
3822 просмотров
schedule 17.05.2022

Лучший способ получить статистику работы после завершения работы PBS.
Мне было интересно, есть ли лучший способ получить некоторую статистику работы (например, время процессора, время стены, использование памяти и т. д.) в сценарии задания PBS (после завершения задания). В моей текущей настройке у меня есть строка в...
995 просмотров
schedule 04.10.2022

linux - вывод pbsnodes - какие элементы в «статусе»?
Я уже давно использую команду pbsnodes для сбора данных о вычислительном кластере. Недавно я подумал, что было бы полезно сравнить количество заданий на узле с использованием его процессора. Мне кажется, что метрика loadavg в свойстве состояния...
688 просмотров
schedule 30.10.2023

Torque PBS: указание имени файла stdout в качестве идентификационного номера задания
По умолчанию выходные данные отправленного задания в очередь Torque будут сохранены в файл с именем вроде job_name.o658392 . Что я хочу сделать, используя этот пример, так это назвать выходной файл 658392.job_name.log вместо этого. Я знаю, что...
1310 просмотров
schedule 30.08.2022

Все задания в очереди Q для планировщика Torque Pbs
Я новичок в планировщике крутящего момента/pbs, и я установил его на сервере на одном компьютере с Debian 8 и сделал еще одну установку на клиенте на вычислительном узле с Debian 8. На моем сервере запущены pbs_server и pbs_sched, на моем...
3214 просмотров
schedule 18.06.2022

Задания Torque PBS, поступающие в очередь отладки
На моей новой работе я администрирую кластер, который использует крутящий момент в качестве менеджера ресурсов и maui в качестве планировщика. В настоящее время я сталкиваюсь с этой повторяющейся проблемой, когда задания конкретных пользователей...
196 просмотров
schedule 20.09.2022

PBS: как распечатать историю выполнения заданий и как использовать имя сценария как PBS_JOBNAME?
Новое для qsub и HPC. У меня есть три небольших вопроса: Я хочу иметь лучший способ узнать, какой сценарий задания соответствует какому stderr и stdout. Я понимаю, что могу вручную ввести имя задания и их stderr и stdout вот так (ну, прямо сейчас...
6502 просмотров
schedule 10.04.2024

Как проанализировать запись журнала pbs_server, pbs_mom сервера и рабочего узла
Как я могу проанализировать эти записи в журнале, я хочу понять, каков формат этих записей в журнале? 1) PBS_Server; LOG_ERROR:: Невозможно назначить запрошенный адрес (99) в send_job, send_job не удалось отправить на порт 15002 d23818f7...
903 просмотров
schedule 28.08.2022

Крутящий момент с одним узлом, несоответствие протокола
Я пытаюсь настроить Torque v6.1.1.1 на одном сервере (-> один узел, сам сервер) с Ubuntu 14.04. Я устанавливаю его с параметрами по умолчанию (настроить). После сборки пакетов я установил эти модули: сервер, клиент и мама. Я настраиваю так:...
583 просмотров
schedule 10.11.2022

Tensorflow и беговое распределенное обучение с крутящим моментом
Я написал нейронную сеть в соответствии с руководством по тензорному потоку по распределенному обучению: https://www.tensorflow.org/deploy/distributed Если кластер, на котором я хотел бы провести обучение, использует крутящий момент для...
241 просмотров
schedule 28.06.2022

Запуск задания крутящего момента в среде tensorflow conda
У меня есть кластер, работающий с крутящим моментом для распределения заданий. Я хочу запустить задание с кодом тензорного потока, и у меня возникают проблемы с распознаванием тензорного потока. Я установил tensorflow на своего пользователя LDAP с...
417 просмотров
schedule 25.11.2022

как получить статус завершенных или прерванных заданий в qsub/torque
Используя крутящий момент, если я запускаю задание с qsub с определенными аргументами, задание завершается и происходят три вещи. 1) Я получаю файл file.eXXXX, содержащий стандартный вывод процесса 2) Я получаю файл file.oXXXX, содержащий стандартный...
1754 просмотров
schedule 16.06.2023

Как я могу перезапустить неудачное задание PBS в кластере (qsub)?
Я запускаю задание PBS (python) в кластере с помощью команды qsub . Мне любопытно узнать, как я могу перезапустить ту же работу с шага, на котором она не удалась? Любая помощь будет высоко оценена.
559 просмотров
schedule 23.05.2024