Вопросы по теме 'torque'
Как использовать команду qsub -v в крутящем моменте PBS?
Я хотел бы передать переменные в сценарий csh с помощью команды «qsub -v». Я понимаю, что мы можем перечислить пары параметров-значений, как показано ниже,
qsub -v par1=value1 par2=value2 myScript.csh
Кто-нибудь знает, могут ли значения этих...
4599 просмотров
schedule
25.03.2022
Как запустить несколько команд в одной отправке задания PBS
Я написал код, который требует всего 1-4 процессора. Но когда я отправляю задание в кластер, я должен взять хотя бы один узел с 16 ядрами на задание. Поэтому я хочу запустить несколько симуляций на каждом узле с каждым заданием, которое я отправляю....
3050 просмотров
schedule
13.05.2022
Ubuntu: удаленный вход в систему (SSHD) — завершение сеанса и заданий по тайм-ауту
Сценарий сервера:
Ubuntu 12.04 LTS Torque с планировщиком Maui Hadoop
Я строю небольшой кластер (10 узлов). Пользователи будут иметь возможность подключаться по ssh к любому дочернему узлу (аутентификация LDAP), но в этом нет необходимости,...
338 просмотров
schedule
01.04.2022
Запросить количество заданий, представленных с помощью Torque
Как запросить общее количество заданий, отправленных пользователем в настоящее время? Это могут быть запущенные задания, задания в очереди или и то, и другое. Предпочтительно, я хотел бы видеть все задания, которые у меня есть в настоящее время...
44 просмотров
schedule
26.02.2023
qsub возвращает ошибку при отправке заданий с узла
У меня есть сложное приложение Fortran MPI, работающее в системе Torque/Maui. Когда я запускаю свое приложение, оно выдает огромный уникальный результат (~ 20 ГБ). Чтобы избежать этого, я создал сценарий RunJob, который разбивает выполнение на 5...
3822 просмотров
schedule
17.05.2022
Лучший способ получить статистику работы после завершения работы PBS.
Мне было интересно, есть ли лучший способ получить некоторую статистику работы (например, время процессора, время стены, использование памяти и т. д.) в сценарии задания PBS (после завершения задания). В моей текущей настройке у меня есть строка в...
995 просмотров
schedule
04.10.2022
linux - вывод pbsnodes - какие элементы в «статусе»?
Я уже давно использую команду pbsnodes для сбора данных о вычислительном кластере. Недавно я подумал, что было бы полезно сравнить количество заданий на узле с использованием его процессора. Мне кажется, что метрика loadavg в свойстве состояния...
688 просмотров
schedule
30.10.2023
Torque PBS: указание имени файла stdout в качестве идентификационного номера задания
По умолчанию выходные данные отправленного задания в очередь Torque будут сохранены в файл с именем вроде job_name.o658392 . Что я хочу сделать, используя этот пример, так это назвать выходной файл 658392.job_name.log вместо этого.
Я знаю, что...
1310 просмотров
schedule
30.08.2022
Все задания в очереди Q для планировщика Torque Pbs
Я новичок в планировщике крутящего момента/pbs, и я установил его на сервере на одном компьютере с Debian 8 и сделал еще одну установку на клиенте на вычислительном узле с Debian 8.
На моем сервере запущены pbs_server и pbs_sched, на моем...
3214 просмотров
schedule
18.06.2022
Задания Torque PBS, поступающие в очередь отладки
На моей новой работе я администрирую кластер, который использует крутящий момент в качестве менеджера ресурсов и maui в качестве планировщика.
В настоящее время я сталкиваюсь с этой повторяющейся проблемой, когда задания конкретных пользователей...
196 просмотров
schedule
20.09.2022
PBS: как распечатать историю выполнения заданий и как использовать имя сценария как PBS_JOBNAME?
Новое для qsub и HPC. У меня есть три небольших вопроса:
Я хочу иметь лучший способ узнать, какой сценарий задания соответствует какому stderr и stdout. Я понимаю, что могу вручную ввести имя задания и их stderr и stdout вот так (ну, прямо сейчас...
6502 просмотров
schedule
10.04.2024
Как проанализировать запись журнала pbs_server, pbs_mom сервера и рабочего узла
Как я могу проанализировать эти записи в журнале, я хочу понять, каков формат этих записей в журнале?
1) PBS_Server; LOG_ERROR:: Невозможно назначить запрошенный адрес (99) в send_job, send_job не удалось отправить на порт 15002 d23818f7...
903 просмотров
schedule
28.08.2022
Крутящий момент с одним узлом, несоответствие протокола
Я пытаюсь настроить Torque v6.1.1.1 на одном сервере (-> один узел, сам сервер) с Ubuntu 14.04. Я устанавливаю его с параметрами по умолчанию (настроить). После сборки пакетов я установил эти модули: сервер, клиент и мама. Я настраиваю так:...
583 просмотров
schedule
10.11.2022
Tensorflow и беговое распределенное обучение с крутящим моментом
Я написал нейронную сеть в соответствии с руководством по тензорному потоку по распределенному обучению: https://www.tensorflow.org/deploy/distributed
Если кластер, на котором я хотел бы провести обучение, использует крутящий момент для...
241 просмотров
schedule
28.06.2022
Запуск задания крутящего момента в среде tensorflow conda
У меня есть кластер, работающий с крутящим моментом для распределения заданий. Я хочу запустить задание с кодом тензорного потока, и у меня возникают проблемы с распознаванием тензорного потока.
Я установил tensorflow на своего пользователя LDAP с...
417 просмотров
schedule
25.11.2022
как получить статус завершенных или прерванных заданий в qsub/torque
Используя крутящий момент, если я запускаю задание с qsub с определенными аргументами, задание завершается и происходят три вещи. 1) Я получаю файл file.eXXXX, содержащий стандартный вывод процесса 2) Я получаю файл file.oXXXX, содержащий стандартный...
1754 просмотров
schedule
16.06.2023
Как я могу перезапустить неудачное задание PBS в кластере (qsub)?
Я запускаю задание PBS (python) в кластере с помощью команды qsub . Мне любопытно узнать, как я могу перезапустить ту же работу с шага, на котором она не удалась? Любая помощь будет высоко оценена.
559 просмотров
schedule
23.05.2024