У меня есть простая программа MPICH, в которой процессы отправляют и получают сообщения друг от друга в кольцевом порядке.
Я настроил две идентичные виртуальные машины и убедился, что сеть работает нормально. Я протестировал простую программу MPICH на обеих машинах, и она отлично работает. Проблема возникает, когда я пытаюсь установить связь между процессами на разных машинах, как в приведенной выше программе. Я получаю следующую ошибку:
Неустранимая ошибка в MPI_Send: Произошел сбой процесса, стек ошибок:
MPI_Send(171)...............: MPI_Send(buf=0xbfed8c08, count=1, MPI_INT, dest= 1,
тег=1, MPI_COMM_WORLD) не удалось
MPID_nem_tcp_connpoll(1826): ошибка связи с рангом 1: в соединении отказано
- SSH не имеет пароля и отлично работает с обеих сторон.
/etc/hosts
настроен правильно.- Брандмауэр отключен на обеих машинах.
- Настроил клиент/сервер NFS и разделил между ними каталог. (согласно это)
- Пробовал и MPICH, и OpenMPI с Hydra
mpiexec -f hosts -n 4 ./myapp
, который, я думаю, использует shh под капотом. - person atoMerz   schedule 29.01.2013sudo apt-get install hydra
, но проблема осталась. Как уже было сказано, я даже попробовалmpiexec.hydra
, чтобы убедиться, что гидра используется. Как запустить программы MPI в режиме отладки? любые ссылки? - person atoMerz   schedule 29.01.2013