Существует параллельное задание, состоящее из одного набора данных, одного последовательного файла и объединяющего их этапа поиска.
Последовательный файл содержит 15 811 строк. Он импортируется просто отлично (и я вижу это в журнале).
Проблема с этапом поиска - он выдает следующую ошибку:
LOOKUP,0: Could not map table file "/var/opt/ascential/adm/DataSet1/lookuptable.20140330.spzjazc (size 4191844864 bytes)": Not enough space
Error finalizing / saving table /tmp/dynLUT18950c3139ce
Как я читал на веб-сайте IBM и на других форумах, возможным решением может быть увеличение количества узлов. Поэтому я изменил свой файл APT с 1 узла на 6 узлов:
{
node "node1"
{
fastname "xxx"
pools ""
resource disk "/var/opt/ascential/adm/DataSet1" {pools ""}
resource scratchdisk "/var/opt/ascential/adm/Scratch1" {pools ""}
}
node "node2"
{
fastname "xxx"
pools ""
resource disk "/var/opt/ascential/adm/DataSet2" {pools ""}
resource scratchdisk "/var/opt/ascential/adm/Scratch2" {pools ""}
}
node "node3"
{
fastname "xxx"
pools ""
resource disk "/var/opt/ascential/adm/DataSet3" {pools ""}
resource scratchdisk "/var/opt/ascential/adm/Scratch3" {pools ""}
}
node "node4"
{
fastname "xxx"
pools ""
resource disk "/var/opt/ascential/adm/DataSet4" {pools ""}
resource scratchdisk "/var/opt/ascential/adm/Scratch4" {pools ""}
}
node "node5"
{
fastname "xxx"
pools ""
resource disk "/var/opt/ascential/adm/DataSet5" {pools ""}
resource scratchdisk "/var/opt/ascential/adm/Scratch5" {pools ""}
}
node "node6"
{
fastname "xxx"
pools ""
resource disk "/var/opt/ascential/adm/DataSet6" {pools ""}
resource scratchdisk "/var/opt/ascential/adm/Scratch6" {pools ""}
}
}
Тем не менее, я получаю ту же ошибку, и я заметил, что задание записывает только в первую папку DataSet (есть файл с именем /var/opt/ascential/adm/DataSet1/lookuptable.20140330.spzjazc, который увеличивается в размере, пока не достигнет ~ 4 ГБ, то задание завершается ошибкой и файл удаляется).
Я предполагаю, что задание на самом деле не выполняется на нескольких узлах, поскольку существует только 1 файл. Это правильно? Как я могу заставить его работать на всех 6 узлах, чтобы преодолеть ограничение в 4 ГБ?
Есть ли другие обходные пути для этого?