В кластере mapr, использующем пряжу и движок tez, нам нужно запрашивать данные куста из datastage с помощью коннектора jdbc. В некоторых случаях нам нужно увеличить размер контейнера tez из-за размера данных. Мы делаем это перед оператором sql в параллельном задании, а затем запрашиваем данные в основном операторе задания.
Проблема в том, что оператор SQL SET hive.tez.container.size=3000
перед оператором SQL занимает несколько часов, но запрос данных выполняется нормально (несколько секунд).
Может ли это быть связано с тем, насколько загружен кластер в то время? много вакансий в очереди ?? Не думайте, потому что он всегда дает сбой в операторе set, но никогда в операторе select. Заранее спасибо!