Вопросы по теме 'parallelism-amdahl'

Распараллеливание цикла for в Python
Я закодировал нейронную сеть, которая работает очень медленно, поэтому я надеялся немного ускорить ее, распараллелив определенный цикл. Я не уверен насчет реализации и того, как работает GIL, и актуально ли это для меня. Код выглядит следующим...
301 просмотров

Tensorflow: обучение с несколькими графическими процессорами не может заставить все графические процессоры работать одновременно
У меня есть машина с 3x 1080 GPU. Ниже приведен код тренировки: dynamic_learning_rate = tf.placeholder(tf.float32, shape=[]) model_version = tf.constant(1, tf.int32) with tf.device('/cpu:0'): with tf.name_scope('Input'):...
538 просмотров

RegCM, MPICH, кластеризация компьютеров
Предыстория: мне нужно выполнить огромные вычисления для моделирования климата с более чем 800 [GB] данными (за последние 50 лет и будущие 80 лет). Для этого я использую RegCM4 на основе Linux. Я использую Убунту. Самая мощная система,...
225 просмотров

Измерьте параллельное ускорение в рандомизированных алгоритмах
У меня есть рандомизированная программа с последовательными и параллельными вариантами. Природа этой программы такова, что время ее выполнения сильно зависит от ее "удачи". Он регулярно принимает значения от 1 секунды до 2 минут в, казалось бы,...
69 просмотров

Параллельное программирование на вложенном цикле for в Python с использованием PyCuda (или еще?)
Часть моей функции Python выглядит так: for i in range(0, len(longitude_aq)): center = Coordinates(latitude_aq[i], longitude_aq[i]) currentAq = aq[i, :] for j in range(0, len(longitude_meo)): currentMeo = meo[j, :]...
700 просмотров

Сравнительный анализ параллельных вычислений OpenMP
Я пытаюсь сравнить вычисление f(x) , меняя количество потоков на каждой итерации. f(x) = c * ln(x) * cos(x) n=10000000 for (int pp = 2; pp<17; pp++) { p = pp; int chunk = n/p; //acts like floor omp_set_num_threads(p);...
250 просмотров

Высокое использование памяти при запуске многопроцессорной обработки python в Windows
Приведенный ниже код представляет собой надуманный пример, имитирующий реальную проблему, с которой я столкнулся, в которой для ускорения кода используется многопроцессорность. Код запускается на Windows 10 64-bit OS , python 3.7.5 и ipython...
738 просмотров

Как найти оптимальное количество рабочих для парфора?
Как найти оптимальное количество воркеров для parfor на виртуальной машине Amazon? Для каких случаев я должен использовать количество физических и для каких логических ядер? Есть ли для этого какое-либо " эмпирическое правило "? Я...
130 просмотров

Параллельные вычисления: как разделить вычислительные ресурсы между пользователями?
Я запускаю симуляцию на машине Linux со следующими характеристиками. Architecture: x86_64 CPU op-mode(s): 32-bit, 64-bit Byte Order: Little Endian CPU(s): 80 On-line CPU(s) list: 0-79 Thread(s) per core:...
64 просмотров