Вопросы по теме 'dask-delayed'

Понимание поведения памяти распределенного Dask
Подобно этому вопросу , у меня возникают проблемы с памятью при распространении Dask. Однако в моем случае объяснение не в том, что клиент пытается собрать большой объем данных. Проблему можно проиллюстрировать на очень простом графике задач:...
3275 просмотров
schedule 23.07.2022

Использование dask с задержкой с функциями, возвращающими списки
Я пытаюсь использовать dask.delayed для построения графа задач. В основном это работает довольно хорошо, но я регулярно сталкиваюсь с ситуациями, подобными этой, когда у меня есть несколько отложенных объектов, у которых есть метод, возвращающий...
1652 просмотров

Нужна ясность при копировании dask.dataframe
Можно ли точно имитировать API pandas.DataFrame.copy в dask.DataFrame, используя следующий код? from copy import copy df2 = copy(df) Это простая копия или глубокая копия? Как мне сделать копию другого типа? Или мне обязательно нужно...
168 просмотров
schedule 18.01.2023

Dask map_blocks — IndexError: индекс кортежа вне допустимого диапазона
Я хочу сделать следующее с Dask: Загрузите матрицу из файла HDF5 Распараллелить расчет каждой записи Вот мой код: def blocked_func(x): return np.random.random() with h5py.File(file_path) as f: d = f['/data'] arr =...
500 просмотров
schedule 09.01.2023

Настройка мини-кластера Dask
Чтобы лучше понять Dask, я решил создать небольшой кластер Dask: два сервера с 32 ГБ ОЗУ и Mac. Все они являются частью локальной сети и запускают идентичную версию Python 3.5 + Dask, установленную в виртуальной среде. Я установил sshfs на обоих...
103 просмотров
schedule 13.05.2022

Dask с tls-соединением не может завершить программу методом to_parquet
Я использую dask для обработки 10 файлов, размер каждого из которых составляет около 142 МБ. Я создаю метод с задержанным тегом, следующий пример: @dask.delayed def process_one_file(input_file_path, save_path): res = [] for line in...
29 просмотров
schedule 02.07.2023

Является ли concat в Dask DataFrame ленивой операцией?
Я читаю список файлов с помощью dask read_parquet, объединяю эти фреймы данных и записываю в какой-то файл. во время конкатенации dask читает все данные в память во время конкатенации или загружает только схему, конкатенацию (я выполняю конкатенацию...
155 просмотров

dask с добавлением в списки
Связано с Планировщик Dask пуст / график не отображается У меня есть подзадача, в которой я вызвать экспериментальный api для получения списка значений и получить обратно кортеж для каждого вызова: ### This section should be daskified accs =...
34 просмотров