Вопросы по теме 'dask-delayed'
Понимание поведения памяти распределенного Dask
Подобно этому вопросу , у меня возникают проблемы с памятью при распространении Dask. Однако в моем случае объяснение не в том, что клиент пытается собрать большой объем данных.
Проблему можно проиллюстрировать на очень простом графике задач:...
3275 просмотров
schedule
23.07.2022
Использование dask с задержкой с функциями, возвращающими списки
Я пытаюсь использовать dask.delayed для построения графа задач. В основном это работает довольно хорошо, но я регулярно сталкиваюсь с ситуациями, подобными этой, когда у меня есть несколько отложенных объектов, у которых есть метод, возвращающий...
1652 просмотров
schedule
17.03.2023
Нужна ясность при копировании dask.dataframe
Можно ли точно имитировать API pandas.DataFrame.copy в dask.DataFrame, используя следующий код?
from copy import copy
df2 = copy(df)
Это простая копия или глубокая копия? Как мне сделать копию другого типа?
Или мне обязательно нужно...
168 просмотров
schedule
18.01.2023
Dask map_blocks — IndexError: индекс кортежа вне допустимого диапазона
Я хочу сделать следующее с Dask:
Загрузите матрицу из файла HDF5
Распараллелить расчет каждой записи
Вот мой код:
def blocked_func(x):
return np.random.random()
with h5py.File(file_path) as f:
d = f['/data']
arr =...
500 просмотров
schedule
09.01.2023
Настройка мини-кластера Dask
Чтобы лучше понять Dask, я решил создать небольшой кластер Dask: два сервера с 32 ГБ ОЗУ и Mac. Все они являются частью локальной сети и запускают идентичную версию Python 3.5 + Dask, установленную в виртуальной среде. Я установил sshfs на обоих...
103 просмотров
schedule
13.05.2022
Dask с tls-соединением не может завершить программу методом to_parquet
Я использую dask для обработки 10 файлов, размер каждого из которых составляет около 142 МБ. Я создаю метод с задержанным тегом, следующий пример:
@dask.delayed
def process_one_file(input_file_path, save_path):
res = []
for line in...
29 просмотров
schedule
02.07.2023
Является ли concat в Dask DataFrame ленивой операцией?
Я читаю список файлов с помощью dask read_parquet, объединяю эти фреймы данных и записываю в какой-то файл. во время конкатенации dask читает все данные в память во время конкатенации или загружает только схему, конкатенацию (я выполняю конкатенацию...
155 просмотров
schedule
19.02.2022
dask с добавлением в списки
Связано с Планировщик Dask пуст / график не отображается У меня есть подзадача, в которой я вызвать экспериментальный api для получения списка значений и получить обратно кортеж для каждого вызова:
### This section should be daskified
accs =...
34 просмотров
schedule
02.07.2022