Я применяю несколько операций к фрейму данных dask. Могу ли я определить требования к распределенным рабочим ресурсам для конкретной операции?
например Я называю что-то вроде:
df.fillna(value="").map_partitions(...).map(...)
Я хочу указать требования к ресурсам для map_partitions () (потенциально отличные от тех, что для map ()), но похоже, что метод не принимает ресурсы em> параметр.
PS. В качестве альтернативы я понял, что могу вызвать client.persist () после map_partitions () и указать ресурсы в этом вызове, но это немедленно запускает вычисление.