Вопросы по теме 'fastparquet'
Как читать несколько файлов паркета (с одинаковой схемой) из нескольких каталогов с помощью dask / fastparquet
Мне нужно использовать dask для загрузки нескольких файлов паркета с идентичной схемой в один фрейм данных. Это работает, когда все они находятся в одном каталоге, но не в разных каталогах.
Например:
import fastparquet
pfile =...
6476 просмотров
schedule
26.12.2021
Сравнение между fastparquet и pyarrow?
После некоторых поисков мне не удалось найти подробное сравнение fastparquet и pyarrow .
Я нашел этот блог post (базовое сравнение скоростей).
и обсуждение на github, в котором утверждается, что файлы, созданные с помощью fastparquet ,...
25919 просмотров
schedule
21.06.2022
Могу ли я получить доступ к файлу Parquet через индекс, не считывая весь файл в память?
Я только что прочитал, что HDF5 позволяет вам получить доступ к данным без чтения всего файла в память.
Возможно ли такое поведение при поиске в файлах Parquet без Java (решения, отличные от pyspark)? Я использую Parquet из-за сильной поддержки...
265 просмотров
schedule
22.07.2023