Вопросы по теме 'fastparquet'

Как читать несколько файлов паркета (с одинаковой схемой) из нескольких каталогов с помощью dask / fastparquet
Мне нужно использовать dask для загрузки нескольких файлов паркета с идентичной схемой в один фрейм данных. Это работает, когда все они находятся в одном каталоге, но не в разных каталогах. Например: import fastparquet pfile =...
6476 просмотров
schedule 26.12.2021

Сравнение между fastparquet и pyarrow?
После некоторых поисков мне не удалось найти подробное сравнение fastparquet и pyarrow . Я нашел этот блог post (базовое сравнение скоростей). и обсуждение на github, в котором утверждается, что файлы, созданные с помощью fastparquet ,...
25919 просмотров
schedule 21.06.2022

Могу ли я получить доступ к файлу Parquet через индекс, не считывая весь файл в память?
Я только что прочитал, что HDF5 позволяет вам получить доступ к данным без чтения всего файла в память. Возможно ли такое поведение при поиске в файлах Parquet без Java (решения, отличные от pyspark)? Я использую Parquet из-за сильной поддержки...
265 просмотров
schedule 22.07.2023