Я обрабатываю большое количество входных файлов в Azure Databricks. В моем последнем кадре данных примерно 98 миллионов строк.
Мне нужно экспортировать это из Databricks, чтобы я мог импортировать его в Power BI для создания отчетов.
Power BI в настоящее время не имеет соединителя, который может интерпретировать разделенный характер, если я просто записываю фрейм данных, например. CSV. Использование объединения или преобразования в фрейм данных pandas и экспорт в CSV происходит очень медленно и подвержено ограничению ресурсов в кластере.
Я пробовал оба вышеупомянутых подхода с небольшим успехом.
Какие еще есть варианты для эффективного экспорта моего фрейма данных таким образом, чтобы Power BI мог его понять? Я не возражаю, если это либо со стороны Databricks, либо со стороны Power Query.