Я работаю над искрой в Databricks. У меня есть точка монтирования для моего хранилища, указывающая на мой каталог. Назовем каталог как /mnt/abc1/abc2 — путь. Допустим, в этом каталоге abc2 у меня есть 10 папок с именами xyz1 .. xyz10. Все эти папки xyz% содержат файлы json, назовем их xyz1_1.json и так далее. Мне нужно создать таблицу, чтобы я мог получить доступ к своему json в таблице spark, указав ее как путь + abc2.xyz1.xyz1_1.json
var path = "/mnt/abc1/"
var data = spark.read.json(path)
Это работает, когда файлы json находятся непосредственно внутри пути, а не внутри папок на нашем пути. Я хочу найти способ, который может автоматически обнаруживать базовые папки и подпапки, содержащие jsons, и строить поверх них таблицу.