Я использую AvroKeyInputFormat
для чтения файлов avro:
val records = sc.newAPIHadoopFile[AvroKey[T], NullWritable, AvroKeyInputFormat[T]](path)
.map(_._1.datum())
Поскольку мне нужно размышлять над схемой в своей работе, я получаю схему Avro следующим образом:
val schema = records.first.getSchema
К сожалению, это не удается, если файлы avro в path
пусты (они включают схему записи, но не содержат записей).
Есть ли простой способ загрузить схему avro только с помощью Spark, даже если записей нет?