SparkSession.createDataset()
позволяет только List, RDD, or Seq
, но не поддерживает JavaPairRDD
.
Итак, если у меня есть JavaPairRDD<String, User>
, из которого я хочу создать Dataset
, будет ли жизнеспособным обходным путем для ограничения SparkSession.createDataset()
создать класс-оболочку UserMap
, который содержит два поля: String
и User
.
Тогда сделайте spark.createDataset(userMap, Encoders.bean(UserMap.class));
?