Я хотел бы объединить несколько обученных конвейеров в один, который похож на "Spark добавляет новую подогнанную стадию в существующую PipelineModel без повторной подгонки", однако приведенное ниже решение предназначено для PySpark.
> pipe_model_new = PipelineModel(stages = [pipe_model , pipe_model2])
> final_df = pipe_model_new.transform(df1)
В Apache Spark 2.0 конструктор PipelineModel помечен как частный, поэтому его нельзя вызывать извне. В то время как в классе "Конвейер" только метод "подгонки" создает "PipelineModel"
val pipelineModel = new PipelineModel("randomUID", trainedStages)
val df_final_full = pipelineModel.transform(df)
Error:(266, 26) constructor PipelineModel in class PipelineModel cannot be accessed in class Preprocessor val pipelineModel = new PipelineModel("randomUID", trainedStages)