Добавить столбец в строку в Spark


person Jonathan    schedule 13.01.2016    source источник
comment
Я думаю, что вы не можете изменить, поскольку он неизменен   -  person Sachin Janani    schedule 13.01.2016


Ответы (1)


Как упоминает @Sachin Janani в комментарии, вы не можете изменить строку (она неизменна), но вы можете добавить столбец к DataFrame, используя функцию withColumn. Приведенный ниже код, например, добавит столбец с длиной строк, найденных в столбце «текст»:

val stringLength = udf[Int, String](s => s.length)
val df2 = df1.withColumn("text_length", stringLength(df1("text")))

Надеюсь это поможет.

person Glennie Helles Sindholt    schedule 13.01.2016
comment
Спасибо, это очень близко к тому, что я хочу, но мой udf будет очень сложным (с учетом вхождения определенных слов в текст другого столбца). Я обязательно сохраню с учетом столбца. Этот пост связан с этим . - person Jonathan; 13.01.2016