Я новичок в sparklyr и пытаюсь добавить случайные векторы нормалей, взвешенные другим вектором, к большому количеству столбцов spark df. Это пример, который я пробовал с mtcars.
library(sparklyr)
library(dplyr)
sc1 <- spark_connect(master = "local")
mtc_df = select(mtcars, vs:carb)
mtc_sdf = sdf_copy_to(sc1, mtc_df, name = "mtc_sdf", overwrite = TRUE)
tf_df <- function(df1){
df1 %>%
mutate_at(vars(am:carb), funs(. + vs * rnorm(32, 100, 1)))
}
tf_df(mtc_df) # works
mtc_sdf %>%
spark_apply(function(d) tf_df(d), memory = TRUE) # doesn't work
Я получаю следующую ошибку:
Error in file(con, "r") : cannot open the connection
In addition: Warning message:
In file(con, "r") :
cannot open file 'C:\....\filea54a7656c3_spark.log': Permission denied
Я также попытался адаптировать пример на https://spark.rstudio.com/, но получил ту же ошибку. .
mtc_sdf %>%
spark_apply(function(data) {
data[2:4] + data[1]*rnorm(32*3,100,1)
})
Любая помощь приветствуется.