Использование lapply с mutate в R

У меня проблемы с добавлением кода в функции / запуском цикла в R

Я хочу заменить переменные (var1,2,3,4) в кадре данных на основе значения в столбце var99.

Я могу сделать это следующим образом:

var1 =  c(1, 2, 1, 2)
var2 = c(3, 2, 1, 2)
var3 = c(0.4, 2, 1, 2)
var4 = c(1, 2, 1, 2)
n1 = c(10, 14, 12, 10)
n2 = c(5, 3, 12, 10)
var99 = c('se', 'se', 'sd', 'sd')
mydata=data.frame(var1, var2, var3, var4, n1, n2, var99)    
mydata<- mutate(mydata, var1 = ifelse(var99=="se",(var1*n1^0.5), var1))

mydata<- mutate(mydata, var2 = ifelse(var99=="se",(var2*n2^0.5), var2))

mydata<- mutate(mydata, var3 = ifelse(var99=="se", (var3*n2^0.5), var3))

mydata<- mutate(mydata, var4 = ifelse(var99=="se", (var4*n2^0.5), var4))

Но это станет громоздким с большим количеством переменных, и я бы предпочел, например,

varnames = c(var1, var2, var3, var4)

Это я потом перебрал. Кто-нибудь сможет посоветовать, как построить функцию / использовать lapply, поскольку мои попытки были неудачными


person RobMcC    schedule 06.07.2018    source источник
comment
Пожалуйста, поделитесь воспроизводимым примером   -  person Sotos    schedule 06.07.2018
comment
Возможно, отметьте mutate_at, чтобы применить вашу функцию к нескольким столбцам. Не очень-то просто помочь без каких-либо данных.   -  person AntoniosK    schedule 06.07.2018
comment
Я добавил воспроизводимый пример выше   -  person RobMcC    schedule 06.07.2018
comment
Вам не нужно перебирать переменные в цикле, но вы также должны проверить, какую переменную вам нужно использовать n1 или n2, верно? Просто убедитесь, что это не опечатка.   -  person AntoniosK    schedule 06.07.2018
comment
Да, извините, это было непонятно; иногда это будет n1, а иногда n2. Но я полагаю, что если бы у меня было рабочее решение, я был бы счастлив запустить его дважды: один раз с n1, а другой раз с n2.   -  person RobMcC    schedule 06.07.2018


Ответы (1)


Я надеюсь, что следующие примеры помогут вам выбрать лучший подход для вашей цели.

var1 =  c(1, 2, 1, 2)
var2 = c(3, 2, 1, 2)
var3 = c(0.4, 2, 1, 2)
var4 = c(1, 2, 1, 2)
n1 = c(10, 14, 12, 10)
n2 = c(5, 3, 12, 10)
var99 = c('se', 'se', 'sd', 'sd')
mydata=data.frame(var1, var2, var3, var4, n1, n2, var99)

library(dplyr)

# applying one function to those specific 4 columns
mydata %>% mutate_at(vars(var1:var4), funs(ifelse(var99=="se",(.*n2^0.5), .)))

#       var1     var2      var3     var4 n1 n2 var99
# 1 2.236068 6.708204 0.8944272 2.236068 10  5    se
# 2 3.464102 3.464102 3.4641016 3.464102 14  3    se
# 3 1.000000 1.000000 1.0000000 1.000000 12 12    sd
# 4 2.000000 2.000000 2.0000000 2.000000 10 10    sd


# applying different functions to different columns
mydata %>% 
  mutate_at(vars(var1), funs(ifelse(var99=="se",(.*n1^0.5), .))) %>%
  mutate_at(vars(var2:var4), funs(ifelse(var99=="se",(.*n2^0.5), .)))

#       var1     var2      var3     var4 n1 n2 var99
# 1 3.162278 6.708204 0.8944272 2.236068 10  5    se
# 2 7.483315 3.464102 3.4641016 3.464102 14  3    se
# 3 1.000000 1.000000 1.0000000 1.000000 12 12    sd
# 4 2.000000 2.000000 2.0000000 2.000000 10 10    sd


# applying different functions to those specific 4 columns

mydata %>% 
   mutate_at(vars(var1:var4), funs(n1 = ifelse(var99=="se",(.*n1^0.5), .), 
                                   n2 = ifelse(var99=="se",(.*n2^0.5), .)))

#   var1 var2 var3 var4 n1 n2 var99  var1_n1  var2_n1  var3_n1  var4_n1  var1_n2  var2_n2   var3_n2  var4_n2
# 1    1    3  0.4    1 10  5    se 3.162278 9.486833 1.264911 3.162278 2.236068 6.708204 0.8944272 2.236068
# 2    2    2  2.0    2 14  3    se 7.483315 7.483315 7.483315 7.483315 3.464102 3.464102 3.4641016 3.464102
# 3    1    1  1.0    1 12 12    sd 1.000000 1.000000 1.000000 1.000000 1.000000 1.000000 1.0000000 1.000000
# 4    2    2  2.0    2 10 10    sd 2.000000 2.000000 2.000000 2.000000 2.000000 2.000000 2.0000000 2.000000
person AntoniosK    schedule 06.07.2018
comment
В последнем примере вы можете сделать это одним вызовом mutate_at, как показано ниже: mydata %>% mutate_at(vars(var1:var4), funs(n1 = ifelse(var99=="se",(.*n1^0.5), .), n2 = ifelse(var99=="se",(.*n2^0.5), .))) - person acylam; 06.07.2018
comment
Хорошая точка зрения! Я обновлю свой ответ. - person AntoniosK; 06.07.2018