Текущая дельта - разница запаздывания по строке фрейма данных

У меня есть фрейм данных, например

df1 <- data.frame(Company = c('A','B','C','D','E'),
                  `X1980` = c(1, 5, 3, 8, 13),
                  `X1981` = c(20, 13, 23, 11, 29),
                  `X1982` = c(33, 32, 31, 41, 42),
                  `X1983` = c(45, 47, 53, 58, 55))

Я хотел бы создать новый фрейм данных (df2), сохраняя столбец компании как есть. Значения за 1980 и 1983 годы следует рассчитывать, используя текущее значение минус предыдущее значение. Итак, в основном я хотел бы, чтобы кадр данных приводил к скользящим дельтам.

        Company  1980  1981  1982  1983
           A      NA    19    13    12
           B      NA    8     19    15
           C      NA    20    8     22
           D      NA    3     30    17
           E      NA    16    13    13

Спасибо за помощь! Если у меня есть способ улучшить вопрос, просто дайте мне знать.


person Connor Uhl    schedule 09.11.2020    source источник


Ответы (2)


Вы можете найти разницу в каждой строке, добавив NA к первому значению.

df1[-1] <- t(apply(df1[-1], 1, function(x) c(NA, diff(x))))
df1

#  Company X1980 X1981 X1982 X1983
#1       A    NA    19    13    12
#2       B    NA     8    19    15
#3       C    NA    20     8    22
#4       D    NA     3    30    17
#5       E    NA    16    13    13

Вы также можете использовать tidyverse функции.

library(dplyr)
library(tidyr)

df1 %>%
  pivot_longer(cols = -Company) %>%
  group_by(Company) %>%
  mutate(value = value - lag(value)) %>%
  pivot_wider()
person Ronak Shah    schedule 09.11.2020

Мы можем использовать rowDiffs из matrixStats

library(matrixStats)
df1[-1] <-  cbind(NA, rowDiffs(as.matrix(df1[-1])))

-выход

df1
#  Company X1980 X1981 X1982 X1983
#1       A    NA    19    13    12
#2       B    NA     8    19    15
#3       C    NA    20     8    22
#4       D    NA     3    30    17
#5       E    NA    16    13    13
person akrun    schedule 09.11.2020