Подсчитать количество элементов, соответствующих критериям, в столбцах со значениями NA

У меня есть матрица со значениями «A», «B» и NA, и я хотел бы подсчитать количество значений «A», «B» или NA в каждом столбце.

sum(mydata[ , i] == "A")

sum(mydata[ , i] == "B")

отлично работал для столбцов без NA. Для столбцов, содержащих NA, я могу подсчитать количество NA с sum(is.na(mydata[ , i]). В этих столбцах sum(mydata[ , i] == "A") возвращает NA вместо числа.

Как я могу подсчитать количество значений «A» в столбцах, которые содержат значения NA?

Спасибо за вашу помощь!

Пример:

> mydata
    V1  V2  V3  V4 
V2 "A" "A" "A" "A"
V3 "A" "A" "A" "A"
V4 "B" "B" NA  NA 
V5 "A" "A" "A" "A"
V6 "B" "A" "A" "A"
V7 "B" "A" "A" "A"
V8 "A" "A" "A" "A"

sum(mydata[ , 2] == "A")
# [1] 6

sum(mydata[ , 3] == "A")
# [1] NA

sum(is.na(mydata[ , 3]))
# [1] 1

r sum na

sztup 22.03.2012 источник

Ответы (6)

arrow_upward
7
arrow_downward

Функция sum (как и многие другие математические функции в R) принимает аргумент na.rm. Если вы установите na.rm=TRUE, R удалит все значения NA перед выполнением вычисления.

Пытаться:

sum(mydata[,3]=="A", na.rm=TRUE)

Andrie 22.03.2012

arrow_upward
3
arrow_downward

Не уверен, что это то, что вам нужно. RnewB тоже, так что проверьте, работает ли это. Разница между количеством строк и вашим количеством строк покажет вам количество элементов NA.

colSums(!is.na(mydata))

InMktgWeTrust 11.01.2014

arrow_upward
0
arrow_downward

Чтобы расширить ответ от @Andrie,

mydata <- matrix(c(rep("A", 8), rep("B", 2), rep(NA, 2), rep("A", 4),
  rep(c("B", "A", "A", "A"), 2), rep("A", 4)), ncol = 4, byrow = TRUE)

myFun <- function(x) {
  data.frame(n.A = sum(x == "A", na.rm = TRUE), n.B = sum(x == "B",
    na.rm = TRUE), n.NA = sum(is.na(x)))
}

apply(mydata, 2, myFun)

BenBarnes 22.03.2012

arrow_upward
0
arrow_downward

Другая возможность состоит в том, чтобы преобразовать столбец в фактор, а затем использовать сводку функции. Пример:

vec‹-c ("А", "Б", "А", Н/Д)

резюме (as.factor (vec))

user4353689 26.01.2015

arrow_upward
0
arrow_downward

Быстрый способ сделать это — сделать сводную статистику для переменной:

Сводка(mydata$my_variable) таблицы(mydata$my_variable)

Это даст вам количество пропущенных переменных.

Надеюсь это поможет

Frank Odhiambo 11.03.2015

arrow_upward
-1
arrow_downward

Вы можете использовать table для одновременного подсчета всех ваших значений.

Sophia 22.03.2012

Подсчитать количество элементов, соответствующих критериям, в столбцах со значениями NA

Ответы (6)

Похожие вопросы