У меня есть команда Stata
, которая генерирует новую переменную y
со значением .
gen y=.
Я хочу знать, является ли следующая команда эквивалентной в R
"
y<-NA
У меня есть команда Stata
, которая генерирует новую переменную y
со значением .
gen y=.
Я хочу знать, является ли следующая команда эквивалентной в R
"
y<-NA
Используя это
В Stata основное отсутствующее значение для числовых переменных представлено точкой.
В R пропущенные значения представлены NA.
Начиная с версии 8 имеется 26 дополнительных кодов отсутствующих значений, обозначенных от .a до .z. Эти значения внутренне представлены как очень большие числа, поэтому valid_numbers‹ . ‹ .a ‹ ... ‹ .z.
R не имеет такого представления отсутствующих данных. все отсутствующие данные представлены NA
.
В Stata для проверки отсутствия нужно написать var >= .
В R мы используем is.na
для проверки отсутствующих данных.
NA
логичен. Также есть константы NA_integer_, NA_real_, NA_complex_ и NA_character_. Но в большинстве случаев этим различием можно пренебречь.
- person Matthew Lundberg; 21.01.2013
missing()
— это еще один способ проверки отсутствия. Кроме того, пустые строки ""
считаются отсутствующими. Таким образом, утверждение о том, что для проверки отсутствия необходимо проверить, является ли переменная >= .
, ложно для строк и ложно в том смысле, что это не единственный способ. Однако эти детали кажутся неважными для первоначального вопроса.
- person Nick Cox; 21.01.2013
Как указывает другой ответ, отсутствующие данные в объекте, который можно сравнить между Stata и R, например data.frame
, будут закодированы как NA
. NULL
— еще один вариант. Вот пустая матрица:
> x = matrix(); x
[,1]
[1,] NA
Также возможно иметь объекты нулевой длины, такие как пустая строка:
> x <- ""; x
[1] ""
Чтобы вернуться к полезной части ответа, NA
и is.na
— это биты, которые вы хотите запомнить.
.
? stata.com/support/faqs/data-management/ замена отсутствующих значений полезна? - person Ben Bolker   schedule 21.01.2013.
отсутствует значение. Моя командаR
верна? - person Metrics   schedule 21.01.2013NA
, безусловно, является кодом отсутствующих значений в R. Я недостаточно знаю о Stata, чтобы понять, ведут ли себя отсутствующие значения существенно по-разному (я знаю, что Stata более гибок для определения нескольких видов отсутствующих значений). - person Ben Bolker   schedule 21.01.2013