Что является эквивалентом Stata . в р

У меня есть команда Stata, которая генерирует новую переменную y со значением .

gen y=. 

Я хочу знать, является ли следующая команда эквивалентной в R"

y<-NA

person Metrics    schedule 20.01.2013    source источник
comment
Вы можете указать ссылку на какую-нибудь онлайн-документацию Stata, в которой говорится, как ведет себя .? stata.com/support/faqs/data-management/ замена отсутствующих значений полезна?   -  person Ben Bolker    schedule 21.01.2013
comment
Да, . отсутствует значение. Моя команда R верна?   -  person Metrics    schedule 21.01.2013
comment
Я так думаю. NA, безусловно, является кодом отсутствующих значений в R. Я недостаточно знаю о Stata, чтобы понять, ведут ли себя отсутствующие значения существенно по-разному (я знаю, что Stata более гибок для определения нескольких видов отсутствующих значений).   -  person Ben Bolker    schedule 21.01.2013


Ответы (2)


Используя это

В Stata основное отсутствующее значение для числовых переменных представлено точкой.

В R пропущенные значения представлены NA.

Начиная с версии 8 имеется 26 дополнительных кодов отсутствующих значений, обозначенных от .a до .z. Эти значения внутренне представлены как очень большие числа, поэтому valid_numbers‹ . ‹ .a ‹ ... ‹ .z.

R не имеет такого представления отсутствующих данных. все отсутствующие данные представлены NA.

В Stata для проверки отсутствия нужно написать var >= .

В R мы используем is.na для проверки отсутствующих данных.

person agstudy    schedule 20.01.2013
comment
Строго говоря, NA логичен. Также есть константы NA_integer_, NA_real_, NA_complex_ и NA_character_. Но в большинстве случаев этим различием можно пренебречь. - person Matthew Lundberg; 21.01.2013
comment
@MatthewLundberg Моя точка зрения заключалась в том, что в R нет сравнения между пропущенными значениями. Но логический факт NA - это хороший момент. не стесняйтесь редактировать мой ответ, если вы думаете, что я что-то пропустил. Я ответил на этот вопрос только для того, чтобы привлечь больше пользователей Stata к R.. - person agstudy; 21.01.2013
comment
Не вижу необходимости редактировать. Заявление все недостающие данные... технически неверно, но на практике вряд ли кто-то заметит. - person Matthew Lundberg; 21.01.2013
comment
В Stata функция missing() — это еще один способ проверки отсутствия. Кроме того, пустые строки "" считаются отсутствующими. Таким образом, утверждение о том, что для проверки отсутствия необходимо проверить, является ли переменная >= ., ложно для строк и ложно в том смысле, что это не единственный способ. Однако эти детали кажутся неважными для первоначального вопроса. - person Nick Cox; 21.01.2013

Как указывает другой ответ, отсутствующие данные в объекте, который можно сравнить между Stata и R, например data.frame, будут закодированы как NA. NULL — еще один вариант. Вот пустая матрица:

> x = matrix(); x
     [,1]
[1,]   NA

Также возможно иметь объекты нулевой длины, такие как пустая строка:

> x <- ""; x
[1] ""

Чтобы вернуться к полезной части ответа, NA и is.na — это биты, которые вы хотите запомнить.

person Fr.    schedule 21.01.2013