Я не смог найти здесь вопрос о переполнении стека, который уже отвечает на мой вопрос, поэтому мне очень жаль, если этот вопрос уже задавался, и я просто не смог его найти.
В целом, этот вопрос больше касается понимания того, что происходит с моими данными в зависимости от того, какой код я использую.
Итак, у меня есть набор данных с несколькими NA.
Я хочу агрегировать данные и использовать na.rm=True
, который говорит R игнорировать NA при расчете, верно? Вывод, который я получил, включал NA, и это привело к тому, что я использовал функцию na.action=na.pass
вместе с na.rm=True
. Это оставило у меня значительно меньше NA в моем выводе. Честно говоря, я не понимаю, почему...
Поскольку мне нравится пробовать и выяснять для себя, я рассмотрел различные варианты моей агрегатной функции:
- только с
na.rm=True
- только с
na.action=na.pass
na.rm=True
,na.action=na.pass
только используя 2. Я получаю много NA, что имеет смысл, потому что я сказал R включить все NA в расчет, не имея в нем na.rm=True
. В то же время 1. и 3. не дают мне одинаковых результатов. это почему?
Я думал, что два na.rm=True
и na.action=na.pass
означают одно и то же... видимо, это не так, потому что я получаю немного разные значения для своих переменных.
Что происходит с моими данными, когда я использую и na.rm=True, и na.action=na.pass
в агрегатной функции по сравнению с использованием только na.rm=True
. Что лучше использовать?
Большое спасибо, я ценю вашу помощь!