разные коэффициенты corrplot () и cor.test ()

Я рассчитал коэффициент корреляции для всех возможных комбинаций набора данных о рейсах. Сначала я сделал это с помощью corrplot. В результате получился коэффициент 1 для комбинации часов и sched_dep_time. Однако при использовании cor.test () он сообщает мне, что значение приближается к 1, но составляет 0,9906496.

Вот мой код:

# the corrplot
a <- flights %>% select(year, month, day, dep_time, sched_dep_time, dep_delay, arr_time, sched_arr_time, arr_delay, flight, air_time, distance, hour, minute)
corrplot(cor(na.omit(a)), method = "number")
# using cor.test
cor.test(flights$hour, flights$sched_dep_time, method = "pearson")

Чем объясняется эта разница?


person Ruud Verhoef    schedule 07.03.2020    source источник


Ответы (1)


Кажется, это проблема округления. Когда ты делаешь

library("corrplot")
corrplot(cor(na.omit(a)), method = "number", number.digits=4, number.cex=.5)

коэффициенты совпадают лучше.

person jay.sf    schedule 07.03.2020