Проверка кода R для начальной загрузки. Оценка среднего значения ChiSq.

У меня есть домашняя задача - написать функцию, которая оптимизирует свой путь к поиску 95% доверительного интервала для медианы распределения df = 2 Chisq. Моя функция, кажется, работает, но из вики я получил формулу для медианы как k (1-2 / 9k) ^ 3, которая дает 0,343 для k = 2. CI моей функции оценивается в (1,28, 1,51) с большим количеством большое распределение, размер выборки и количество симуляций (100000). Так что теоретического ответа в этом интервале нет. Может кто-нибудь сказать мне, где мой код терпит неудачу, пожалуйста?

ChisqMedian_CI <- function(chiN, nsim, sampleN){
y <- rchisq(n=chiN, df=2)
medy_resample <- NULL
for (i in 1:nsim) {
  y_resample <- sample(y, replace=TRUE, size=sampleN)
  medy_resample[i] <- median(y_resample)
}
  LB <- quantile(medy_resample, probs=c(0.025))
  UB <- quantile(medy_resample, probs=c(0.975))
  return(c(LB, UB))
}

person Michael    schedule 14.04.2019    source источник
comment
Возможно, ответы на этот вопрос как-то помогут: stackoverflow.com/q/53533829/6574038   -  person jay.sf    schedule 14.04.2019


Ответы (1)


Здесь есть две проблемы:

  1. Медиана случайной величины с распределением хи-квадрат приблизительно равна k * (1-2 / (9k)) ^ 3. Для k = 2 это примерно 1,4. Это соответствует вашим результатам.

  2. Для (стандартной) начальной загрузки образцы начальной загрузки всегда имеют размер исходного образца. Таким образом, chiN не является обязательным, и для него будет установлено значение sampleN.

person Michael M    schedule 14.04.2019
comment
Спасибо. Очень полезно. Думаю, я пропустил необходимую скобку или что-то в этом роде при вычислении этой медианы вручную в R. Я тоже не понял 2. Раньше мне об этом не говорили открыто, но в этом есть смысл. - person Michael; 14.04.2019