У меня есть матрица x
с 20 строками и 10 столбцами. Мне нужно выбрать (с заменой) 5 строк за раз и рассчитать средние значения столбцов. Мне нужно повторить эту процедуру 15 раз и каждый раз сообщать значение столбца.
В качестве примера я использовал библиотеку ресемплирования в R
для выполнения этого.
# Create a random matrix
library("resample")
set.seed(1234)
x <- matrix( round(rnorm(200, 5)), ncol=10)
## Bootstrap 15 times by re sampling 5 rows at a time.
k <- bootstrap(x,colMeans,B = 15,block.size=5)
Меня беспокоит описанная выше процедура, потому что я не уверен, что строки сохранены «в такт», что означает, что средние значения столбца рассчитываются в пределах 5 выбранных строк. Второй вопрос заключается в том, выбирает ли block.size в приведенной выше функции случайным образом 5 строк, вычисляет colMeans и повторяет это 15 раз и сообщается в повторах, как показано ниже?
k$replicates
stat1 stat2 stat3 stat4 stat5 stat6 stat7 stat8 stat9 stat10
[1,] 4.65 4.50 4.65 5.25 5.25 5.05 4.90 5.60 4.85 5.20
[2,] 4.60 4.65 4.80 5.60 5.50 5.20 5.05 5.10 5.00 5.40
[3,] 4.90 4.35 4.55 5.20 5.80 4.80 4.60 5.30 5.15 4.20
[4,] 4.75 4.65 4.15 5.30 5.25 4.80 4.70 5.15 5.55 4.35
[5,] 4.55 4.65 4.50 5.40 5.40 4.90 4.85 5.55 5.00 4.75
[6,] 4.65 4.25 5.00 5.35 5.20 5.05 4.95 5.20 4.75 5.20
[7,] 4.70 4.30 4.75 5.35 5.50 4.75 5.00 5.45 4.85 4.75
[8,] 4.75 4.15 4.95 5.10 5.55 4.70 4.70 5.30 5.05 4.90
[9,] 4.40 4.30 4.50 5.25 5.50 4.70 4.75 5.35 4.95 4.85
[10,] 4.85 4.50 4.35 5.25 5.70 4.75 4.65 5.35 4.95 4.10
[11,] 4.35 4.50 4.65 5.30 5.20 4.75 4.85 5.30 5.20 5.20
[12,] 4.25 4.55 5.20 5.00 5.45 4.80 4.90 5.15 5.30 5.00
[13,] 4.30 4.70 4.55 5.05 5.35 4.85 5.00 4.90 5.75 4.60
[14,] 4.70 4.35 4.95 5.25 5.40 4.85 4.90 5.20 5.40 5.20
[15,] 4.55 4.70 4.40 5.15 5.20 4.70 4.80 5.45 6.00 4.90
Я специально не ограничиваюсь этой функцией или пакетом, любые другие предложения будут очень признательны.
Огромное спасибо