Интерполяция с помощью na.approx: как это сделать?

Я делаю легкое отключение данных о занятости, и я наткнулся на приблизительный подход в пакете зоопарка. Эти данные представляют собой процент от общей занятости в правительстве, и я решил, что приблизительная оценка будет состоять в том, чтобы посмотреть на тенденции изменений между государственными и местными органами власти. Они должны добавить к одному.

        State % Local %
2001    na  na
2002    na  na
2003    na  na
2004    0.118147539 0.881852461
2005    0.114500321 0.885499679
2006    0.117247083 0.882752917
2007    0.116841331 0.883158669

Я использую настройку сплайна, которая позволяет оценивать ведущие на

z <- zoo(DF2,1:7)    
d<-na.spline(z,na.rm=FALSE,maxgap=Inf)

Что дает результат:

State % Local %
0.262918013 0.737081987
0.182809891 0.817190109
0.137735231 0.862264769
0.118147539 0.881852461
0.114500321 0.885499679
0.117247083 0.882752917
0.116841331 0.883158669

Отлично, правда? Что меня поражает, так это то, что сумма приблизительных значений na равна 1 (это то, что я хочу, но неожиданно!), Но в документации для na.approx говорится, что он обрабатывает каждый столбец отдельно, по столбцам. Я что-то упускаю? Мои деньги на неправильное чтение документации


person AzadA    schedule 06.02.2011    source источник
comment
Меня бы больше беспокоит, разумны ли такие большие оценки. Учитывая, что у вас есть значения только на одной стороне ваших NA s, вы фактически экстраполируете, а не интерполируете, что, согласно документации spline, не имеет большого смысла для метода сплайна по умолчанию.   -  person James    schedule 07.02.2011


Ответы (1)


Я считаю, что это просто случайное свойство линейных наименьших квадратов. Наклоны обеих регрессий в сумме равны нулю в результате ограничения, согласно которому сумма ряда равна единице; и сумма перехватов равна единице. Следовательно, подобранные значения обеих регрессий в любой момент времени в сумме равны единице.

РЕДАКТИРОВАТЬ: еще немного объяснений.
y1 = a + beta * t + epsilon
y2 = 1-y1 = (1-a) + (- beta) * t - epsilon
Следовательно, выполнение OLS будет дайте сумме перехватов до единицы, а наклоны к нулю.

person crayola    schedule 06.02.2011
comment
Это правильно, за исключением того, что есть также квадратичные и кубические члены. Коэффициенты линейных, квадратичных и кубических членов для второго столбца являются отрицательными по сравнению с соответствующими членами первого столбца (так же, как вы написали для линейного члена). - person G. Grothendieck; 07.02.2011