У меня есть набор данных, состоящий из одной переменной, которая подвергается цензуре (точка цензуры равна 0). Я считаю, что латентная переменная (то есть переменная до цензурирования) более или менее следует нормальному распределению. Как я могу, используя R, найти параметры этого распределения?
Учитывая обилие R-пакетов, я удивлен, что не смог найти ни одного, который бы легко решил проблему. Судя по названию, в этом контексте может быть полезна функция fitdistcens из пакета fitdistrplus. Но если я правильно прочитал документацию — в чем я сомневаюсь — функция требует двух столбцов, один из которых должен содержать нецензурированные данные:
censdata. Фрейм данных из двух столбцов с соответствующими названиями слева и справа, описывающий каждое наблюдаемое значение как интервал. Левый столбец содержит либо NA для цензурированных слева наблюдений, либо левую границу интервала для интервальных цензурированных наблюдений, либо наблюдаемое значение для нецензурированных наблюдений. Правый столбец содержит либо NA для наблюдений с цензурой справа, либо правую границу интервала для наблюдений с цензурой интервала, либо наблюдаемое значение для наблюдений без цензуры.
Означает ли это, что функция не может быть использована для моей цели? Если да, то каковы альтернативы?
Помощь (возможно, с примером) приветствуется.
censdata
, но если я правильно помню, функция правдоподобия для подвергнутых цензуре данных не так уж сложна. Каждое цензурированное значение (при условии независимости) вносит коэффициентintegral(p(x), x, -infinity, a)
, гдеa
— это точка отсечки (0, как вы ее описали), аp(x)
— функция плотности. Таким образом, это будет член, который вы можете выразить черезerf
, и, я думаю, вы можете по крайней мере минимизировать логарифмическую вероятность численно, даже если вы не можете найти точное решение. Я не прорабатывал детали, но надеюсь, что этого достаточно для начала. - person Robert Dodier   schedule 15.10.2014