Вычисление вероятности для участка совместного распределения

Учитывая, что у меня есть непрерывное совместное распределение двух независимых нормальных случайных величин (предположим, что независимые переменные находятся на осях X и Z, а зависимая — совместная вероятность — находится на оси Y), и у меня есть линия в любом месте на Плоскость XZ, как мне вычислить вероятность того, что точка попадет по одну или по другую сторону от этой линии?


person Fabio Ceconello    schedule 10.08.2009    source источник
comment
Как этот вопрос связан с программированием?   -  person las3rjock    schedule 11.08.2009
comment
Ну, у этого есть много применений в программном обеспечении для статистического анализа. Я просто не просил примеры кода, связанные с решением, потому что для меня (и, вероятно, для большинства разработчиков) они не нужны - если у меня есть концепция, я могу превратить ее в код; также это независимая от языка проблема. Но образцы кода будут оценены любым желающим опубликовать.   -  person Fabio Ceconello    schedule 11.08.2009


Ответы (1)


Сначала переместите все так, чтобы два нормальных распределения (X и Z) были сосредоточены на нуле; теперь совместное распределение будет холмом с центром в начале координат.

Теперь масштабируйте одну из осей так, чтобы два распределения имели одинаковую дисперсию (или «ширину»). Теперь совместная вероятность должна быть вращательно-симметричным холмом.

Теперь все, что имеет значение, это то, насколько близко линия подходит к началу координат. Поверните вокруг начала координат (это оставит совместную вероятность неизменной), пока линия не будет параллельна одной из осей, скажем, Z. Теперь вы запрашиваете вероятность того, что случайная точка будет иметь X больше или меньше, чем значение X линии. Это определяется одной из масштабированных функций распределения (они одинаковы) и может быть рассчитано с помощью функции ошибок.

Я могу написать математику, если это будет полезно.

РЕДАКТИРОВАТЬ: я попытаюсь написать последний шаг. Простите мой грубый ascii, у меня нет доступа к хорошему математическому планшету.

Предположим, мы масштабировали и центрировали распределения так, что sigmaX = sigmaZ = 1, и все повернули:

joint probability: P(x, z) = 1/(2 pi) exp(-(x^2 + z^2)/2)

line: x = c

Теперь найдем вероятность того, что случайная точка окажется на узкой «вертикальной» полосе между некоторыми x и x+dx:

P(x)dx = Int[z=-Inf, z=+Inf]{dz P(x, z)}
       = 1/sqrt(2 pi) exp(-x^2/2) 1/sqrt(2 pi) Int[z=-Inf, z=+Inf]{dz exp(-z^2/2)}
       = 1/sqrt(2 pi) exp(-x^2/2)

Но это то же самое, что (любое) одно из двух нормальных распределений. Таким образом, вероятность того, что случайная точка окажется, скажем, слева от прямой, равна

P(c>x) = Int[-Inf, c]{dx 1/sqrt(2 pi) exp(-x^2/2)}
       = 1/2 (1 - Erf(c/sqrt(2)))
person Beta    schedule 10.08.2009
comment
Благодарю вас! Я могу понять ваше обоснование, есть только одна деталь, которую я не очень хорошо понял. После поворота и т. д., вы имеете в виду, что интеграл для одного из разделов трехмерного пространства будет таким же, как и для одного из разделов двумерного пространства, взятого из любого из двух распределений? Другими словами, могу ли я вычислить расстояние до ближайшей точки линии от начала координат и использовать его в качестве предела для интегрирования любой из функций, и это даст мне правильный результат? - person Fabio Ceconello; 10.08.2009
comment
Я был бы признателен, если бы вы могли опубликовать формулы только для этого последнего шага. Эмпирически мне казалось, что для выравнивания одного из измерений нужно объединить две функции, потому что я предполагал, что соответствующая кривая будет круче. - person Fabio Ceconello; 10.08.2009
comment
Я полагаю, что вы правильно интерпретировали последствия ответа Беты в своем первом комментарии; из соображений симметрии преобразованное и масштабированное совместное распределение сохраняется при вращении, как и кратчайшее расстояние от линии до начала координат. Кроме того, любое двумерное поперечное сечение транслированного и масштабированного совместного распределения само по себе будет нормальным распределением с одной переменной. Итак, да, если вы установите ограничения, как описано, это сработает. Конечно, уберите из своего вопроса слово «нормальный», и все ставки сняты. :-) - person Richard Dunlap; 10.08.2009
comment
Отвечая на вопрос, да, вы можете рассчитать расстояние от линии до начала координат и использовать его в качестве предела интегрирования. Я просто использовал поворот, чтобы было понятно (надеюсь), почему это работает. - person Beta; 11.08.2009
comment
Спасибо. Я спросил, потому что в моем конкретном случае это сделало бы реализацию более эффективной по времени, поскольку у меня уже было расстояние, рассчитанное ранее для другого использования. - person Fabio Ceconello; 11.08.2009
comment
Просто убедитесь, что вы рассчитываете расстояние ПОСЛЕ масштабирования. - person Beta; 11.08.2009