Получение распределения из гистограммы

У меня есть массив значений, с этими значениями я построил гистограмму. Я хочу знать соответствующее распределение из полученной гистограммы. Как это возможно. Не могли бы вы объяснить шаги по получению соответствующего распределения вероятностей из гистограммы.

Appuz Elizabeth 30.06.2016 источник

comment

Какое распределение вероятностей? Вы имеете в виду какую-либо параметрическую форму? - Vahid 30.06.2016

comment

Если ваш вопрос заключается в том, как определить тип статистического распределения ваших данных: это практически невозможно! Существует почти бесконечное количество потенциальных распределений, которые могут хорошо вписаться в вашу гистограмму. - obchardon 30.06.2016

comment

У меня есть массив значений и рассчитанное среднее значение и дисперсия. Я хочу проверить, какое распределение вероятностей близко аппроксимируется к гистограмме, полученной из массива значений. (Например, я хочу проверить, близко ли оно к гамма-распределениям Рэлея). - Appuz Elizabeth 30.06.2016

Ответы (3)

arrow_upward
0
arrow_downward

Вам лучше задать этот вопрос на stats.stackexchange.com, так как это больше касается метода, чем программирования. Однако вы можете подобрать параметрическое распределение (используя сопоставление моментов или, например, максимальная вероятность), затем сравните подобранное распределение с нормализованная гистограмма с использованием расхождения KL или Расстояние Бхаттачарьи.

Vahid 30.06.2016

arrow_upward
0
arrow_downward

Одним из вариантов может быть использование "Distribution Fitting App" в статистике. и набор инструментов для машинного обучения. Это должно помочь вам оценить, не кажутся ли ваши данные взятыми из некоторых распространенных дистрибутивов. Возможно, вы никогда не узнаете наверняка, поскольку данные могут учитываться в нескольких дистрибутивах, но если у вас много данных, это может помочь вам сузить круг.

CKT 30.06.2016

arrow_upward
0
arrow_downward

Я думаю, что во многих случаях сравнения глазного яблока достаточно. При разумном количестве данных довольно сложно не отличить гауссова, вейбулла или...

Я бы использовал fitdist или fithist, чтобы ознакомиться с различными дистрибутивами.

Если вы вообще не имеете представления о распределении и хотите знать, распределяются ли два набора данных по-разному, может быть полезно сравнить их распределения, получив их с помощью опции 'kernel'.

shamalaia 30.06.2016

Получение распределения из гистограммы

Ответы (3)

Похожие вопросы