Получение распределения из гистограммы

У меня есть массив значений, с этими значениями я построил гистограмму. Я хочу знать соответствующее распределение из полученной гистограммы. Как это возможно. Не могли бы вы объяснить шаги по получению соответствующего распределения вероятностей из гистограммы.


person Appuz Elizabeth    schedule 30.06.2016    source источник
comment
Какое распределение вероятностей? Вы имеете в виду какую-либо параметрическую форму?   -  person Vahid    schedule 30.06.2016
comment
Если ваш вопрос заключается в том, как определить тип статистического распределения ваших данных: это практически невозможно! Существует почти бесконечное количество потенциальных распределений, которые могут хорошо вписаться в вашу гистограмму.   -  person obchardon    schedule 30.06.2016
comment
У меня есть массив значений и рассчитанное среднее значение и дисперсия. Я хочу проверить, какое распределение вероятностей близко аппроксимируется к гистограмме, полученной из массива значений. (Например, я хочу проверить, близко ли оно к гамма-распределениям Рэлея).   -  person Appuz Elizabeth    schedule 30.06.2016


Ответы (3)


Вам лучше задать этот вопрос на stats.stackexchange.com, так как это больше касается метода, чем программирования. Однако вы можете подобрать параметрическое распределение (используя сопоставление моментов или, например, максимальная вероятность), затем сравните подобранное распределение с нормализованная гистограмма с использованием расхождения KL или Расстояние Бхаттачарьи.

person Vahid    schedule 30.06.2016

Одним из вариантов может быть использование "Distribution Fitting App" в статистике. и набор инструментов для машинного обучения. Это должно помочь вам оценить, не кажутся ли ваши данные взятыми из некоторых распространенных дистрибутивов. Возможно, вы никогда не узнаете наверняка, поскольку данные могут учитываться в нескольких дистрибутивах, но если у вас много данных, это может помочь вам сузить круг.

person CKT    schedule 30.06.2016

Я думаю, что во многих случаях сравнения глазного яблока достаточно. При разумном количестве данных довольно сложно не отличить гауссова, вейбулла или...

Я бы использовал fitdist или fithist, чтобы ознакомиться с различными дистрибутивами.

Если вы вообще не имеете представления о распределении и хотите знать, распределяются ли два набора данных по-разному, может быть полезно сравнить их распределения, получив их с помощью опции 'kernel'.

person shamalaia    schedule 30.06.2016