Я хочу построить гистограмму, плотность (ядро Гаусса) и соответствующее нормальное распределение простых потерь компании Allianz SE. (Это означает, что простые убытки минус простые прибыли)
У меня такой код:
hist(alvsloss,breaks = 100, freq=F,main="Histogramm,
density curve (gaussian kernel) of Allianz simple losses ",xlab="loss in percent",ylab="density")
lines(density(alvsloss), col="red", lwd=2)
curve(dnorm(x, mean = mean(alvsloss), sd = mean(alvsloss)), add=TRUE, col="blue", lty="dotted")
Теперь у меня первая проблема:
The fitted normal distribution is not drawn, I get the (german) error message:
In dnorm(x, mean = mean(alvsloss), sd = mean(alvsloss)) :
NaNs wurden erzeugt
Кривая нормального распределения не строится.
Второй - это общий вопрос: если я опущу нормальное распределение, у меня останутся только гистограмма и плотность. Затем я могу изменить частоту между истинным и ложным с помощью команды
freq=T
or
freq=F
Прикрепил скриншоты обеих картинок (надо выложить, так как репутаций у меня не меньше 10). Я их не понимаю, если у меня freq = T, значит, у меня есть значения плотности по оси y. Значит, должны быть значения вроде 0,0012 или 0,1, но не 300 или 400, плотность должна быть относительной? Тоже никак не совпадает ядро, явно не так? Если у меня freq = F, я получаю правильную картину. Теперь у меня есть абсолютные значения, например, было 30 случаев, когда у меня доходность составляла около 0,0 (средний высокий пик), верно? Теперь плотность подходит, но я ожидал, что она не подходит в этом случае, так как я думал, что она находится в значениях freq = T, поэтому должно быть иначе, на этом изображении это должно быть неправильно?
Если на это будет дан ответ, у меня возникнут дополнительные вопросы: мне не нравится ось x, как я могу получить более подробное масштабирование? Правильно ли сказать следующее: хвост справа от 0,5 до 0,1 тяжелее, чем хвост слева, поэтому в этой области вероятность проигрыша выше, чем вероятность выигрыша? В то время как крайние значения встречаются только с левой стороны: значения -0,2 и даже примерно -0,4. Значит, в этом случае не происходит экстремальных потерь, а реализуется экстремальная выгода? Это правильно?
В чем моя ошибка, я ее не вижу?
Снимок экрана:
Вы можете найти данные здесь
Это данные alvsloss
Полное решение:
hist(alvsloss,breaks = 100, freq=F,main="Histogramm, density curve (gaussian kernel) of Allianz simple losses ",xlab="loss in percent",ylab="density")
lines(density(alvsloss), col="red", lwd=2)
curve(dnorm(x, mean = mean(alvsloss), sd = sd(alvsloss)), add=TRUE, col="blue",lwd=2)
что дает следующую картину:
кажется правильным, не так ли?