поведение ggplot2 ecdf кажется странным

Рассмотрим следующую серию и совокупный сюжет:

x=c(0,0,0,0.5,10,1500)
qplot(x,geom='step',stat='ecdf')

Это создает график, который начинается слева от нуля. Другими словами, похоже, что x имеет отрицательные значения. Справа он продолжается вправо после достижения 1500 и 100%. Итак, похоже, что есть x точек больше 1500.

Я получаю то, что ожидаю, когда делаю все вручную:

xs=sort(x)   
qplot(xs,1:length(xs)/length(xs),x,geom='step')

Но это, кажется, противоречит всей цели ярлыка stat='ecdf'. Что мне не хватает?


person Henk    schedule 17.07.2013    source источник


Ответы (1)


По умолчанию stat_ecdf дополняет конечные точки на max(0.08 * diff(rx), median(diff(xvals))). В моем ответе на В R ggplot2 включите конечные точки stat_ecdf() (0,0) и (1,1). Я даю способ обойти это, но это может быть немного радикальным, в зависимости от вашего варианта использования.

person user295691    schedule 05.08.2015