У меня есть набор столбчатых данных, с помощью которого я строю серию коробчатых диаграмм, наиболее похожих на настройку в этом примере: Ящик для таблицы с использованием ggplot2
require(reshape2)
ggplot(data = melt(dd), aes(x=variable, y=value)) + geom_boxplot(aes(fill=variable))
Однако в моем случае каждая из коробчатых диаграмм представляет разное количество точек данных. Например, в столбце A может быть 8000 точек данных, в столбце B - 6000, в столбце C - 2500, а в столбце D - 800.
Чтобы передать это, я подумал, что могу изменить цвет заливки поля, чтобы отразить количество точек данных. Чем темнее прямоугольник, тем больше точек данных было использовано при вычислении статистики, которую представляет прямоугольная диаграмма.
В файле справки ggplot2 для geom_histogram они используют aes (fill = .. count ..) для затенения интервалов, соответствующих количеству отсчетов в интервале.
m <- ggplot(movies, aes(x=rating))
m + geom_histogram(aes(fill=..count..))
(Хотел включить сюда изображение гистограммы, но не могу, потому что у меня недостаточно очков репутации ... извините)
Я пробовал использовать это с моим ggplot geom_boxplot, но, похоже, он не знает части ..count ... Вот моя строка, которая генерирует коробчатую диаграмму:
ggplot(meltedData, aes(x=variable, y=value)) + geom_boxplot(aes(fill=variable), outlier.size = 1) + ylim(-4,3)
У кого-нибудь есть указатели? Я знаю, что могу добавить свойство «alpha» к geom_boxplot, но как я могу применить его к каждому блочному графику индивидуально в зависимости от количества точек данных в блочном графике?
Заранее спасибо.
..count..
систему, но думаю, что она работает с гистограммами из-за аргументаstat="bin"
. Возможно, вам придется просто добавитьcount
к самим данным. - person Señor O   schedule 16.07.2013