У меня есть следующий очень простой скрипт R, который использует зоопарк для визуализации ежедневных чисел на временной шкале:
# Small script to plot daily number of added users to database
library(zoo)
data <- read.csv("search_history.csv", header=FALSE)
# last line will be cut because it might be incomplete
zoodata <- data[1:(length(data$V2)-1), ]
series <- zoo(zoodata$V2, zoodata$V1)
par(mar=c(7, 6, 4, 2),
lab=c(5, 6, 5),
mgp = c(4, 1, 0))
plot(series,
main="Number of users added to database over time",
xlab="Date",
ylab="Number of users",
las=2,
lwd=2,
col="red",
cex.axis=0.7)
Содержимое search_history.csv:
"2012-12-27","458","4728"
"2012-12-28","239","6766"
"2012-12-29","193","8189"
"2012-12-30","148","7698"
"2012-12-31","137","7370"
"2013-01-01","119","6324"
"2013-01-02","122","7016"
"2013-01-03","115","7986"
"2013-01-04","112","8222"
"2013-01-05","112","6828"
"2013-01-06","124","7318"
"2013-01-07","121","8228"
"2013-01-08","120","8158"
...
Я хочу визуализировать первый (V1) и второй столбец (V2). В основном у меня есть две проблемы: первая и очевидная — это пунктирные линии в y-позиции ~50 и ~450. Как я могу удалить их и почему они вообще включены?
вторая проблема – включение 2013-01-26 в ось x. Как видите, я удалил последнюю строку набора данных, содержащую эти данные (любительски, может быть, есть лучший способ сделать это). Так что в сюжете не должно быть последней даты. Я не понимаю, почему он вообще знает об этой дате, ведь на вход он принимает zoodata
, а не data
.
?factor
не имело смысла? Вот аргумент против использования stringsAsFactors=TRUE (stackoverflow.com/a/1368460/967840). - person GSee   schedule 27.01.2013