У меня есть тиковые данные по акциям в промышленном индексе Доу-Джонса в течение дня. Вот пример данных:
> head(df)
TS Sym Ask
1: 2015-03-24 14:00:00.000 YMM5 17956.00
2: 2015-03-24 14:00:00.002 AAPL 126.91
3: 2015-03-24 14:00:00.005 UNH 118.35
4: 2015-03-24 14:00:00.009 XOM 84.64
5: 2015-03-24 14:00:00.014 AXP 81.35
6: 2015-03-24 14:00:00.016 PG 84.19
Я пытаюсь использовать функцию dcast() reshape2 для преобразования данных в широкий формат, поэтому это будет выглядеть так:
TS AAPL AXP PG UNH XOM
1: 2015-03-24 14:00:00.000 126.91 81.35 84.19 118.35 84.64
Однако, когда я пробую следующий набор команд, вот что я получаю:
tick <- data.table(read.csv("2015-3-24.csv"))
df<- data.table(TS = tick$DateTime, Sym = tick$Symbol, Ask = tick$Ask, Bid = tick$Bid)
tmp <- dcast(data = df, formula = TS ~ Sym)
head(tmp)
TS AAPL AXP BA CAT CSCO CVX DD DIS GE GS HD IBM INTC JNJ JPM KO MCD MMM MRK MSFT NKE PFE PG TRV UNH UTX V VZ WMT XOM YMM5
1 2015-03-24 14:00:00.000 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1
2 2015-03-24 14:00:00.002 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
3 2015-03-24 14:00:00.005 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0
Я знаю, что неправильно понимаю формулу или что-то в этом роде, но независимо от того, что я пытаюсь сделать, я получаю тот же результат. Заранее спасибо.
dcast
? - person Arun   schedule 25.06.2015"Aggregate function missing, defaulting to 'length''
Спасибо. - person CJ B   schedule 25.06.2015