tidyr предоставляет unnest, которые помогают расширять столбцы списка.
Это похоже на гораздо (в 20 раз) более быструю функцию ungroup в kdb.
Я ищу аналогичную (но гораздо более быструю) функцию, которая, предполагая, что data.table содержит несколько столбцов списка, каждый с одинаковым количеством элементов в каждой строке, расширяла бы data.table.
Это расширение этого сообщения.
library(data.table)
library(tidyr)
t = Sys.time()
DT = data.table(a=c(1,2,3),
b=c('q','w','e'),
c=list(rep(t,2),rep(t+1,3),rep(t,0)),
d=list(rep(1,2),rep(20,3),rep(1,0)))
print(DT)
a b c d
1: 1 q 2016-01-09 09:55:14,2016-01-09 09:55:14 1,1
2: 2 w 2016-01-09 09:55:15,2016-01-09 09:55:15,2016-01-09 09:55:15 20,20,20
3: 3 e
print(unnest(DT))
Source: local data frame [5 x 4]
a b c d
(dbl) (chr) (time) (dbl)
1 1 q 2016-01-09 09:55:14 1
2 1 q 2016-01-09 09:55:14 1
3 2 w 2016-01-09 09:55:15 20
4 2 w 2016-01-09 09:55:15 20
5 2 w 2016-01-09 09:55:15 20
Вот моя собственная попытка... она кажется в 2 раза быстрее, но должна быть значительно улучшена...
dtUngroup <- function(DT){
colClasses <- lapply(DT,FUN=class)
listCols <- colnames(DT)[colClasses=='list']
if(length(listCols)>0){
nonListCols <- setdiff(colnames(DT),listCols)
nbListElem <- unlist(DT[,lapply(.SD,FUN=lengths),.SDcols=(listCols[1L])])
DT1 <- DT[,lapply(.SD,FUN=rep,times=(nbListElem)),.SDcols=(nonListCols)]
DT1[,(listCols):=DT[,lapply(.SD,FUN=function(x) do.call('c',x)),.SDcols=(listCols)]]
return(DT1)
}
return(DT)
}
dtUngroup(DT)[]
a b c d
1: 1 q 2016-01-09 09:55:14 1
2: 1 q 2016-01-09 09:55:14 1
3: 2 w 2016-01-09 09:55:15 20
4: 2 w 2016-01-09 09:55:15 20
5: 2 w 2016-01-09 09:55:15 20
DT[, lapply(.SD, unlist), by = 1:nrow(DT)]
- person Jaap   schedule 09.01.2016numberAsPOSIXct()
в пакетеoce
и идею Яапа, возможно, вам нужно следующее:DT[, lapply(.SD, unlist), by = 1:nrow(DT)][, c := numberAsPOSIXct(c)][]
- person jazzurro   schedule 09.01.2016asPOSIXct
, тоже работает - person Jaap   schedule 09.01.2016