Я новичок в R, пытаясь переписать код R в sparkR. Одна из операций над таблицей data.table с именем costTbl (которая имеет 5 других столбцов) - это
costTbl[,cost:=na.locf(cost,na.rm=FALSE),by=product_id]
costTbl[,cost:=na.locf(cost,na.rm=FALSE, fromLast=TRUE),by=product_id]
Я не могу найти эквивалентную операцию в sparkR. Я думал, что gapply можно использовать, сгруппировав df по product_id и выполнив эту операцию. Но я не могу заставить код работать.
Gapply - правильный подход? Есть ли другой способ добиться этого?