Я пытаюсь перенести некоторую работу, ранее выполненную в Excel, в R. Все, что мне нужно сделать, это преобразовать две основные формулы count_if в читаемый сценарий R. В Excel я бы использовал три таблицы и рассчитывал их с помощью методов «укажи и щелкни», но теперь я потерялся в том, как я должен обращаться к этому в R.
Мои исходные фреймы данных большие, поэтому для этого вопроса я разместил образцы фреймов данных:
OperatorData <- data.frame(
Operator = c("A","B","C"),
Locations = c(850, 575, 2175)
)
AreaData <- data.frame(
Area = c("Torbay","Torquay","Tooting","Torrington","Taunton","Torpley"),
SumLocations = c(1000,500,500,250,600,750)
)
OperatorAreaData <- data.frame(
Operator = c("A","A","A","B","B","B","C","C","C","C","C"),
Area = c("Torbay","Tooting","Taunton",
"Torbay","Taunton","Torrington",
"Tooting","Torpley","Torquay","Torbay","Torrington"),
Locations = c(250,400,200,
100,400,75,
100,750,500,650,175)
)
Что я пытаюсь сделать, так это добавить два новых столбца в фрейм данных OperatorData: один, указывающий количество областей, в которых работает оператор, и другой, указывающий, сколько областей, в которых работает этот оператор, и владеет более более 50% локаций.
Таким образом, новый результирующий кадр данных будет выглядеть так:
Operator Locations AreaCount Own_GE_50percent
A 850 3 1
B 575 3 1
C 2715 5 4
До сих пор мне удалось вычислить первый столбец, используя табличную функцию, а затем добавить:
OpAreaCount <- data.frame(table(OperatorAreaData$Operator))
names(OpAreaCount)[2] <- "AreaCount"
OperatorData$"AreaCount" <- cbind(OpAreaCount$AreaCount)
Это довольно просто, но я застрял в том, как вычислить вычисление второго столбца с условием 50%.
1, 1, 4
? - person AntoniosK   schedule 11.10.2018