Я пытаюсь сгруппировать свой набор данных по нескольким переменным и построить частотную таблицу, в которой указано, сколько раз появляется символьная переменная. Вот пример набора данных:
Location State County Job Pet
Ohio Miami Data Dog
Urban Ohio Miami Business Dog, Cat
Urban Ohio Miami Data Cat
Rural Kentucky Clark Data Cat, Fish
City Indiana Shelby Business Dog
Сельский Кентукки Собака данных Кларка, Рыба Огайо Майами Дата Собака, Кошка Городской Огайо Майами Деловая собака, Кошка Сельский район Кентукки Кларк Дата Фиш-Сити Индиана Деловой кот Шелби
Я хочу, чтобы мой результат выглядел так:
Location State County Job Frequency Pet:Cat Pet:Dog Pet:Fish
Ohio Miami Data 2 1 2 0
Urban Ohio Miami Business 2 2 2 0
Urban Ohio Miami Data 1 1 0 0
Rural Kentucky Clark Data 3 1 1 3
City Indiana Shelby Business 2 1 1 0
Я пробовал разные итерации следующего кода, и я подошел, но не совсем правильно:
Output<-df%>%group_by(Location, State, County, Job)%>%
dplyr::summarise(
Frequency= dplyr::n(),
Pet:Cat = count(str_match(Pet, "Cat")),
Pet:Dog = count(str_match(Pet, "Dog")),
Pet:Fish = count(str_match(Pet, "Fish")),
)
Любая помощь будет оценена по достоинству! заранее спасибо