Вопросы по теме 'summarize'

Определение и применение пользовательских бинов к фрейму данных
Используя python, я создал следующий фрейм данных, который содержит значения сходства: cosinFcolor cosinEdge cosinTexture histoFcolor histoEdge histoTexture jaccard 1 0.770 0.489 0.388 0.57500000 0.5845137 0.3920000...
85007 просмотров
schedule 22.09.2022

Условное суммирование в R (ddply, суммировать, суммировать)
У меня есть кадр данных с наблюдениями за 6 различными переменными и весом выборки для каждой из них. Я пытаюсь использовать ddply с summarize для создания нового фрейма данных, в котором одна из шести переменных становится первым столбцом, а...
627 просмотров
schedule 15.08.2022

Применяете group_by и summarize (sum), но сохраняете столбцы с нерелевантными конфликтующими данными?
Мой вопрос очень похож на Применяя group_by и суммируйте данные, сохраняя при этом информацию обо всех столбцах , но я хотел бы сохранить столбцы, которые исключаются из-за конфликта после группировки. Label <-...
11555 просмотров
schedule 07.07.2022

R - Суммировать data.frame на интервале
Я пытаюсь суммировать переменную в data.frame за каждую пятницу. Случайный кадр данных mydf = data.frame( "ID" = c( rep( "A" , 6) , rep( "B" , 5 ) ), "Date" = c(...
154 просмотров
schedule 30.11.2022

Сворачивание строк с помощью dplyr
Я новичок в R и пытаюсь свернуть строки на основе значений строк с помощью dplyr. В следующем примере показаны образцы данных. set.seed(123) df<-data.frame(A=c(rep(1:4,4)), B=runif(16,min=0,max=1), C=rnorm(16,...
3979 просмотров
schedule 17.12.2022

Сумма строк (с NA) в R
У меня есть data.frame «данные» со столбцами «var1» ... «var3». Теперь я хотел бы вычислить новую «сумму» столбца из трех столбцов var. К сожалению, в каждой строке только одна переменная из трех имеет значение: var1 var2 var3 sum NA NA...
3919 просмотров
schedule 12.03.2023

excel динамически суммировать текстовую матрицу?
Так что не совсем уверен, о чем я здесь спрашиваю, но посмотрите, не могли бы вы дать мне подсказки? Допустим, у меня есть таблица планирования, как показано ниже. Я пытаюсь придумать способ иметь вторую таблицу, в которой будет указан каждый...
396 просмотров
schedule 31.07.2023

Как выполнить агрегацию и подсчет в наборе данных с помощью R?
В настоящее время я работаю с набором данных Cricket (спорт), где мне нужно найти накопленные пробежки, мячи, выбитые за год, с подсчетом лет. Ниже выдержка из набора данных введите здесь описание изображения Я пытаюсь агрегировать, как...
77 просмотров
schedule 24.01.2023

plyr суммирует длину строки ошибки подсчета
предположим, что у меня есть следующие данные: A <- c(4,4,4,4,4) B <- c(1,2,3,4,4) C <- c(1,2,4,4,4) D <- c(3,2,4,1,4) filt <- c(1,1,10,8,10) data <- as.data.frame(rbind(A,B,C,D,filt)) data <- t(data) data <-...
82 просмотров
schedule 20.06.2022

Использование dplyr для суммирования с условиями
В настоящее время я пытаюсь применить функцию суммирования, чтобы изолировать соответствующие наблюдения из большого набора данных. Здесь приводится простой воспроизводимый пример: df <- data.frame(c(1,1,1,2,2,2,3,3,3),...
721 просмотров
schedule 26.07.2022

Использование R & dplyr для подведения итогов - group_by, count, mean, sd
Доброго времени суток и привет! Это мой первый пост о переполнении стека. Я новичок в R и даже в более новом dplyr. У меня есть небольшой набор данных, состоящий из двух столбцов - var1 и var2. Столбец var1 состоит из num значений. Столбец var2...
1120 просмотров
schedule 01.01.2024

Как мне оптимизировать код dplyr по группам, если все вычисления одинаковы
У меня есть следующий фрейм данных, который является подмножеством гораздо большего, содержащего более 3 миллионов строк. df <- data.frame(Group = c(1,1,1,2,2,3,3,3,2,2,4,4,1,4,1,3,1,3,2,4,2,1,3,2,4), SubGroup =...
66 просмотров
schedule 03.03.2023

Использование summarize_all с функциями, которые требуют и не требуют аргумента na.rm = T
Наблюдения в моих данных содержатся в группах, и я пытаюсь получить несколько сводных статистических данных (например, среднее значение, медиана, длина, стандартное отклонение) для каждой группы с помощью функции summarize_all. Проблема в том, что...
255 просмотров
schedule 18.04.2023

группировать по тексту в столбцах, искать общие записи в двух фреймах данных
Я пытаюсь сравнить столбцы из двух фреймов данных, чтобы извлечь элементы, которые появляются в обоих. Конкретно: df1: state group species 1 CA 2 cat, dog, chicken, mouse 2 CA 1 cat 3 NV 1 dog, chicken 4 NV 2 chicken 5 WA 1 chicken, rat, mouse,...
30 просмотров
schedule 14.06.2023

Суммируйте переменные рядом
Ищу решение своей проблемы. Я просто могу решить это перестановкой вручную. Example code: library(dplyr) set.seed(1) Data <- data.frame( W = sample(1:10), X = sample(1:10), Y = sample(c("yes", "no"), 10, replace =...
51 просмотров
schedule 06.05.2023

R суммируется по групповой сумме, что дает NA
У меня есть такой фрейм данных Observations: 2,190,835 Variables: 13 $ patientid <int> 4489, 4489, 4489, 4489, 4489, 4489, 4489, 4489, 4489, 4489, 4489, 4489, 4489, 4489, 4489, 4489, 4489… $ preparationid <dbl> 1000307, 1000307,...
294 просмотров
schedule 29.04.2023

Как использовать суммирование из dplyr с динамическими именами столбцов?
Я суммирую групповые средства из таблицы, используя функцию summarize из пакета dplyr в R. Я хотел бы сделать это динамически, используя строку имени столбца, хранящуюся в другой переменной. Это "нормальный" способ, и он, конечно же, работает:...
258 просмотров
schedule 20.03.2023

Как поддерживать порядки факторов при использовании geom_point и geom_pointrange на одном графике?
РЕДАКТИРОВАТЬ: добавлен небольшой df. У меня есть небольшой набор данных под названием benthic_data некоторых индексов бентических беспозвоночных (ниже приведен только один показатель). Site <-...
55 просмотров
schedule 10.10.2022

Почему в этом примере sum_if не работает с bind_rows?
Я пытаюсь использовать bind_rows и summarize_if , чтобы добавить общую нижнюю строку в пример набора данных. Есть разные сообщения, связанные с этим типом вопроса, но не совсем с моей проблемой. Кроме того, некоторые опубликованные вопросы...
138 просмотров
schedule 16.10.2022

Как интерпретировать сообщение dplyr `summarize ()`, перегруппировывающее вывод по 'x' (переопределить с помощью аргумента `.groups`)?
Я начал получать новое сообщение (см. Заголовок сообщения) при запуске group_by и summarize () после обновления до версии для разработки dplyr 0.8.99.9003. Вот пример воссоздания вывода: library(tidyverse) library(hablar) df <-...
99254 просмотров
schedule 27.10.2022