Нормализация данных, когда один столбец содержит дискретные подмножества значений (в R) [дубликаты]

Я понимаю, что это может быть проблема перестановки с моей стороны, но я просто не могу представить, как это лучше всего сделать.

Я могу выполнить шаги, включенные в другие вопросы о нормализации, например здесь и здесь, но моя проблема в том, что мои данные (приведенный ниже образец) записывают различные показатели "вариации". Итак, SE, SD и т. д. Меня не интересует, что они измеряли, и мне не интересно, как сайты сравниваются в цифрах. Этот последний пункт я не знаю, как описать, потому что мои статистические знания плохи, я имею в виду, что если сайт 1 имеет значения 1-10, а сайт 2 имеет значения 11-20, я хочу сравнить распределения вариаций между другой категорией ( в примере ниже это «Res», «Un», «Ref»). Поэтому я хочу нормализовать переменную «оценка» ниже, но индивидуально для каждого сайта.

Я хочу в основном использовать scale(d), но добавить аргумент, аналогичный group =, при построении графиков, чтобы масштабировать дискретные группы в столбце переменных.

Я надеюсь, что это имеет смысл, и дайте мне знать, если какая-либо дополнительная информация может быть полезна.

site score treatment
2 0.055 Un
2 0.055 Res
3 2 Res
3 3 Ref
3 1 Un
4 66 Res
4 0.6 Res
4 11 Un

r normalization standardized

sleepy 21.03.2020 источник

comment

это немного сложно понять, можете ли вы предоставить поддельную цифру или результаты того, что вам нужно? - Nakx 21.03.2020

comment

Это должно привести вас туда, куда вы хотите, вы не можете использовать обычный масштаб, потому что он не будет векторизоваться, но с помощью tidyverse/dplyr вы можете создавать свои собственные сгруппированные нормализаторы: stackoverflow.com/questions/43680246/normalize-by-group - sconfluentus 21.03.2020

comment

Вы хотите сгруппировать 1) по сайту или 2) как по сайту, так и по лечению? - Rui Barradas 21.03.2020

Нормализация данных, когда один столбец содержит дискретные подмножества значений (в R) [дубликаты]

Похожие вопросы