Я понимаю, что это может быть проблема перестановки с моей стороны, но я просто не могу представить, как это лучше всего сделать.
Я могу выполнить шаги, включенные в другие вопросы о нормализации, например здесь и здесь, но моя проблема в том, что мои данные (приведенный ниже образец) записывают различные показатели "вариации". Итак, SE, SD и т. д. Меня не интересует, что они измеряли, и мне не интересно, как сайты сравниваются в цифрах. Этот последний пункт я не знаю, как описать, потому что мои статистические знания плохи, я имею в виду, что если сайт 1 имеет значения 1-10, а сайт 2 имеет значения 11-20, я хочу сравнить распределения вариаций между другой категорией ( в примере ниже это «Res», «Un», «Ref»). Поэтому я хочу нормализовать переменную «оценка» ниже, но индивидуально для каждого сайта.
Я хочу в основном использовать scale(d)
, но добавить аргумент, аналогичный group =
, при построении графиков, чтобы масштабировать дискретные группы в столбце переменных.
Я надеюсь, что это имеет смысл, и дайте мне знать, если какая-либо дополнительная информация может быть полезна.
site score treatment
2 0.055 Un
2 0.055 Res
3 2 Res
3 3 Ref
3 1 Un
4 66 Res
4 0.6 Res
4 11 Un
tidyverse/dplyr
вы можете создавать свои собственные сгруппированные нормализаторы: stackoverflow.com/questions/43680246/normalize-by-group - person sconfluentus   schedule 21.03.2020