Я использую RStudio, R Markdown, Latex и Pandoc для очистки данных, построения переменных, запуска анализа и отчета о результатах. Я новичок в концепции воспроизводимых исследований, но я зацепился. Имеет большой смысл.
Динамические таблицы и рисунки не проблема. Однако динамический текст ставит меня в тупик. Я могу вставить встроенный код, чтобы сказать, что 95% всей статистики ложны, но я не уверен, как я могу изменить свой язык воспроизводимым образом.
Например, что, если у меня есть объект x=0,66, и я хочу написать «2 из 3 стоматологов используют Crest»? Я могу посмотреть на текущее значение x, 0,66, и набрать в тексте "2 из 3", но это не воспроизводимо. Допустим, я получаю новые данные и повторно запускаю свой анализ, и x становится равным 0,52. Мой текст будет устаревшим. Конечно, я мог бы динамически сообщать, что 52% стоматологов предпочитают Crest, но отчет становится устаревшим, если все сообщается в процентах.
Я думаю, что я мог бы создать функции, которые я мог бы вызывать в тексте, когда я хочу изменить написание. Например, функция «out.of» может работать с операторами if else для создания текста:
ifelse(x < 0.09,"fewer than 1 out of 10",
ifelse(x >= 0.09) & x < 0.11,"roughly 1 out of 10",
ifelse(x >= 0.11 & x < 0.15,"slightly more than 1 out of 10",
ifelse(x >= 0.15 & x < 0.19,"nearly 2 out of 5",
ifelse(x >= 0.19 & x < 0.21,"roughly 2 out of 5",
...
ifelse(x >= 0.95 & x < 0.99,"nearly all",
ifelse(x >= 0.99,"all","fubar"))...)
Я также мог бы создать дробную функцию, которая делала бы что-то подобное для одной десятой, двух пятых, одной трети...
Я уверен, что другие уже занимались этой проблемой. Есть зацепки? Идеи?
cut()
и указать метки вместоifelse()
. Я не думаю, что какой-либо из пакетов сделает это за вас, но они должны помочь вам в этом! - person A5C1D2H2I1M1N2O1R2T1   schedule 30.12.2012