У меня есть набор предложений с разным количеством слов в каждом предложении. Мне нужно заменить каждое слово строкой букв, но строка букв должна основываться на определенных критериях. Например, букву «т» можно заменить только буквами «и», «л», «ф»; букву «е» можно заменить только на «о» или «с» и т. д. для каждой буквы алфавита. Также необходимо сохранить пробелы между словами, а также точки, апострофы и другие знаки препинания. Следующий пример: ИСХОДНОЕ ПРЕДЛОЖЕНИЕ: Он любит собаку. ПРЕДЛОЖЕНИЕ СО СТРОКОЙ БУКВ: Fc tcwoz bcy.
Есть ли способ автоматизировать эту процедуру в R? Спасибо.
ДОБАВЛЕНО: мне нужно сделать эту замену около 400 предложений. Предложения хранятся в переменной фрейма данных (data$sentences).
strsplit
. вы можете использовать аргумент split=, чтобы получить каждый символ как отдельный элемент. Затем вы бы построили какое-то отображение. Наконец-то собрал его вместе сpaste(..., collapse="")
. Без более подробной информации о сопоставлении дальнейшая помощь невозможна. - person lmo   schedule 19.10.2016