Я хотел бы использовать функцию removeWords
(stopwords("english")
) через: corpus <- tm_map(corpus,removeWords, stopwords("english"))
, но некоторые слова, такие как «не», и другие отрицания, которые я хотел бы сохранить.
Можно ли использовать функцию removeWords, stopwords("english")
, НО исключить определенные слова из этого списка, если они указаны?
Как я могу предотвратить удаление, например, «не»?
(Вторичное) можно ли установить этот тип контрольного списка на все «отрицания»?
Я бы предпочел не прибегать к созданию собственного пользовательского списка только со словами из этого стоп-листа, которые меня интересуют.