Я использовал функцию compare.cloud в пакете wordcloud в R. Слово «хорошо» появилось в категориях Cat1 (27 раз) и Cat2 (33 раза), однако в wordcloud оно появляется только в категории Cat1 по некоторым причинам (возможно, потому, что это первый столбец).
Можете ли вы подсказать, как его настроить, чтобы получить все слова (даже если это одни и те же слова в нескольких категориях). Это важный вывод для моего набора данных, и он не дает возможности сравнивать облако, когда удаляет самое важное слово из Cat2.
Данные выглядят так:
Cat1 Cat2 Cat3
хорошо --- 27 -------- 33 --------- 3
плохо --- 10 ----------- 6 --------- 4
...
Код:
облако слов сравнения
tdm = read.table ("doc.csv")
png ("compareision_wordcloud.png", ширина = 1280, высота = 800)
compare.cloud (tdm, colors = brewer.pal (nemo, "Dark2"), use.r.layout = FALSE,
scale = c(4,.5), max.words = 1000, rot.per=.1, random.order = FALSE, title.size = 2)
Дайте мне знать, если это можно быстро исправить.