У меня есть набор данных, который полностью состоит из логических переменных. Точно так же, как преобразованный набор данных о животных ниже, только с большим количеством столбцов.
# http://stats.stackexchange.com/questions/27323/cluster-analysis-of-boolean-vectors-in-r
library(cluster)
head(mona(animals)[[1]])
war fly ver end gro hai
ant 0 0 0 0 1 0
bee 0 1 0 0 1 1
cat 1 0 1 0 0 1
cpl 0 0 0 0 0 1
chi 1 0 1 1 1 1
cow 1 0 1 0 1 1
Цель состоит в том, чтобы переупорядочить строки таким образом, чтобы группы с похожими шаблонами членства было легче идентифицировать визуально.
Я подумал, что какой-то алгоритм кластеризации, вероятно, будет подходящим, но я не уверен, какие функции использовать или как это сделать.
В идеале таблица должна быть представлена в виде шахматной доски. С заштрихованными квадратами для того, является ли каждая точка истинной или ложной.