Предоставляет ли Matlab какое-либо средство для оценки методов кластеризации? (компактность кластера и разделение кластера. ....) Или для этого есть какой-нибудь набор инструментов?
Показатели качества кластера
Ответы (4)
Не в Matlab, но ELKI (Java) предоставляет около дюжины показателей качества кластера для оценки.
Matlab предоставляет индекс Silhouette и набор инструментов CVAP: платформа анализа достоверности кластера для Matlab. Который включает в себя следующие показатели валидности:
- Дэвис-Булдин
- Калински-Харабаш
- Индекс Данна
- Индекс R-квадрата
- Юбер-Левин (C-индекс)
- Индекс Кржановского-Лая
- Индекс Хартигана
- Индекс среднеквадратичного стандартного отклонения (RMSSTD)
- Получастичный индекс R-квадрата (SPR)
- Индекс расстояния между двумя кластерами (CD)
- взвешенный межвнутренний индекс
- Индекс однородности
- Индекс разделения
Обратите внимание, что вам могут понадобиться предварительно скомпилированные двоичные файлы LIBRA для вашей платформы.
Вы можете попробовать Силуэтный график из набора инструментов статистики.
Пример см. в этой документации.
Имейте в виду, что Silhouette в Matlab имеет странное поведение для одноэлементных кластеров. Одиночкам он присваивает 1 балл, тогда как для меня более разумным подходом было бы присвоить 0 этим кластерам. В реализации Matlab, если вы укажете количество кластеров как количество объектов, Силуэт даст вам оценку 1.