Проверка индекса Дэвиса-Булдина — это, в основном, соотношение внутри кластерного разброса и между кластерными расстояниями. Мы повторяем это для всех кластеров и, наконец, берем maximum
. Мой вопрос здесь: почему максимум, а не минимум?
Спасибо.
Проверка индекса Дэвиса-Булдина — это, в основном, соотношение внутри кластерного разброса и между кластерными расстояниями. Мы повторяем это для всех кластеров и, наконец, берем maximum
. Мой вопрос здесь: почему максимум, а не минимум?
Спасибо.
Рассмотрим следующий сценарий:
Три кластера. Один хорошо отделен от других, два объединены.
Пусть S_i будет 0,5 для всех из них.
Для объединенных M_ij близок к нулю. Для хорошо разделенных расстояние между средними намного больше. Результирующий R_i велик для объединенных кластеров и мал для разделенных кластеров.
Если брать максимум, то индекс говорит "два кластера перепутаны, поэтому результат плохой - не все кластеры хорошо разделены". Если бы вы использовали минимум, он бы проигнорировал эту проблему и сказал бы "ну, по крайней мере, он отделил их от одного из других кластеров".