В этой четвертой части нашей серии статей об обнаружении тенденций мы рассмотрим применение кластеризации KMeans в качестве метода определения тенденций на финансовых рынках.
KMeans — это популярный алгоритм обучения без учителя для кластеризации точек данных в отдельные группы на основе сходства. Мы объясним, как работает KMeans, и, используя базовые методы, попробуем улучшить обнаружение тенденций.
Понимание кластеризации KMeans
Кластеризация KMeans — это итеративный алгоритм, целью которого является разбиение точек данных на K кластеров, где каждая точка данных принадлежит кластеру с ближайшим средним (центроидом). Основные этапы алгоритма следующие:
- Случайная инициализация: K начальных центроидов выбираются случайным образом из точек данных.
- Назначение: Каждая точка данных назначается кластеру, центроид которого находится ближе всего к ней. Это делается на основе евклидова расстояния между точкой данных и центроидом.
- Обновление центроидов: после этапа назначения центроиды кластеров обновляются как среднее значение точек данных в каждом кластере.
- Повтор: шаги 2 и 3 повторяются до тех пор, пока центроиды не сойдутся и кластеры не стабилизируются.
Конечным результатом является набор из K кластеров, и каждая точка данных связана с кластером, которому она принадлежит. KMeans — это эффективный и действенный метод группировки точек данных со схожими характеристиками.
Внедрение обнаружения тенденций с помощью KMeans
Чтобы оптимизировать наш код и обеспечить согласованную обработку данных, мы будем использовать те же базовые методы и набор данных, что и в части 1. Используя возможности кластеризации KMeans, мы стремимся улучшить способность идентифицировать и различать различные рыночные тенденции.
Давайте рассмотрим кодовую реализацию обнаружения тренда с помощью KMeans…