Сила машинного обучения в бизнесе

В этой статье я покажу вам, как компания (в данном случае банк) может извлечь выгоду из прикладной науки о данных с точки зрения качества обслуживания клиентов и экономического роста. Объясняя, что я буду использовать данные, полученные в результате исследований и опросов, чтобы поддержать положительные результаты реализации стратегий науки о данных.

Бизнес-проблема:

Согласно исследованию рынка, проведенному hubspot.com и hockeystack.com:

  • Уровень удержания клиентов составляет около 75% в банковской сфере, что означает, что 25% клиентов покидают банки.
  • Это создает огромную проблему для организации, поскольку средняя стоимость потери клиента составляет приблизительно 240$ для бизнеса.
  • Средняя стоимость привлечения клиента составляет около 640 долларов США в сфере финансовых услуг.
  • Кроме того, затраты на привлечение нового клиента в 5 раз выше, чем на удержание существующего клиента.

В долгосрочной перспективе стоимость потерянных клиентов может достигать миллионов, а то и миллиардов долларов. Помимо потери денег, предприятия также теряют долю рынка, признание и престиж.

То же исследование показывает, что более 70% клиентов убеждены в том, что они останутся со своим брендом, если клиентский опыт находится на приемлемом уровне, и их бренд заставляет их чувствовать себя особенными, используя такие методы, как программы лояльности и персонализированные скидки.

Однако эти усилия часто требуют значительных затрат времени, энергии и финансовых ресурсов, что может быть непросто, учитывая большую клиентскую базу, конкурентную среду и экономические ограничения. Но что, если бы у банков была возможность идентифицировать клиентов, которые могут уйти, пока не стало слишком поздно? Что, если бы они могли заранее решать проблемы недовольных клиентов без необходимости дорогостоящих исследований клиентского опыта или утомительных опросов?

Решение проблемы

Здесь на сцену выходит наука о данных. Сегодня модели машинного обучения могут довольно точно предсказывать поведение клиентов, когда им предоставляются данные.

Модели машинного обучения позволяют компаниям получать представление об их текущих и будущих сценариях, позволяя им заранее формировать результаты посредством стратегических вмешательств. Например, организации могут использовать эти модели для выявления клиентов, которым грозит отток, и принимать упреждающие меры, чтобы понять их ожидания, решить их проблемы и укрепить отношения. Эта способность обеспечивает значительное преимущество, позволяя предприятиям сохранять и развивать свою клиентскую базу, открывая множество преимуществ, связанных с лояльностью и удовлетворенностью клиентов.

Кроме того, затраты, связанные с внедрением таких приложений, чрезвычайно низки, поскольку организации могут выборочно нацеливаться на недовольных клиентов и выделять дополнительные ресурсы для решения их проблем. Во многих случаях простой телефонный звонок или небольшая скидка могут эффективно решить проблемы и удержать этих клиентов.

Мой проект

Теперь пришло время применить модель машинного обучения. Как специалист по данным, я хотел решить эту проблему, и я составил модель машинного обучения, используя данные банка, чтобы предсказать потенциальных оттоков в пуле клиентов.

Исследовательский анализ данных

Начальная фаза проекта включает исследование данных, где я провел исследовательский анализ набора данных. Исследовательский анализ данных (EDA) был направлен на получение информации о различных аспектах данных, включая типы данных, размер, основные показатели тенденции (среднее значение, медиана, стандартное отклонение и т. д.), наличие пропущенных значений и выявление выбросов. Тщательно изучив эти факторы, я получил представление о характеристиках набора данных, что позволило мне принимать обоснованные решения.

Визуализация

Кроме того, я создал интерактивную панель инструментов Tableau, которая отражает взаимосвязь между различными атрибутами клиентов, такими как пол, страна, кредитный рейтинг и остаток на банковском счете. Эта интерактивная информационная панель отвечает на некоторые вопросы, которые могут возникнуть, например: «Каков средний возраст, кредитный рейтинг и банковский счет клиентов, которые уходят?» или «Сколько пользователей кредитных карт находятся в возрасте от 40 до 50 лет?»

Очистка данных

Благодаря ценным выводам, полученным в ходе исследования, я продолжил обработку данных, используя различные методы, такие как логарифмические преобразования, преобразования типов и эффективную обработку пропущенных значений и выбросов. Процесс очистки данных обеспечил оптимизацию набора данных для более поздних этапов разработки модели.

Разработка функций

Затем я сформулировал гипотезы о создании новых функций на основе результатов исследования данных. После повторного этапа проб и ошибок я определил новые функции, которые повысили производительность модели, и удалил те, которые оказались обузой. В конце концов усилия, которые я вложил в процесс разработки функций, окупились.

Моделирование

Я использовал модели Extreme Gradient Boosting (XGBoost), Light Gradient-Boosting Machine (LGBM) и категориальное усиление (Catboost) для прогнозирования оттока. . Первоначальное сравнение производительности показало, что средний уровень точности составляет около 90 %.Результаты уже были многообещающими, но я изменил параметры наиболее эффективной модели (XGBoost), чтобы извлечь крошка повышения производительности. Несмотря на цикл пробной ошибки, настройка параметров не повысила общую производительность.

Однако я не сдался и решил сложить модели вместе. Удивительно, но составная модель превзошла отдельные компоненты, что привело к увеличению производительности на 1%.

Технические подробности о проекте можно увидеть в этом репозитории GitHub.

Оценка и коммерческая ценность

Значения показателей для окончательной модели следующие:

Показатель точности. Модель продемонстрировала замечательную точность 91%, правильно определяя, уйдет ли клиент или нет. Такой высокий уровень точности подчеркивает способность модели делать точные прогнозы и дает ценную информацию для процессов принятия решений в банке.

Показатель точности.Показатель точности 88% указывает на то, что когда модель предсказывала потенциального оттока клиента, 88% этих клиентов действительно ушли. . Эта ценная информация позволяет банку эффективно распределять ресурсы, сосредотачиваясь на клиентах, которые с наибольшей вероятностью уйдут, и разрабатывая стратегии вмешательства специально для них. Используя эту модель, банк может оптимизировать свои усилия, выделяя 88% ресурсов на удержание оттока клиентов и минимизируя ресурсы, выделяемые клиентам, которые с меньшей вероятностью отточат.

Показатель отзыва. При показателе отзыва 93 % модель успешно выявила 93 % ушедших клиентов в клиентской базе. Это означает, что у банка есть возможность заблаговременно охватить 93% клиентов, которым грозит отток, что позволяет своевременно вмешиваться и применять целевые стратегии удержания. Возможность захватить такую ​​значительную часть оттока клиентов позволяет банку принимать упреждающие меры и эффективно снижать отток клиентов. Только небольшая часть, 7% отстающих, потенциально может остаться незамеченной моделью.

Пусть говорят цифры

Теперь я посчитаю приблизительную денежную выгоду, если бы очень маленький банк с 10 000 клиентов использовал эту модель ML. Мои предположения основаны на результатах исследований, они таковы:

  • Стоимость привлечения одного клиента = 5 x Удержание одного клиента = 640$.
  • Стоимость хранения: 640/5 = 128$
  • Прибыль, полученная за счет удержания одного клиента вместо поиска нового: 640 - 128 = 512$.
  • Показатель успеха стратегий удержания: 70%
  • Количество клиентов = 10000
  • Уровень оттока составляет 25%.

Модель может обнаруживать 93 % отмен.

Прогнозы модели по оттоку клиентов точны на 88%.

Количество клиентов, которых потенциально можно лечить:

10000 * 0.25 * 0.93 * 0.88 = 2046

Потенциальное снижение затрат (полученная прибыль) за счет обращения с клиентами:

2046 * 512 = 1,047,552 $

Прибыль при 70% успешности стратегий удержания.

((2046 * 0.7) * 512) - ((2046 * 0.3)* 128) = 654,720$

Используя возможности машинного обучения, банк не только достигает значительной финансовой экономии, но и получает множество дополнительных преимуществ, таких как смягчение негативных отзывов, открытие новых возможностей продаж и повышение лояльности клиентов.

Однако только с точки зрения прямого денежного воздействия инвестиции банка в модель машинного обучения приводят к существенной экономии, превышающей полмиллиона долларов. Эта существенная финансовая выгода подчеркивает эффективность и ценность внедрения расширенной аналитики в операции банка, что укрепляет его конкурентное преимущество в отрасли.

Прогнозное моделирование, как и прогнозирование оттока клиентов, не ограничивается банковской отраслью, но может применяться в различных компаниях, обладающих соответствующими данными. Хотя этот проект специально ориентирован на банковскую сферу, используемые методологии могут быть адаптированы и внедрены в других отраслях, чтобы получить ценную информацию о поведении клиентов.

Я приветствую любые предложения или отзывы об используемых методах, поскольку постоянное совершенствование и уточнение жизненно важны в области науки о данных. Для получения более подробной информации о проекте, пожалуйста, перейдите по следующим ссылкам: