Проекты - Предиктивная модель оттока и скоринг клиентов

ML-модель, которая прогнозирует вероятность оттока клиента в горизонте 30/60/90 дней. Интегрируется с CRM и даёт объяснение для каждого предсказания.

Формат: Демо-проект
Тип системы: Data Science и предиктивная аналитика
Отрасли: финтех, SaaS, телеком, подписочный бизнес

Как это работает

Предсказывает, кто из клиентов собирается уйти, и объясняет, почему — чтобы менеджер мог действовать заранее.

1
История клиента, платежи, поддержка
2
Модель оттока на 30/60/90 дней
3
Риск и объяснение прямо в CRM

live · пример

Запрос

Клиент на Pro-тарифе, 14 месяцев, активность упала на 60% за 30 дней

обработка

Ответ системы

Риск оттока: 78% в ближайшие 30 дней. Основные факторы: падение использования (−60%), два негативных тикета, пропущен последний платёж.

Задача

Компания, работающая по подписочной или клиентской модели (SaaS, телеком, финтех, e-commerce с подпиской), не знает заранее, кто из клиентов собирается уйти. Маркетинг работает по всем одинаково, ретеншн-бюджет расходуется неэффективно, ценные клиенты уходят без попыток удержания.

По данным открытых исследований, удержать существующего клиента в 5–7 раз дешевле, чем привлечь нового. Но без прогноза оттока нет способа адресно работать с удержанием — приходится либо стрелять из пушки по воробьям, либо реагировать уже после ухода.

Классические подходы в стиле «клиент не заходил 30 дней → риск оттока» слишком грубые: они ловят уже случившийся отток, а не предсказывают его.

Что мы построили

ML-систему полного цикла: от сбора данных и обучения модели до интеграции с CRM и мониторинга в проде.

Feature engineering:

На основе данных о клиенте собираем широкий набор признаков: частота и глубина использования продукта, динамика платежей, качество взаимодействия с поддержкой (количество тикетов, тональность), поведенческие сигналы (падение активности, изменение паттернов использования).
Временные окна — 7, 30, 90 дней — чтобы модель видела не только текущее состояние, но и динамику.
Feature store на базе Feast для переиспользования признаков между моделями и консистентности между обучением и инференсом.

Модель:

CatBoost как базовая модель — хорошо работает с категориальными признаками и табличными данными, не требует тщательной подготовки.
Обучение с учётом дисбаланса классов (отток обычно редкое событие).
Отдельные модели для горизонтов 30, 60, 90 дней — это разные задачи, и одна универсальная модель работает хуже трёх специализированных.
Калибровка вероятностей через изотоническую регрессию, чтобы скор соответствовал реальной вероятности оттока.

Объяснимость:

Для каждого предсказания считаются SHAP-значения. Менеджер видит топ-5 факторов, которые повлияли на конкретный скор: «снижение активности на 40% за 30 дней», «2 тикета с негативной тональностью», «пропущенный платёж».
Это критично для принятия решений: менеджер не просто получает «риск высокий», а понимает, что именно с клиентом не так и как реагировать.

Интеграция с CRM:

Скор и категория риска обновляются ежедневно и прокидываются в CRM (amoCRM, Битрикс24, HubSpot). Менеджер видит индикатор риска на карточке клиента.
Сегменты для маркетинга: клиенты с высоким риском попадают в ретеншн-кампании.

Мониторинг в проде:

Отслеживание drift признаков — если распределение входных данных меняется, модель может начать ошибаться.
Регулярное переобучение по расписанию с оценкой качества на hold-out выборке.
MLflow для трекинга экспериментов, версионирования моделей и развёртывания.

Стек технологий

Python
CatBoost / LightGBM
SHAP
Feast feature store
Airflow
MLflow
PostgreSQL / ClickHouse
amoCRM / Bitrix24

Метрики системы

качество модели на тесте: ROC-AUC ~0.86
precision на топ-10% риска: ~0.72
предсказаний с объяснением SHAP: 100%
обновление скоров в CRM: ежедневно

Вклад факторов в риск оттока (пример клиента)

Падение использования0.80

Негативные тикеты0.55

Пропущенный платёж0.50

Снижение логинов0.35

Что показывает этот проект

Классический ML на проде. Не все задачи нужно решать LLM — для предиктивной аналитики по табличным данным CatBoost работает лучше, быстрее и дешевле. Мы выбираем инструмент под задачу.
Объяснимость как часть продукта. SHAP — это не исследовательская функция, это интерфейс для бизнеса. Без него модель превращается в «чёрный ящик, которому никто не доверяет».
MLOps-зрелость. Feature store, version control моделей, мониторинг drift, регулярное переобучение. Именно это отличает модель, которая живёт в проде, от модели, которая работает только на демо.
Интеграция с CRM. ML-модель в вакууме бесполезна. Ценность появляется, когда менеджер видит риск прямо на карточке клиента и может действовать.

Наши контакты

Проекты - Предиктивная модель оттока и скоринг клиентов

Предсказывает, кто из клиентов собирается уйти, и объясняет, почему — чтобы менеджер мог действовать заранее.

Задача

Что мы построили

Стек технологий

Метрики системы

Что показывает этот проект

Другие наши проекты.

ai_hub — платформа для прототипирования AI-фич

AI-движок для онлайн-образования

Готовы обсудить задачу?

Наши контакты