Проекты - Предиктивная модель оттока и скоринг клиентов

ML-модель, которая прогнозирует вероятность оттока клиента в горизонте 30/60/90 дней. Интегрируется с CRM и даёт объяснение для каждого предсказания.

Формат
Демо-проект
Тип системы
Data Science и предиктивная аналитика
Отрасли
финтех, SaaS, телеком, подписочный бизнес

Предсказывает, кто из клиентов собирается уйти, и объясняет, почему — чтобы менеджер мог действовать заранее.

История клиента, платежи, поддержка
Модель оттока на 30/60/90 дней
Риск и объяснение прямо в CRM

Задача

Компания, работающая по подписочной или клиентской модели (SaaS, телеком, финтех, e-commerce с подпиской), не знает заранее, кто из клиентов собирается уйти. Маркетинг работает по всем одинаково, ретеншн-бюджет расходуется неэффективно, ценные клиенты уходят без попыток удержания.

По данным открытых исследований, удержать существующего клиента в 5–7 раз дешевле, чем привлечь нового. Но без прогноза оттока нет способа адресно работать с удержанием — приходится либо стрелять из пушки по воробьям, либо реагировать уже после ухода.

Классические подходы в стиле «клиент не заходил 30 дней → риск оттока» слишком грубые: они ловят уже случившийся отток, а не предсказывают его.

Что мы построили

ML-систему полного цикла: от сбора данных и обучения модели до интеграции с CRM и мониторинга в проде.

Feature engineering:

  • На основе данных о клиенте собираем широкий набор признаков: частота и глубина использования продукта, динамика платежей, качество взаимодействия с поддержкой (количество тикетов, тональность), поведенческие сигналы (падение активности, изменение паттернов использования).
  • Временные окна — 7, 30, 90 дней — чтобы модель видела не только текущее состояние, но и динамику.
  • Feature store на базе Feast для переиспользования признаков между моделями и консистентности между обучением и инференсом.

Модель:

  • CatBoost как базовая модель — хорошо работает с категориальными признаками и табличными данными, не требует тщательной подготовки.
  • Обучение с учётом дисбаланса классов (отток обычно редкое событие).
  • Отдельные модели для горизонтов 30, 60, 90 дней — это разные задачи, и одна универсальная модель работает хуже трёх специализированных.
  • Калибровка вероятностей через изотоническую регрессию, чтобы скор соответствовал реальной вероятности оттока.

Объяснимость:

  • Для каждого предсказания считаются SHAP-значения. Менеджер видит топ-5 факторов, которые повлияли на конкретный скор: «снижение активности на 40% за 30 дней», «2 тикета с негативной тональностью», «пропущенный платёж».
  • Это критично для принятия решений: менеджер не просто получает «риск высокий», а понимает, что именно с клиентом не так и как реагировать.

Интеграция с CRM:

  • Скор и категория риска обновляются ежедневно и прокидываются в CRM (amoCRM, Битрикс24, HubSpot). Менеджер видит индикатор риска на карточке клиента.
  • Сегменты для маркетинга: клиенты с высоким риском попадают в ретеншн-кампании.

Мониторинг в проде:

  • Отслеживание drift признаков — если распределение входных данных меняется, модель может начать ошибаться.
  • Регулярное переобучение по расписанию с оценкой качества на hold-out выборке.
  • MLflow для трекинга экспериментов, версионирования моделей и развёртывания.

Стек технологий

  • Python
  • CatBoost / LightGBM
  • SHAP
  • Feast feature store
  • Airflow
  • MLflow
  • PostgreSQL / ClickHouse
  • amoCRM / Bitrix24

Метрики системы

качество модели на тесте
ROC-AUC ~0.86
precision на топ-10% риска
~0.72
предсказаний с объяснением SHAP
100%
обновление скоров в CRM
ежедневно

Что показывает этот проект

  • Классический ML на проде. Не все задачи нужно решать LLM — для предиктивной аналитики по табличным данным CatBoost работает лучше, быстрее и дешевле. Мы выбираем инструмент под задачу.
  • Объяснимость как часть продукта. SHAP — это не исследовательская функция, это интерфейс для бизнеса. Без него модель превращается в «чёрный ящик, которому никто не доверяет».
  • MLOps-зрелость. Feature store, version control моделей, мониторинг drift, регулярное переобучение. Именно это отличает модель, которая живёт в проде, от модели, которая работает только на демо.
  • Интеграция с CRM. ML-модель в вакууме бесполезна. Ценность появляется, когда менеджер видит риск прямо на карточке клиента и может действовать.

Другие наши проекты.

AI-анализ тендерной документации

Пайплайн на базе LLM, который читает тендерную документацию, извлекает ключевые поля и помогает решить, стоит ли вообще участвовать в тендере.

Подробнее

HR-ассистент на корпоративных данных

Гибрид RAG и агентных инструментов: отвечает на вопросы сотрудников, оформляет заявки, взаимодействует с HR-системами и корпоративной базой знаний.

Подробнее

Готовы обсудить задачу?

Начнём с бесплатного 30-минутного AI-аудита. Разберём ваши процессы и честно скажем, где AI даст эффект, а где нет.

Наши контакты

  • Россия, Ростов-на-Дону
    344019, Ростовская область, г.о. город Ростов-на-Дону, г. Ростов-на-Дону, ул. 11-я Линия, зд. 39
  • start@qwerty.digital
    8 (995) 797 17 17
    Telegram: @qwerty_digital_bot