La prédiction du churn est la pratique consistant à scorer chaque client selon sa probabilité de résilier ou de faire un downgrade avant qu’il ne le fasse réellement, afin qu’un CSM puisse intervenir tant qu’il reste du temps pour changer l’issue. Elle transforme la rétention d’une fonction réactive — réagir une fois l’email de résiliation arrivé — en une fonction proactive — travailler le compte à risque 60 à 90 jours à l’avance.
Ce n’est pas la même chose qu’un health score, et ce n’est pas la même chose que le taux de churn. Un health score est un instantané composite de l’état du compte ; le taux de churn est un input rétrospectif de GRR/NRR qui vous dit ce qui s’est déjà produit. La prédiction du churn est une probabilité prospective : « ce compte a 38 % de chances de ne pas renouveler dans les 90 prochains jours ». Un health score peut être un input de cette probabilité, mais les deux sont des objets distincts.
Les indicateurs avancés qui font réellement bouger le modèle
Un modèle de churn ne vaut que ce que valent ses features. Les signaux qui portent le plus de poids, à peu près dans l’ordre :
- Déclin de l’usage produit. L’indicateur avancé le plus fort. Pas l’usage absolu — la tendance. Un nombre de logins qui chute de 40 % d’un trimestre à l’autre prédit le churn bien mieux qu’un usage faible mais stable. Suivez les utilisateurs actifs hebdomadaires par compte, la profondeur d’adoption des features, et les seats provisionnés vs. les seats actifs.
- Départ du champion. Quand votre economic buyer ou votre power user quitte l’entreprise, le risque de renouvellement bondit. Détectez-le via les emails qui rebondissent, les changements de titre sur LinkedIn, ou une chute soudaine de l’activité de ce contact.
- Signal du support. Volume de tickets en hausse, CSAT en baisse, escalades répétées, ou — contre-intuitivement — une chute à zéro (le compte a cessé d’essayer).
- Engagement avec le CS. QBR manquées, taux d’ouverture d’email en baisse, réponses lentes, absences aux appels.
- Signaux commerciaux. Paiements en retard, demandes de downgrade, procurement réclamant des conditions au mois, contraction au niveau de la ligne d’article.
- Onboarding raté. Les comptes qui n’atteignent jamais la première valeur (TTV) churnent à des multiples des comptes qui y parviennent. La fenêtre d’onboarding de 90 jours est l’input de prédiction au plus fort levier dont vous disposez.
Un modèle qui s’appuie uniquement sur l’usage ratera entièrement les classes départ-du-champion et commerciale, raison pour laquelle les scores purement basés sur la télémétrie produit sous-prédisent en enterprise.
Modèles de scoring, du moins cher au plus défendable
- Modèle de règles / seuils. Règles écrites à la main : « usage en baisse de plus de 30 % ET une QBR manquée ET moins de 90 jours avant le renouvellement → à risque ». Transparent, explicable au CSM, peu coûteux à construire, facile à contourner. Là où la plupart des équipes devraient commencer.
- Scorecard pondéré. Attribuez des points par signal, additionnez, classez en vert/jaune/rouge. C’est ce que la plupart des features de health score dans Gainsight, ChurnZero et Vitally fournissent par défaut. Mieux que rien ; les poids sont généralement devinés, pas ajustés.
- ML supervisé (régression logistique, gradient boosting). Entraînez sur du churn historique labellisé. C’est de là que vient le vrai lift — le modèle apprend les poids et les interactions au lieu que vous les deviniez. Nécessite un dataset labellisé propre : au minimum quelques centaines d’événements de churn avec l’historique des features au moment du risque, pas au moment de la résiliation (sinon vous faites fuiter le label).
Évaluez avec precision/recall et une matrice de confusion, pas avec l’« accuracy ». Sur un taux de churn annuel de base de 8 %, un modèle qui prédit « personne ne churne » a 92 % d’accuracy et est totalement inutile. Ce qui vous importe : parmi les comptes que le modèle a marqués en rouge, combien ont réellement churné (precision), et parmi les comptes qui ont churné, combien le modèle a-t-il marqués à temps (recall).
Où l’IA aide — et où elle promet trop
Où elle aide réellement : le ML bat les scorecards ajustés à la main quand vous avez assez d’historique labellisé, parce qu’il trouve des interactions non évidentes (un usage faible est acceptable pour un compte qui se connecte toujours mensuellement pour exporter un rapport ; c’est une alerte à cinq cloches pour un compte qui était auparavant quotidien). Les LLM sont bons sur la couche non structurée que les scorecards ignorent — résumer la tendance de sentiment sur une année de tickets de support et d’emails, ou signaler « le champion a l’air désengagé » à partir des transcriptions d’appels. Utilisez le LLM pour enrichir les features, pas pour être le classifieur.
Où elle promet trop : trois modes d’échec reviennent. D’abord, le problème de cold-start — un modèle a besoin de churn labellisé pour apprendre, et une entreprise au stade Seed avec 40 clients et 3 événements de churn n’a rien sur quoi s’entraîner. Acheter une feature de « prédiction du churn par IA » là est du théâtre ; utilisez des règles. Ensuite, la confusion sur le taux de base vendue comme de l’accuracy — les vendors citent « 90 % d’accuracy » contre un taux de churn de base faible où le modèle naïf est déjà à 92 %. Demandez toujours precision et recall sur les drapeaux rouges. Enfin, la prédiction sans prescription — une probabilité sur laquelle personne n’agit est une décoration de dashboard. Le modèle doit alimenter un playbook (créer automatiquement une tâche de save, déclencher un outreach exécutif, escalader vers le renewal manager), sinon il ne change rien.
Pièges courants
- Fuite de label (label leakage). Features d’entraînement capturées au moment de la résiliation (usage déjà à zéro, tickets de support déjà clos) au lieu de l’horizon de prédiction. Le modèle paraît brillant hors ligne et échoue en production. Garde-fou : prenez l’instantané des features à 90 jours avant l’événement de churn, jamais le jour même.
- Agir trop tard. Une fenêtre de prédiction de 30 jours est trop courte pour sauver un renouvellement enterprise — la décision a été prise il y a des mois. Prédisez à 60-90 jours en enterprise, où la motion de save a de la piste.
- Un seul modèle pour tous les segments. Le churn SMB self-serve (prix, faible usage) et le churn enterprise (perte du champion, désalignement exécutif) ont des drivers différents. Un seul modèle les mélange en bouillie. Segmentez d’abord, puis modélisez.
- Scoring sans ownership. Un drapeau rouge sans CSM nommé et sans SLA pour agir meurt dans le dashboard. Associez chaque compte rouge à un propriétaire et à une règle de « répondre sous X jours ».
Associés
- Customer health score — le composite qui alimente souvent le modèle
- Customer churn — l’issue que vous prédisez
- Calcul du taux de churn — la mesure rétrospective
- NRR vs GRR — là où la rétention apparaît financièrement
- Métriques de Customer Success — l’ensemble de métriques plus large