Le churn, ou attrition client, est un sujet clé pour les entreprises et c’est aujourd’hui un des cas d’utilisation de la data science le plus accessible. Dans cette série d’articles, nous vous proposons de découvrir la méthode de développement d’un algorithme de modélisation du churn. Cette série d’articles a été écrite dans un souci de vulgarisation et ne nécessite pas d’expertise préalable pour sa lecture.
Ce premier billet décrit les tâches de cadrage à effectuer en amont de la phase de développement afin de s’assurer que le modèle sera bien aligné avec les attentes du métier et cohérent vis à vis de l’utilisation qui en sera faite.
Cas d’utilisation et cadrage
Définition générique du churn
La définition exacte du churn étant propre à chaque entreprise, nous nous limitons pour l’instant à le définir de manière générique comme la perte de clients.
En pratique l’identification du churn n’est pas toujours possible, elle dépend du type de produit et du moyen de distribution utilisé.
Stratégies marketing de lutte contre le churn
Pour lutter contre le churn certaines entreprises mettent en place des stratégies marketing dites réactives, a posteriori du churn. Ces efforts marketing sont souvent peu efficaces puisqu’ils sont réalisés trop tard, une fois que le client a déjà pris sa décision.
La détection des signaux faibles du churn constitue donc un enjeu clé pour les entreprises. En effet, la capacité à identifier les clients à risque de churn permet de mettre en place des stratégies marketing proactives nettement plus efficaces que les stratégies réactives.
Définition de l’action marketing
Avant d’aller plus loin, il convient de détailler l’action marketing qui sera menée sur les clients à risque de churn. Des exemples types d’actions marketing de rétention sont les appels téléphoniques et les coupons de réduction. Durant le cadrage il convient de définir le contenu, la canal, le timing et surtout le cout de l’action marketing envisagée.
Une fois un programme de lutte proactive contre le churn mis en place, il peut être est intéressant de mettre en place différentes actions marketing adapter à différents niveaux de risque de churn.
Méthode d’identification du churn
Afin de détecter les signaux faibles du churn nous proposons d’utiliser un modèle de classification supervisé.
Un modèle de classification prédit une variable catégorielle, dans notre cas le modèle prédit si un client est à risque de churn.
Un modèle supervisé « apprend » une fonction sur la base d’un échantillon d’exemples de paires d’entrées/sorties. Dans notre cas, la sortie du modèle est le statut churn d’un client (oui / non) et l’entrée est l’état du client.
Méthodologie de définition du churn
Comme indiqué précédemment la définition du churn est propre à chaque entreprise, il est néanmoins possible de dégager une méthodologie pour le définir.
Pour les entreprises avec des produits ou services en abonnement la définition est simple (résiliation).
Pour les autres la définition est plus complexe et requiert un effort d’analyse et une participation des experts métier.
Entretien avec les experts métier
Dans un premier temps, il convient de s’entretenir avec les experts métier afin de définir les données à utiliser pour définir le churn. En général, les experts métier proposent d’utiliser les fréquences d’achat client afin de définir une période d’inactivité maximale au delà de laquelle le client peut être considéré comme ayant résilié. Il est intéressant d’essayer de poser avec eux des hypothèses sur les motivations de churn en interprétant ces données.
Définition de la règle métier : churn
Une fois les données identifiées il faut les analyser afin de définir la règle métier churn. Dans les cas simples où les fréquences d’achat suivent une distribution normale on peut faire l’hypothèse que la période d’inactivité maximale est égale à la moyenne plus deux fois la déviation standard.
Exceptions et ajustements
Une fois le seuil défini il faut le confronter à l’expertise des métiers. Ces derniers peuvent proposer des ajustements sur la base de leur expertise et surtout définir des exceptions. Par exemple, si un client a doublé son volume d’achat sur sa dernière commande on peut également envisager de doubler la période d’inactivité avant de le considérer comme churné.
Horizon de prévision
Il faut également définir à quel horizon on veut prédire le churn. Autrement dit, est ce qu’on veut identifier les clients qui vont churner la semaine suivante, le mois suivant, etc. ?
Plus la prédiction sera faite à l’avance plus les signaux du churn seront faibles et moins le modèle sera capable d’identifier les clients à risque de churn.
Il faut s’assurer que l’horizon de prévision est cohérent avec l’action marketing de rétention. Il peut être intéressant de se poser les question suivantes :
- Y a-t-il un délai nécessaire à la mise en place de l’action marketing (post identification des clients à risques) ?
- Y -a-t-il un moment considéré comme plus impactant qui permettrait de calibrer l’horizon de prévision ?
Il faut donc trouver le bon compromis sur l’horizon de prévision.
Ce paramètre pourra être optimisé lors de l’entraînement du modèle, afin de trouver le meilleur ratio entre la performance du modèle et l’horizon de prévision. Il est tout de même nécessaire de définir un horizon de prévision minimum.
Métrique métier d’évaluation du modèle
Il convient de définir une métrique marketing (i.e. métier) sur la base de laquelle l’algorithme sera évalué. Le but de cette métrique est de permettre la compréhension de la performance du modèle par les experts métiers.
Par exemple, on peut utiliser la somme des achats des clients correctement identifiés comme en risque de churn moins la somme des achats des clients incorrectement identifiés comme en risque de churn. En utilisant cette métrique on fait le choix d’accorder plus d’importance aux gros clients. Un autre exemple est de s’appuyer sur le coût de l’action de rétention engagée comparé au coût d’acquisition d’un client.
Il est judicieux que la métrique métier soit alignée avec les objectifs stratégiques de l’entreprise.
Il est préférable de s’accorder d’emblée avec le métier sur une valeur minimum de cette métrique à atteindre avant mise en production.
Il est primordial qu’une attention particulière soit consacrée à la phase de cadrage, en effet, un oubli ou une sous estimation des étapes présentées dans ce billet conduisent souvent à un projet plus difficile voire un échec. Le désalignement des modèles avec les objectifs métiers fait partie des raisons majeures d’échec des projets d’IA.
Dans le prochain billet de cette série, nous proposons un protocole de développement de l’algorithme de prédiction de churn. Vous y retrouverez un détail de toutes les étapes du processus : collecte de données, feature engineering et modélisation.

