Reduzindo a fuga de clientes com Machine Learning

A fuga de clientes é um problema que tem a capacidade de arruinar uma empresa e pode ser ocasionado por diversos fatores, como, por exemplo, preços mais interessantes em outras empresas, pouco engajamento, baixa qualidade dos produtos ofertados, entre outros. Por isso, é muito importante estar antenado à evasão de clientes e sempre buscar formas de combatê-la.

Esse artigo trouxe a elaboração de um classificador que prevê a probabilidade de um cliente entrar em Churn ou não. Passou por uma análise exploratória dos dados, engenharia de atributos, construção e otimização de modelos unitários, até a combinação desses modelos, gerando o classificador final. Esse modelo final possui 82% de acurácia, com bom desempenho na previsão das classes minoritárias, estando pronto para ser colocado em produção, entregando a probabilidade de fuga para base de dados não vistas pelo modelo (predict.py), e com espaço para ser ainda mais otimizado.

O modelo obtido pode atuar facilmente como um instrumento de predição de fuga de clientes, auxiliando gestores a detectar a probabilidade de um cliente romper seu contrato com a empresa, permitindo a ele elaborar estratégias de incentivo à permanência e combate à fuga de clientes, consequentemente reduzindo a queda de faturamento decorrente desse problema.

Clique aqui para acessar o notebook com todas as explicações, visualizações e resultados do projeto. Caso tenha dificuldades, também pode acessá-lo aqui.

Estrutura do Projeto

Este projeto está estruturado da seguinte forma:

input: pasta que contém os dados de treino e de teste e a base de dados crua (churn_raw.csv)
models: pasta que contém os modelos treinados e seus metadados no formato pickle .pkl
notebooks: pasta que contém o notebook com as visualizações produzidas e detalhamento do projeto
output: pasta que contém a base de dados escoradas com a probabilidade de fuga do cliente
src: pasta que contém todos os scripts python de pré-processamento, modelagem, treinamento e avaliação dos modelos

Etapas do Projeto

Os scripts python do projeto foram executados nesta ordem:

Divisão do conjunto de teste e de treino: split_data.py
Tratamento de outlier do conjunto de treino: outlier_handling.py
Pré-processamento e treinamento dos modelos preliminares: train.py
Aplicação da técnica SMOTE, pré-processamento e treinamento dos modelos: train_oversampling.py
Otimização dos hiperparâmetros dos melhores modelos obtidos na etapa anterior: hyperparameter_tuning.py
Combinação dos melhores classificadores obtidos nas etapas anteriores: train_ensembled_classifier.py
Treinamento do modelo combinado com base de dados de atributos reduzidos para fins de produção: train_reduced_model.py
Algoritmo que entrega a probabilidade de o cliente entrar em "Fuga", dado suas características: predict.py

Name		Name	Last commit message	Last commit date
Latest commit History 20 Commits
input		input
models		models
notebooks		notebooks
src		src
README.md		README.md
projeto-churn.ipynb		projeto-churn.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

input

input

models

models

notebooks

notebooks

src

src

README.md

README.md

projeto-churn.ipynb

projeto-churn.ipynb

Repository files navigation

Reduzindo a fuga de clientes com Machine Learning

Estrutura do Projeto

Etapas do Projeto

About

Releases

Packages

Languages

raffaelluna/churn-project

Folders and files

Latest commit

History

Repository files navigation

Reduzindo a fuga de clientes com Machine Learning

Estrutura do Projeto

Etapas do Projeto

About

Resources

Stars

Watchers

Forks

Languages