Resumo: Este trabalho apresenta o desenvolvimento da plataforma Retainly, destinada à previsão de evasão de clientes (churn) no setor de telecomunicações, e à recomendação de ações de retenção personalizadas. Utilizou-se como base de dados o conjunto público da IBM, composto por 7.043 registros com variáveis demográficas, contratuais, de consumo e faturamento. O pipeline de ciência de dados compreendeu: (i) limpeza e codificação de atributos categóricos; (ii) normalização e redução de multicolinearidade via Análise de Componentes Principais; (iii) tratamento de desbalanceamento por SMOTE; (iv) busca de hiperparâmetros com Optuna, visando maximizar o F1-Score em validação cruzada estratificada (k=5); e (v) ajuste de limiar de decisão para otimização das métricas no conjunto de teste. Foram avaliados cinco algoritmos: Logistic Regression, Random Forest, XG-Boost, LightGBM e MLP. No conjunto de teste, com limiar ajustado, o XGBoost obteve o maior F1-Score (0,6547) e AUC-ROC de 0,8595, revelando o melhor equilíbrio entre sensibilidade e especificidade. A interpretabilidade do modelo foi assegurada por SHAP (SHapley Additive exPlanations), que destacou o tipo de contrato, o tempo de permanência e o valor mensal como variáveis preditivas mais relevantes. A plataforma Retainly, implementada em Streamlit, permite consulta individual do risco de churn e gera recomendações de retenção direcionadas. Os resultados demonstram a robustez, a generalização e a aplicabilidade prática da solução, contribuindo para a formulação de estratégias de fidelização fundamentadas em análise de dados.
Banca:
Heraldo Luı́s Silveira de Almeida, DSc. (Presidente)
Flávio Luis de Mello, DSc. (Examinador)
Diego Leonel Cadette Dutra, DSc. (Examinador)