Una empresa ha registrado a sus usuarios con el objetivo de analizar sus comportamientos, poder predecir las próximas cancelaciones y generar una estrategia de retención para evitar la pérdida de más clientes. Con los análisis se busca predecir la probabilidad de pérdida de cada cliente para el próximo mes.
En el proyecto se realizaron las siguientes actividades: Utilizando un método de clasificación de grupos, se encontró que los usuarios que tienden a cancelar con mayor prontitud presentaban valores menores en: periodos de tiempo de inscripción, edad, cargos adicionales, frecuencia de visitas y sesiones grupales. Habiendo encontrado esas características para combatir la frecuencia de cancelación, se propusieron estrategias como: Descuentos en periodos de inscripción extendidos, beneficios por asistencias continuas o promociones en sesiones grupales.
El proyecto implicó la realización de modelos de aprendizaje automático para la predicción de cancelación de los usuarios, para ello se usaron las librerías SciKit Learn y SciPy de Python, más específicamente, los métodos de Regresión Lineal y Bosque Aleatorio, así como K-Means para el agrupamiento de los datos.
El proyecto se realizó en Jupyter Notebook con lenguaje Python. Los datos que se usaron, se pueden encontrar en el folder 'datasets' de este repositorio.