- Introdução
- Objetivo
- Equipe
- Ficha Técnica
- Fontes de dados
- Tabelas utilizadas na análise
- Ferramentas e Tecnologias
- Processamento e análises
- Resultados e Conclusões
- Google Sheets Dashboard
- Referências
No atual cenário financeiro, a diminuição das taxas de juros tem gerado um notável aumento na demanda por crédito no banco "Super Caja". No entanto, essa crescente demanda tem sobrecarregado a equipe de análise de crédito, que atualmente está imersa em um processo manual ineficiente e demorado para avaliar as inúmeras solicitações de empréstimo. Diante desse desafio, propõe-se uma solução inovadora: a automatização do processo de análise por meio de técnicas avançadas de análise de dados.
O objetivo da análise é identificar o perfil de clientes com risco de inadimplência, montar uma pontuação de crédito a través da análise de dados e avaliar o risco relativo, possibilitando assim, classificar os clientes e futuros clientes em diferentes categorias de risco com base na sua probabilidade de inadimplência. Esta classificação permitirá ao banco tomar decisões informadas sobre a quem conceder crédito, reduzindo assim o risco de empréstimos não reembolsáveis. Além disso, a integração destas métricas fortalecerá a capacidade do modelo de identificar riscos, contribuindo para a solidez financeira e a eficiência operacional do Banco.
Esse objetivo é alcançado por meio dos seguintes subobjetivos:
- Identificar o perfil de clientes com risco de inadimplência
- Montar uma pontuação de crédito a través da análise de dados e avaliar o risco relativo, possibilitando assim, classificar os clientes e futuros clientes em diferentes categorias de risco com base na sua probabilidade de inadimplência
- Tomar decisões informadas sobre a quem conceder crédito, reduzindo assim o risco de empréstimos não reembolsáveis.
- Criar um modelo para identificar riscos, contribuindo para a solidez financeira e a eficiência operacional do Banco.
- Marianela Ruiz.
- Ferramentas: BigQuery, Google Colab.
- Linguagens: SQL e Python.
- Ferramentas de visualização : Power BI.
- Principal fonte de dados: https://drive.google.com/drive/u/0/folders/1AoQtdi6RHKqSdiy8E-pwExh8GXbJIVeE
- Manipulação de dados e Regressão logística em Python(Google Colab): https://colab.research.google.com/drive/1L53FX-L6vwMkOKRnWc7B6R8BKBYE2507#scrollTo=C0U3jEBL1utA
- Link ao relatório: https://lookerstudio.google.com/u/0/reporting/5417083a-a220-4c63-b7f3-ff31120a687d/page/gG67D
-
user_info: dados gerais dos clientes
-
loans_outstanding: dados referente ao tipo de empréstimos e quantidade
-
loans_detail: dados sobre o número de atrasos de pagamento de empréstimos, uso de linhas de crédito e relação ao seu limit e taxa de endividamento
-
default: dados dos clientes inadimplentes e adimplentes
Várias etapas foram seguidas para preparar os dados para análise:
-
Manipulação e limpeza dos dados: Utilizando o processo de ETL (Extract, Transform, Load) no BigQuery, realizei a limpeza e manipulação dos dados. Removi valores nulos, duplicados e inconsistências, além de calcular os quartis. Criei tabelas auxiliares, transformei os dados, e segmentei os clientes com base no risco relativo. As variáveis foram convertidas em dummies para a construção da matriz de confusão e para a realização de regressão logística.
-
Visualização Interativa da Análise: Utilizamos o Looker Studio para criar gráficos e tabelas interativas que facilitam a visualização e compreensão da análise realizada.
-
Modelo de Score de Crédito: foi realizada uma avaliação do modelo utilizando a matriz de confusão para análise de desempenho.
-
Regressão Logística: Foi realizada uma análise preditiva do risco de inadimplência utilizando regressão logística, uma técnica robusta amplamente reconhecida por sua capacidade de modelar e prever comportamentos de risco com base em variáveis significativas.
A partir da análise realizada neste projeto, usando análise exploratória, modelo de classificação e regressão logística, o banco Super Cajá busca identificar com maior facilidade clientes que podem apresentar maior risco de inadimplência e tomar decisões mais rápidas para a concessão de créditos.
- Clientes mais jovens (21 a 41 anos) e também aqueles entre 42 e 52 anos apresentam maior risco de inadimplência.
- Possíveis causas incluem o início de carreira, instabilidade financeira e falta de experiência em gestão financeira.
A hipótese foi confirmada e as recomendações são:
💡 Recomendações para esses clientes:
- Mitigação de Riscos: Implementar políticas para reduzir riscos entre clientes mais jovens, como limites de crédito mais baixos e processos de avaliação mais rigorosos.
- Produtos Personalizados: Desenvolver produtos financeiros específicos com condições mais adequadas para essa faixa etária.
- Reestruturação de Dívidas: Oferecer planos de renegociação de dívidas para clientes jovens inadimplentes.
- Incentivos para Pagamento em Dia: Oferecer benefícios para clientes jovens que mantêm pagamentos em dia.
- Clientes com mais de 11 empréstimos apresentam um risco menor de inadimplência, o que contraria a hipótese inicial de maior risco com mais empréstimos.
- Possíveis causas incluem uma boa gestão financeira que permite o pagamento dos empréstimos.
A hipótese foi refutada e as recomendações são:
💡 Recomendações para esses clientes:
- Análise de Crédito Mais Flexível: Reavaliar critérios de crédito para clientes com múltiplos empréstimos.
- Monitoramento e Suporte: Fornecer suporte financeiro proativo para clientes com menos empréstimos.
- Atrasos superiores a 90 dias são fortes indicadores de inadimplência futura.
- Possíveis causas incluem dificuldades financeiras e problemas de gestão financeira que indicam maior probabilidade de inadimplência.
A hipótese foi confirmada e as recomendações são:
💡 Recomendações para esses clientes:
- Programas de Recuperação de Crédito: Criar programas para renegociação e recuperação para clientes com atrasos superiores a 90 dias.
- Segmentação e Ofertas Personalizadas: Desenvolver produtos financeiros específicos e oferecer suporte adicional para clientes nessa situação.
- Monitoramento e Controle: Implementar um sistema de alerta para monitorar atrasos de pagamento e oferecer intervenções preventivas.
https://lookerstudio.google.com/u/0/reporting/5417083a-a220-4c63-b7f3-ff31120a687d/page/gG67D
- https://www.scielo.br/j/rsocp/a/RWjPthhKDYbFQYydbDr3MgH/?lang=pt
- https://www.blog.psicometriaonline.com.br/o-que-e-multicolinearidade/?ltk_gcm=17931339741<k_gag=138457321421<k_gac=623286237355<k_gne=g&gad_source=1&gclid=Cj0KCQjwsaqzBhDdARIsAK2gqnca8bca6xuEVw_03ek0m2b28jQ5IMGwU2tqEQ7079Fa7vHc-69XgXYaAkGNEALw_wcB
- https://med.estrategia.com/portal/conteudos-gratis/resumo-de-medidas-de-associacao-risco-relativo-razao-de-prevalencia-e-mais/
- https://bdm.unb.br/bitstream/10483/14087/1/2015_DianaOberdaCarneiroMarques.pdf
- https://www.teses.usp.br/teses/disponiveis/45/45133/tde-28122004-224257/publico/diss1GP.pdf