Resenha regressão logistica
Por: Rodrigo Fernandes • 10/12/2018 • Resenha • 833 Palavras (4 Páginas) • 224 Visualizações
RESUMO
Análise de risco de crédito com o uso de regressão logística
O artigo se inicia explicando como o crédito ao consumidor é uma grande e poderosa indústria e os seus diversos usos nas transações. Ademais, enquanto a procura por crédito é grande o fator de risco envolvido também supera um grande patamar, principalmente na administração do mesmo. Diversas são as técnicas utilizadas para a análise de risco de crédito sendo o objetivo do artigo a apresentação do uso da regressão logistica para classificação dos financiamentos bancários.
Fundamentação teórica
Os autores apresentam uma leva de definições referente ao tema abordado. Em um primeiro momento há a definição do que é crédito, ato de ceder patrimônio a terceiro, de patrimônio e de todos os principais subtipos de riscos.
Logo após explica que a avaliação do risco de um potencial cliente pode ser feito atraves de uma análise mais subjetiva (qualitativa - 5 C) ou mais objetiva (quantitativa - credit scoring).
O modelo de credit scoring foi buscado para tentar reduzir o proesso de análise de crédito a uma fórmula numérica. Ele possui sete passos: Levantamento de uma base histórica de clientes; Classificação dos clientes de acordo com o padrão de comportamento e a definição da variável resposta (tipo de cliente); Seleção de amostra aleatória representativa da base histórica; Análise descritiva e preparação dos dados; Escolha e aplicação das técnicas a serem utilizadas para a construção do modelo; Definição dos critérios de comparação dos modelos; Seleção e Implantação do melhor modelo.
Em continuidade o autor traz a importância e avaliação de diversos teóricos sobre a técnica "mais utilizada no mercado" para desenvolver modelos de credit scoring, a de regressão logística. Esta prediz a probabilidade de um evento ocorrer, entre 0 e 1, se assemelhando a uma curva de S e com bons resultados e ajustes.
Os autores ainda trazem que os a regressão é amplamente utilizada na modelagem de estatística de dados, sendo que nesses modelos existe uma variável dependente (gerealmente binária) e as independentes que podem ser categóricas ou contínuas.
Com relação aos pontos fortes da técnica os autores identificam que elimina variáveis redundantes, consideram as variáveis de forma individual e simultanêa e possibilidade de otimização. Os pontos negativos são demora na preparação das variáveis e modelos de dificil implementação.
Para avaliar a performance do modelo foram selecionadas duas amostras, uma de validação e uma de teste, e os seguintes critérios:
- Taxa de acerto: divisão do total de clientes classificados corretamente e pela quantidade de clientes que fizeram parte do modelo;
- Teste de Kolmogorov-Smirnov: É uma técnica não paramétrica para determinar se duas amostras foram extraídas da mesma população.
Aspectos Metodológicos
Os autores definem que a pesquisa visa a facilidade de classificação dos pagadores de a cordo com o grau de risco envolvido, tendo objetivo tando quantitativa quanto descritiva.
...