125
UNIVERSIDAD TECNOLÓGICA EQUINOCCIAL FACULTAD DE CIENCIAS DE LA INGENIERÍA CARRERA DE INFORMÁTICA Y CIENCIAS DE LA COMPUTACIÓN TEMA: “DISEÑO DEL SISTEMA DE INDICADOR FINANCIERO BASADO EN EL SCORING DE COBRANZAS; PARA USO EMPRESARIAL, 2009” TESIS PREVIA LA OBTENCIÓN DEL TÍTULO DE INGENIERO EN INFORMÁTICA Y CIENCAS DE LA COMPUTACIÓN AUTOR: JOFFRE DANIEL FLORES ESCOBAR DIRECTOR DE TESIS: MAT. MAURICIO GARCIA QUITO – ECUADOR 2010

Modelo de Scoring

Embed Size (px)

DESCRIPTION

scoring

Citation preview

  • UNIVERSIDAD TECNOLGICA EQUINOCCIAL

    FACULTAD DE CIENCIAS DE LA INGENIERA

    CARRERA DE INFORMTICA Y CIENCIAS DE LA COMPUTACIN

    TEMA:

    DISEO DEL SISTEMA DE INDICADOR FINANCIERO BASADO EN EL

    SCORING DE COBRANZAS; PARA USO EMPRESARIAL, 2009

    TESIS

    PREVIA LA OBTENCIN DEL TTULO DE INGENIERO EN INFORMTICA Y

    CIENCAS DE LA COMPUTACIN

    AUTOR:

    JOFFRE DANIEL FLORES ESCOBAR

    DIRECTOR DE TESIS:

    MAT. MAURICIO GARCIA

    QUITO ECUADOR

    2010

  • III

    Del contenido del presente trabajo se responsabiliza el autor

    ______________________

    Daniel Flores Escobar

  • V

    DEDICATORIA

    Dedico este trabajo a mi madre por estar siempre a mi lado y quien me supo

    dedicar todo su esfuerzo para que sea un profesional, adems de orientarme

    e inculcarme principios para luchar en este duro camino.

    A mis hermanos Diego y Diana quienes han sido los pilares de mi vida y la

    fuerza para nunca dejarse vencer y siempre luchar hasta culminar cada meta

    impuesta.

    Daniel Flores

  • VI

    AGRADECIMIENTO

    Agradezco a Dios por permitirme alcanzar esta meta y ser mi luz capaz de

    iluminar todo momento sombro.

    A mi madre y hermanos quienes me dieron su apoyo, gua y comprensin sin

    condicin ni medida.

    A mis abuelitos Jorge y Rosita por estar a mi lado y ser un ejemplo de lucha

    y sacrificio

    Quiero agradecer a la Universidad Tecnolgica Equinoccial por los

    conocimientos impartidos en sus aulas a travs de sus maestro y en especial

    al director de este proyecto Mat. Mauricio Garca por su gua y aportes en

    este trabajo.

    Y a todos los que no recuerdo pero que ayudaron a que pueda culminar esta

    meta.

  • VII

    NDICE GENERAL

    DEDICATORIA ........................................................................................................ V

    AGRADECIMIENTO .............................................................................................. VI

    NDICE GENERAL ............................................................................................... VII

    NDICE DE CONTENIDOS ................................................................................. VIII

    NDICE DE ILUSTRACIONES .............................................................................. XI

    NDICE DE ECUACIONES .................................................................................. XII

    NDICE DE TABLAS ............................................................................................ XIII

    RESUMEN ............................................................................................................. XIV

    SUMMARY ............................................................................................................ XVI

    CAPTULO I .............................................................................................................. 1

    CAPTULO II ........................................................................................................... 14

    CAPTULO III ......................................................................................................... 34

    CAPTULO IV .......................................................................................................... 57

    CAPTULO V ........................................................................................................... 75

    BIBLIOGRAFA ...................................................................................................... 78

    ANEXOS ................................................................................................................... 80

  • VIII

    NDICE DE CONTENIDOS

    CAPTULO I .............................................................................................................. 1

    1. INTRODUCCIN .................................................................................................. 1

    1.1 PROBLEMA A RESOLVER .......................................................................... 1

    1.2 MARCO TERICO ....................................................................................... 2

    1.3 JUSTIFICACIN ......................................................................................... 11

    1.4 OBJETIVOS ................................................................................................. 12

    1.4.1 Objetivo General ................................................................................... 12

    1.4.2 Objetivos Especficos ............................................................................ 12

    1.5 HIPTESIS .................................................................................................. 13

    1.6 ALCANCE ................................................................................................... 13

    CAPTULO II ........................................................................................................... 14

    2. CREDIT SCORING ............................................................................................. 14

    2.1 CONCEPTOS ............................................................................................... 14

    2.2 MTODOS EMPLEADOS EN LA CONSTRUCCIN DE SCORE DE

    CREDITOS ............................................................................................................. 21

    2.3 REGRESION LOGSTICA .......................................................................... 23

    CAPTULO III ......................................................................................................... 34

    3. METODOLOGA ................................................................................................. 34

    3.1 MODELAMIENTO ...................................................................................... 34

    3.1.1 Seleccin de la muestra .......................................................................... 35

    3.1.2 Definicin de buenos y malos clientes ................................................... 40

    3.1.3 Definicin y seleccin de datos .............................................................. 41

  • IX

    3.1.4 Anlisis preliminar de la Muestra ........................................................... 48

    3.1.5 Anlisis Multivariado ............................................................................ 50

    3.1.6 Diseo del Score Card ........................................................................... 53

    3.1.7 Validacin del Modelo ........................................................................... 56

    CAPTULO IV .......................................................................................................... 57

    4. DESARROLLO .................................................................................................... 57

    4.1 DISEO Y DESARROLLO ........................................................................ 57

    4.2 HERRAMIENTAS DE DESARROLLO....................................................... 58

    4.2.1 Microsoft .Net ....................................................................................... 58

    4.2.2 SQL Server 2005 ................................................................................... 60

    4.2.3 SPSS...................................................................................................... 61

    4.3 DISEO DEL SISTEMA ............................................................................. 62

    4.3.1 Web Service .......................................................................................... 62

    4.3.2 Modelado del Sistema ............................................................................ 64

    4.3.3 Casos de Uso ......................................................................................... 65

    4.4 Creacin del Web Service ............................................................................. 66

    4.5 Probador Web Service .................................................................................. 70

    CAPTULO V ........................................................................................................... 75

    5. CONCLUSIONES Y RECOMENDACIONES ................................................... 75

    5.1 CONCLUSIONES ............................................................................................ 75

    5.2 RECOMENDACIONES ................................................................................... 76

    BIBLIOGRAFA ...................................................................................................... 78

  • X

    ANEXOS ................................................................................................................... 80

    1. ANEXO 1............................................................................................................... 80

    2. ANEXO 2............................................................................................................... 84

    3. ANEXO 3............................................................................................................... 93

    4. ANEXO 4............................................................................................................. 100

  • XI

    NDICE DE ILUSTRACIONES

    Ilustracin 1. Ejemplo de Transformacin ................................................................... 10

    Ilustracin 2. Concepto de Score ................................................................................. 16

    Ilustracin 3. Tcnicas Para el Desarrollo Scoring Crediticio ...................................... 22

    Ilustracin 4. Grfico Funcin Logstica ..................................................................... 25

    Ilustracin 5. Grfico de Dispersin ............................................................................ 31

    Ilustracin 6. Grfica Resultado Ejemplo Regresin Logstica .................................... 33

    Ilustracin 7. Esquema de Seleccin de la Muestra ..................................................... 39

    Ilustracin 8. Distribucin de los Sujetos por Rangos de Edad .................................... 48

    Ilustracin 9. Transformacin de una variable ............................................................. 49

    Ilustracin 10. Diseo del Score Card Cgido Sql ....................................................... 54

    Ilustracin 11. Caractersticas Herramientas .Net ........................................................ 59

    Ilustracin 12. Sql Server 2005 ................................................................................... 60

    Ilustracin 13. Funcionamiento de un Web Service ..................................................... 63

    Ilustracin 14. Caso de Uso ......................................................................................... 66

    Ilustracin 15. Cdigo .Net Creacin del Web Service ................................................ 67

    Ilustracin 16. Creacin Referencia Web .................................................................... 68

    Ilustracin 17. Busqueda del Servicio Web ................................................................. 69

    Ilustracin 18. Seleccin del Web Seervice ................................................................. 70

    Ilustracin 19. Codigo .Net Creacin del Probador Web Service ................................. 71

    Ilustracin 20. Pantalla Probador Web Service ............................................................ 73

  • XII

    NDICE DE ECUACIONES

    Ecuacin 1. Regresin Logstica ................................................................................... 8

    Ecuacin 2. Modelo General ....................................................................................... 25

    Ecuacin 3. Funcin Lineal con Parmetros ................................................................ 26

    Ecuacin 4. Funcin Logstica .................................................................................... 27

  • XIII

    NDICE DE TABLAS

    Tabla 1. Ventajas y Desventajas del Scoring Crediticio ............................................... 19

    Tabla 2. Nmero Registros por primeros y ltimos dgitos de la Cedula ..................... 37

    Tabla 3. Periodo Morosidad en Meses ......................................................................... 44

    Tabla 4. Parametrizacin Scoring Crediticio ............................................................... 74

  • XIV

    RESUMEN

    Este trabajo se ha planteado optimizar y reducir los errores en los anlisis de crditos,

    mediante la creacin de una herramienta de evaluacin crediticia (Scoring Crediticio) de

    otorgamiento til para la toma de decisiones, disminuyendo el riesgo en funcin del

    historial de crdito de una persona.

    En el marco de este estudio y en el transcurso de los captulos se ha realizado una

    revisin y descripcin del contenido de la investigacin para la solucin del problema

    planteado para cual fue objeto este tema de tesis.

    Es as que reconociendo las caractersticas y particularidades de los datos obtenidos; as

    como el resultado que se desea obtener que esta demarcado en clasificar a un sujeto de

    acuerdo a su riesgo crediticio para definirlo apto o no para ser sujeto de crdito, se ha

    escogido la funcin de regresin logstica para la obtencin del modelo que mejor se

    ajusta a las caractersticas de los datos que se posee.

    Tambin que se genero una herramienta Web Service con la finalidad de que cualquier

    institucin o persona que desee consultar el score de un sujeto, pueda acceder a la

    misma sin importar la plataforma ni las herramientas que posea siendo esta una

    herramienta flexible con el fin de independizar la arquitectura de una aplicacin

    concreta, lgicamente, dentro de ciertas restricciones, impuestas por la naturaleza de los

    sistemas de informacin o sistemas de control automticos.

  • XV

    Adems el score se convierte en una herramienta que asume una probabilidad de

    incumplimiento, tomando en cuenta las similitudes presentadas entre los datos

    histricos con el fin de discriminar de una manera tcnica el otorgamiento de un crdito.

    Este proyecto parte fundamentalmente de la base de datos la cual debe cumplir con la

    caracterstica de robustez y confiabilidad ya que para la obtencin del score y para que

    el mismo sea predictivo se necesita de una gran cantidad de datos los cuales juegan un

    papel muy importante para el clculo del mismo y adems que los datos sean correctos,

    pero a su ves la muestra de datos obtenidos es pequea pero que tiene todas las

    caractersticas fundamentales para el modelamiento del score.

  • XVI

    SUMMARY

    This work is to optimize and reduce errors in credit analysis, by creating a credit

    assessment tool (Credit Scoring) granting useful for decision making, reducing the risk

    based on credit history of a person.

    As part of this study and in the course of the chapters make a review and description of

    the research content for the solution of the problem which was the subject for this thesis

    topic.

    Which also generated a Web Service tool for the purpose of any institution or person

    you want to see the score of a person, can access it regardless of platform or tools

    having this being a flexible tool to wean the architecture of a particular application, of

    course, within certain restrictions imposed by the nature of information systems and

    automatic control systems.

    In addition, the score becomes a tool that assumes a probability of default, taking into

    account similarities between the historical data presented to discriminate in a technical

    way the granting of credit.

    This project is mainly from the database which must comply with the property of

    robustness and reliability as to obtain the score and that it needed to be predictive of a

    large amount of data which play an important role in the calculation thereof and further

  • XVII

    that the information is correct, but your see the sample data is small but has all the basic

    features for modeling of the score.

  • CAPTULO I

  • 1

    CAPTULO I

    1. INTRODUCCIN

    En este captulo se presenta los objetivos principales del trabajo y su justificacin, as

    como la descripcin resumida del contenido de la tesis.

    1.1 PROBLEMA A RESOLVER

    La gran mayora de los prstamos que a diario conceden las entidades financieras

    podran ser otorgados mediante tcnicas de clasificacin, que en base a caractersticas

    propias del cliente, determinen la probabilidad de que en un futuro este pueda hacer

    frente a sus obligaciones de pago. Permitiendo clasificarle en dos grupos: el integrado

    por individuos con una elevada probabilidad de devolver el crdito y el de aquellos

    individuos que, previsiblemente, no harn frente a sus compromisos crediticios.

    As de esta manera, mediante la utilizacin de modelos de scoring para la evaluacin

    del riesgo de crdito, se puede determinar la probabilidad de que una persona incurra en

    mora o clasificarle como un sujeto apto para acceder a un crdito.

  • 2

    1.2 MARCO TERICO

    Un banco es un tipo muy especial de empresa, que capta dinero del pblico, lo presta

    conjuntamente con recursos propios de la entidad a terceros, quienes pagan intereses por

    el uso de ese dinero. As, usualmente, los recursos con los que un banco genera sus

    ingresos son, en parte propios (patrimonio o capital), y mayoritariamente ajenos

    (depsitos del pblico). Por ello, dado que la mayora del dinero que un banco

    administra no le pertenece, la gestin bancaria requiere un proceso constante de

    evaluacin y medicin de los riesgos a los que se exponen los recursos de los

    depositantes en las operaciones de la entidad. Estos riesgos, en conjunto, se llaman

    Riesgo Bancario y su administracin suele ser regulada por la Superintendencia de

    Bancos y Seguros (SBS) en el Ecuador y sus pares en todo el mundo.

    Para regular el riesgo la SBS se crearon varias leyes entre las cuales tenemos la Ley

    General de Instituciones de Sistema Financiero que dice en el Ttulo IV del Patrimonio

    Captulo I Capital y Reservas, en el artculo 47 de esta ley en la que se indica: Con el

    objeto de preservar su solvencia, las instituciones del sistema financiero debern

    mantener, en todo tiempo, el conjunto de relaciones tcnicas que establezca la Junta

    Bancaria mediante resolucin de carcter general, siguiendo los estndares

    internacionales, especialmente los establecidos por el Comit de Basilea1.

    1 El acuerdo de Basilea consta de 25 principios que representan los requerimientos mnimos que deben ser implementados por las

    autoridades bancarias para lograr un sistema de supervisin bancaria efectiva.

  • 3

    Entre los acuerdos del Comit de Basilea se encuentran dos principios fundamentales en

    los cuales se basa la creacin y uso de los datos de las instituciones financieras en una

    base de datos llamada Central de Riesgo los cuales son:

    Principio 15. Los supervisores bancarios deben determinar que los bancos tengan

    polticas, prcticas y procedimientos adecuados, que incluyan la estricta regla de

    CONOCE A TU CLIENTE, lo cual promueve altos estndares de tica y

    profesionalismo en el sector financiero. Estas medidas previenen que los bancos sean

    utilizados por elementos criminales, en una forma voluntaria o involuntaria.

    Principio 21. Los supervisores bancarios deben de asegurarse que cada banco mantenga

    registros adecuados, diseados de manera que concuerden con polticas contables

    consistentes, con prcticas que permitan al supervisor obtener una visin verdadera y

    precisa de la condicin financiera del banco y de la rentabilidad de sus negocios y que el

    banco haga publicaciones regulares del estado financiero, que reflejen realmente su

    condicin.

    Y es por eso que la Superintendencia de Bancos y Seguros del Ecuador en una de sus

    normativas emitidas en marzo del 2008 para la conformacin de la Central de Riesgos

    solicita a todos los Buros de Crdito, que los mismos debern reportar la informacin

    crediticia de los clientes sobre la base de modelos estadsticos predictivos y no sobre la

    informacin en bruto que reportan las instituciones bancarias de los clientes.

  • 4

    Los comienzos del Credit Scoring se remontan del ao 1936 cuando Fisher, introduce

    el concepto de discriminar objetos dentro de una poblacin especfica.

    Esta idea fue desarrollada ms ampliamente por Durand en 1941 donde fue aplicada en

    un contexto financiero para discriminar entre un Buen y un Mal pagador.

    Uno de los modelos estadsticos predictivos denominado scoring crediticio fue

    inventado por dos matemticos de Stanford, Bill Fair y Earl Isaac, quienes observaron

    que los acreedores no buscaban el historial de crdito, sino un pronstico de aptitud de

    crdito del individuo. Con el desarrollo de un sistema analtico que hoy en da se conoce

    como el FICO Score (Fair Isaac Corporation Score) una de las herramientas ms usadas

    a nivel mundial en relacin al anlisis de riesgo de crditos.

    La utilizacin de modelos de credit scoring para la evaluacin del riesgo de crdito, y

    ordenar a los deudores y solicitantes de financiamiento en funcin de su riesgo de

    incumplimiento, comenz en los 70s pero se generaliz a partir de los 90s. Esto se ha

    debido tanto al desarrollo de mejores recursos estadsticos y computacionales, como por

    la creciente necesidad por parte de las instituciones bancarias de hacer ms eficaz y

    eficiente la originacin de financiaciones, y de tener una mejor evaluacin del riesgo de

    su portafolio.

    El scoring crediticio se refiere al uso de conocimiento sobre el desempeo y

    caractersticas de prstamos en el pasado para pronosticar el desempeo de prstamos

    en el futuro. As, cuando un analista de crdito valora el riesgo comparando

  • 5

    mentalmente una solicitud de crdito en el presente con la experiencia que este mismo

    analista ha acumulado con otros clientes con solicitudes parecidas, est aplicando

    scoring, aunque sea un scoring implcito y subjetivo. De igual manera, cuando un micro

    prestamista adopta una poltica de no renovar prstamos a clientes que han tenido

    atrasos mayores a 30 das en su prstamo anterior, est aplicando scoring, aunque sea un

    scoring simple y unidimensional. Por eso, aunque el nombre scoring puede sonar nuevo,

    es una prctica antigua.

    Los mtodos o modelos de credit scoring, a veces denominados score-cards o

    classifiers, son algoritmos que de manera automtica evalan el riesgo de crdito de un

    solicitante de financiamiento o de alguien que ya es cliente de una entidad crediticia.

    Tienen una dimensin individual, ya que se enfocan en el riesgo de incumplimiento del

    individuo o empresa, independientemente de lo que ocurra con el resto de la cartera de

    prstamos

    En una primera aproximacin a los mismos, se los puede definir como mtodos

    estadsticos utilizados para clasificar a los solicitantes de crdito, o incluso a quienes ya

    son clientes de una entidad evaluadora, entre las clases de riesgo bueno y malo2.

    Aunque originalmente en los 70s se basaban en tcnicas estadsticas (en particular, el

    anlisis discriminante), en la actualidad tambin estn basados en tcnicas matemticas,

    economtricas y de inteligencia artificial. En cualquier caso, los modelos de credit

    2 Hand, D.J. y W.E. Henley. (1997) Statistical Classification Methods in Consumer Credit Scoring: A Review, Journal of the Royal Statistical Association Series A, Vol. 160, No. 3, pp. 523-41.

    .

  • 6

    scoring emplean principalmente la informacin del evaluado contenida en las

    solicitudes de crdito y/o en fuentes internas y/o externas de informacin.

    El resultado de la evaluacin se refleja en la asignacin de alguna medida que permita

    comparar y ordenar a los evaluados en funcin de su riesgo, a la vez cuantifica. Por lo

    general, los modelos de credit scoring le asignan al evaluado un puntaje o score, o una

    calificacin o rating. Algunos mtodos los asignan a grupos, en donde cada grupo tiene

    un perfil de riesgo distinto; sin embargo, en la prctica esto equivale a una calificacin.

    A su vez, estos ordenamientos de los deudores permiten obtener estimaciones ms

    concretas del riesgo; en general se busca obtener alguna estimacin de la probabilidad

    de incumplimiento del deudor (PD, por probabilidad de default) asociada a su score,

    rating o calificacin.

    Esta estimacin se puede obtener directamente del score en el caso de los modelos

    economtricos, o tambin en funcin de la tasa de incumplimiento (TD, por tasa de

    default) histrica observada en el grupo de deudores con la misma calificacin o score

    similar.

    La utilizacin de modelos de credit scoring para la evaluacin del riesgo de crdito, es

    decir, para estimar probabilidades de default y ordenar a los deudores y solicitantes de

    financiamiento en funcin de su riesgo de incumplimiento, comenz en los 70s pero se

    generaliz a partir de los 90s. Esto se ha debido tanto al desarrollo de mejores recursos

    estadsticos y computacionales, como por la creciente necesidad por parte de la industria

    bancaria de hacer ms eficaz y eficiente la originacin de financiaciones, y de tener una

  • 7

    mejor evaluacin del riesgo de su portafolio. Estos modelos generalmente se asocian a

    lo que se ha dado en llamar data mining (minera de datos), que son todos aquellos

    procedimientos que permiten extraer informacin til y encontrar patrones de

    comportamiento de los datos.

    Para evaluar el riesgo crediticio o la conveniencia de otorgar un crdito, hay una gran

    variedad de metodologas disponibles: anlisis discriminante, regresin lineal, regresin

    logstica, modelos probit, modelos logit, mtodos no paramtricos de suavizado,

    mtodos de programacin matemtica, modelos basados en cadenas de Markov,

    algoritmos de particionamiento recursivo (rboles de decisin), sistemas expertos,

    algoritmos genticos, redes neuronales y, finalmente, el juicio humano, es decir, la

    decisin de un analista acerca de otorgar un crdito. Aunque esta ltima presenta la

    ventaja de ser ms eficaz en tratar las excepciones a la experiencia pasada, los mtodos

    de credit scoring son ms eficientes a la vez que sus predicciones ms objetivas y

    consistentes, por lo que pueden analizar y tomar decisiones sobre una gran cantidad de

    solicitudes de crdito en poco tiempo y a un bajo costo

    Dada la relevancia en el proceso de gestin crediticia, un punto fundamental de este

    proyecto es determinar una variable dependiente (bueno/malo), para lo cual se

    estableci que el modelo estadstico de regresin logstica es el ms apropiado para el

    desarrollo de este proyecto.

    Adems se estableci que la regresin lineal no tiene el sustento terico apropiado para

    la construccin de modelos con una variable dependiente binaria (por ejemplo, bueno o

  • 8

    malo). El trmino de error en una regresin lineal se asume normalmente distribuido, y

    este supuesto es violado cuando la variable dependiente slo puede tomar dos valores.

    Adems, la regresin lineal puede crear probabilidades estimadas mayores que uno y

    menores que cero.

    As se identific que lo ms apropiado para el desarrollo de este proyecto es el modelo

    de regresin logstica ya que es una tcnica que sirve para modelar la relacin entre la

    variable dependiente binaria y las variables independientes. Es una forma de modelo

    lineal generalizado (GLM) y est dado por la frmula:

    logit(pi) = log(pi/(1 pi))=0 + 1x1i + + kxki

    Fuente: Anlisis de datos multivariantes Elaborado por: Daniel Flores

    Donde pi es la probabilidad de que una observacin tome un valor particular, y los i

    son los parmetros asociados con cada variable independiente. El modelo resultante de

    la regresin logstica utiliza las variables independientes para predecir la probabilidad

    de que la variable dependiente tome un valor particular. Este modelo no se basa en el

    supuesto estadstico de que el trmino de error est distribuido normalmente ni en el

    supuesto de homoscedasticidad es decir que los diferentes grupos obtenidos presenten la

    misma varianza o dispersin (las poblaciones de Y correspondientes a diversos valores

    de X tienen la misma varianza. Si se cumple, todos los valores de Y que corresponden a

    Ecuacin 1. Regresin Logstica

  • 9

    diversos valores de X sern igual de confiables cercana o alejamiento con el cual estn

    distribuidos los valores de Y alrededor de sus medias. Todos los valores de Y

    correspondientes a diversos valores de X son igualmente importantes), y produce

    probabilidades estimadas entre 0 y 1, las que sern asociadas a un score.

    De acuerdo a lo explicado en la metodologa de regresin logstica, un paso importante

    en el proceso de desarrollo es determinar que variables independientes tienen una fuerte

    relacin lineal con la funcin logit de la variable dependiente, es decir la funcin logit

    ser utilizada para predecir el resultado binario, por ejemplo bueno / malo a sabiendas

    que existen diferentes factores que pueden inferir en el resultado. Esta funcin logit es

    un tipo de regresin en donde la variable dependiente es una variable dummy ejemplo 0

    buen cliente 1 mal cliente.

    En algunos casos una variable puede tener una fuerte asociacin con la funcin logit de

    la variable dependiente, sin que esta relacin sea lineal. Como resultado, esta relacin

    puede no ser detectada o puede producir resultados no esperados. Transformar la

    variable puede servir para detectar la relacin no lineal que de otra manera se perdera, o

    para fortalecer dicha relacin. Tpicas transformaciones de variables incluyen la raz

    cuadrada, el cuadrado, el binario (indicador), el logaritmo y el inverso. Por ejemplo, la

    Ilustracin 1(a) indica una relacin no-lineal entre la Variable 1 y la variable

    dependiente. Sin embargo, despus de aplicar la transformacin de raz cuadrada,

    mostrada en la Ilustracin 1(b), la relacin no lineal se convierte en lineal.

  • 10

    Ilustracin 1. Ejemplo de Transformacin

    Para este modelo, se emplear metodologas estndares y anlisis de distribuciones para

    hacer lo siguiente:

    a. Determinar la necesidad de transformacin para cada variable independiente;

    b. Determinar la transformacin ptima para cada variable; y

    c. Considerar la inclusin de las variables transformados en el desarrollo de los

    modelos.

    Este proceso asegurar que cada variable sea representada apropiadamente.

    Es as que mediante esta tcnica se lograr clasificar a los individuos dentro de las

    categoras (bueno/malo) de la variable dependiente, segn la probabilidad que tenga de

    pertenecer a una de ellas dada la presencia de determinadas variables.

    Fuente: Introduccin al anlisis de regresin lineal Elaborado Por: Daniel Flores

    A

    Variable 1

    B

    Raz cuadrada de Variable 1

    Variable Dependiente

    Variable Dependiente

  • 11

    1.3 JUSTIFICACIN

    El sistema financiero desempea un papel crucial en el desarrollo de un pas, que afecta

    tanto a la adecuada asignacin de recursos en el tiempo como a la correcta valoracin

    del riesgo. En los ltimos aos, la globalizacin de la economa de mercado ha

    disminuido la estabilidad y seguridad del negocio financiero, multiplicando los riesgos a

    los que se enfrentan estas entidades, entre ellos el riesgo de crdito, o posibilidad de que

    no se produzca la devolucin puntual de una determinada cantidad de dinero que se

    prest en el pasado.

    Por eso se ha visto la necesidad de disear una aplicacin, la cual ayudar a tener una

    correcta toma de decisiones con la mayor efectividad posible, basados en un sistema de

    Scoring de Cobranzas, ya que en el Ecuador las Instituciones Financieras y, Pequeas y

    Medinas Empresas PYMES, en los ltimos tiempos viene enfrentndose a la

    problemtica de la morosidad, que se situ en el 5.8%3 de los sujetos de crdito en el

    Ecuador, en el ao 2008.

    En donde este diseo de scoring basado en informacin historial crediticia como

    montos que debe a una institucin financiera, el tiempo de endeudamiento, morosidad,

    el nmero de crditos recibidos, etc. de un determinado sujeto, sern evaluados

    permitiendo agilizar el proceso de cobro en una empresa asignando una puntuacin de

    forma consistente, determinado las probabilidades de que el sujeto incurra en mora.

    3 Fuente: CreditReport Buro de Informacin Crediticia

  • 12

    1.4 OBJETIVOS

    1.4.1 Objetivo General

    Disear un modelo de Scoring, utilizando un conjunto de indicadores

    financieros histricos de la Central de Riesgo, categorizando a los clientes en

    base a su propensin para hacer un adecuado manejo de los mismos.

    1.4.2 Objetivos Especficos

    Presentar un modelo de score que permita identificar a un cliente con la

    tipologa de riesgoso, para evitar perdidas en un crdito asignado.

    Analizar de forma automtica las caractersticas y/o condiciones que un

    cliente posee para catalogarse como riesgoso.

    Definir un mecanismo analtico - matemtico que constituya de una forma

    rpida, confiable, exacta y consistente para predecir el riesgo de un solicitante

    para cumplir con sus deudas en el futuro, es decir minimiza el riesgo de

    cobranzas.

  • 13

    1.5 HIPTESIS

    Demostrar que este sistema de scoring permitir o no determinar si una

    persona es sujeto de crdito.

    Identificar aquellos clientes que tienen la tipologa de clientes riesgosos para

    evitar cualquier tipo de fraude en el crdito asignado.

    1.6 ALCANCE

    Este sistema generar un valor numrico estadsticamente validado en base a anlisis

    descriptivos que permita agilizar la toma de decisiones a la vez que busca reducir el

    nivel de prdidas ya que se asigna puntuaciones de forma consistente, determinando las

    probabilidades de que una solicitud se convierta en una cuenta con buen

    comportamiento para predecir la recuperacin del crdito.

    El sistema se basar en frmulas de evaluacin de las caractersticas relevantes que se

    obtendr de la informacin historial crediticia para predecir la recuperacin del crdito.

    A cada caracterstica se le asigna un valor numrico estadsticamente validado que

    permita obtener un puntaje mediante el cual se pondr ms afn en la cobranza de una

    deuda a un cliente.

  • CAPTULO II

  • 14

    CAPTULO II

    2. CREDIT SCORING

    En este captulo se tratar sobre las definiciones del score crediticio, los mtodos

    empleados para la construccin y sobre la regresin logstica que es el mtodo

    seleccionado para el desarrollo de este proyecto.

    2.1 CONCEPTOS

    Los modelos de scoring crediticio nacen alrededor de los aos 1950s cuando Bill Fair y

    Earl Isaac fundan su compaa dedicada a apoyar las actividades de importantes

    empresas financieras y de ventas al menudeo. Posteriormente, en los aos 1960s se

    inicia el periodo en el que se desarrolla la industria de las tarjetas de crdito con lo cual

    los bancos ven una gran posibilidad de empezar utilizar modelos de scoring.

    Bsicamente el credit scoring es un mtodo que se emplea para identificar diferentes

    grupos dentro de una poblacin cuando no se pueden observar las caractersticas que los

    definen sino nicamente las relaciones con estas.

    Se denomina credit scoring a un sistema que permite asignar una calificacin de riesgo,

    una puntuacin, a un demandante de crdito (cliente real o cliente potencial).

  • 15

    Los modelos de scoring crediticio son aplicaciones que permiten apoyar la toma de

    decisiones. Estos modelos surgen como una necesidad de poder evaluar de forma gil y

    rpida las capacidades de endeudamiento de clientes ante la solicitud de un crdito.

    Aunque existen diversos tipos de compaas y distintos tipo de crditos, la idea general

    de un modelo de scoring crediticio es, por un lado, seleccionar aquellos individuos que

    poseen mejores condiciones econmicas para retornar a la compaa el valor total del

    prstamo solicitado; por otra parte, los modelos de scoring crediticio permiten mitigar el

    riesgo en que se incurrira si se aprueba un crdito a un individuo que no cumple con

    una capacidad de pago y endeudamiento.

    En trminos ms formales el credit scoring es un mtodo de evaluacin del riesgo de

    crdito que emplea informacin histrica y tcnicas estadsticas, para tratar de aislar los

    efectos que tienen las caractersticas de varios aplicantes sobre la reincidencia y el

    incumplimiento. El mtodo arroja un puntaje o score que la institucin financiera puede

    emplear para ranquear sus aplicaciones de crdito en trminos de riesgo4.

    Y con lo mencionado anteriormente predecir el comportamiento de pago futuro de las

    obligaciones crediticias que contraen las personas en funcin de su comportamiento

    crediticio histrico, para lo cul utiliza toda la informacin de entidades Reguladas por

    la Superintendencia de Bancos y Seguros SBS.

    El credit scoring constituye, por tanto, un problema de clasificacin propiamente dicho,

    pues dado un conjunto de observaciones cuya pertenencia a una determinada clase es

    4 Lewis, E.M. (1990) An Introduction to Credit Scoring, San Rafeal: Athena, LIC# 90-92258.

  • 16

    conocida a priori, se busca una regla que permita clasificar nuevas observaciones en dos

    grupos: los que con alta probabilidad podrn hacer frente a sus obligaciones crediticias,

    y los que, por el contrario, resultarn fallidos.

    De ah que para esta investigacin se defini que el puntaje obtenido estadsticamente se

    encuentre dentro de un rango de 1 a 999 siendo 1 el puntaje menor y 999 el mayor

    puntaje a obtener cuando un sujeto posee el mejor historial crediticio.

    Ilustracin 2. Concepto de Score

    Muy malas

    Muy Buenas

    1

    200

    400

    600

    800

    999

    Scor

    e

    BuenasMalas

    AltoRiesgo

    BajoRiesgo

    20 %

    60 %20 %

    Fuente: Datos de la Central de Riesgo Elaborado Por: Daniel Flores

  • 17

    As tambin el grafico muestra el objetivo del clculo que es exponer el riesgo que

    actualmente un sujeto representa a un prestamista. Parmetros severos como el historial

    de crdito, incluyendo historial de pagos, longitud de la historia de la cuenta, prstamos

    y otros son formulados para producir un nmero de tres dgitos que oscila entre 1 y 999.

    Este puntaje se divide en 3 categoras principales: Riesgo Bajo, Riesgo Medio y Riesgo

    Alto.

    Adems el grafico indica que el 60% de todas las personas con una puntuacin de

    crdito de 550-900 presenta o present problemas con su crdito y para obtener uno

    necesitar de requisitos poco favorables. El 20% de los sujetos no presentan ningn

    problema en sus crditos obteniendo u score superior a los 700 y no presentan ningn

    riesgo para las instituciones bancarias al ser sujetos de crdito, y el restante 20% se

    encuentran con un score entre 1 y 549 los que representan un riesgo alto al ser sujeto de

    crdito ya que poseen crditos vencidos o en demanda judicial en la institucin

    bancaria.

    Esto hace que el sistema se base en el desempeo pasado de clientes que tienen

    caractersticas similares a aquellos a ser evaluados. El credit scoring termina, por tanto,

    siendo un predictor del riesgo, cuya fortaleza no radica en la habilidad para explicar

    causalidades (por qu algunos clientes incumplen y otros no) sino en la objetividad de la

    metodologa aplicada.

  • 18

    Con el score, la institucin que utilice el sistema observar un valor numrico el cual

    significa el riesgo y dependiendo de su valor el usuario aceptar o rechazar una

    solicitud de prstamo5.

    Los beneficios no slo se leen en una reduccin de la subjetividad del analista inmersa

    en la concesin del crdito, al estar los mtodos tradicionales apoyados

    fundamentalmente en informacin cualitativa mantenida en la mente del evaluador, sino

    que al basarse en informacin cuantitativa mantenida en los sistemas de cmputo de la

    institucin financiera y por ende cuantificables a bajo costo, se pueden lograr

    reducciones de costos de morosidad y de evaluaciones de prstamos de tal forma que se

    mejore la eficiencia (mejores colocaciones) y por ende la rentabilidad.

    A la par coexisten tanto ventajas como desventajas en esta metodologa, dejando

    siempre al final la opcin al prestamista de optar por un sistema de otorgamiento de

    crditos subjetivo (scoring implcito) en donde el analista valora el riesgo del prestatario

    comparando mentalmente las caractersticas de un aplicante con su experiencia

    acumulada de otras aplicaciones similares o por un scoring estadstico que haga uso del

    conocimiento cuantitativo del desempeo de clientes pasados almacenados en una base

    de datos con el fin de pronosticar comportamientos futuros. Esto conduce, en virtud de

    la seriedad acadmica, a exponer los pros y contras de hacer uso de esta tcnica.

    5 Estrictamente no todos los mtodos conducen a una 'puntuacin' o 'scorecard'. Algunos indican directamente la posibilidad de que un cliente sea bueno y si la aprobacin del crdito vale la pena.

  • 19

    De lo que se pudo realizar el anlisis las ventajas y desventajas del uso de un modelo de

    score se encuentran descritas en la siguiente tabla.

    Tabla 1. Ventajas y Desventajas del Scoring Crediticio

    VENTAJAS DESVENTAJAS

    Cuantifica el riesgo como probabilidad Requiere de una slida y extensa base de

    datos

    Multivariable Ignora toda informacin no existente en la

    base de datos

    Puede ser validado Solo destaca los casos de alto riesgo

    Consistente Puede necesitar de un consultor externo,

    por ende genera gastos operativos

    Transparente Su funcionamiento requiere de un sistema

    transaccional

    La consistencia surge de la homogeneidad en la calificacin otorgada a cada grupo de

    clientes que comparta las mismas caractersticas, todas las solicitudes idnticas tendrn

    por tanto el mismo valor de riesgo predicho; el hecho de contar con un modelo

    matemtico que arroje un valor hace que el proceso de obtencin de esta probabilidad

    Fuente: Revisin Bibliogrfica Elaborado Por: Daniel Flores

  • 20

    sea explcito y como consecuencia de fcil comunicacin tanto a nivel de alta gerencia

    como de analistas.

    El contar con modelos estadsticos da la posibilidad de contrastacin de los mismos,

    validando los modelos sea con informacin previa al periodo muestral empleado,

    permitiendo observar como habra funcionado scoring si hubiera estado implementado

    al momento de estos desembolsos o verificando, previo a la fase de implementacin, la

    consistencia del modelo con los nuevos clientes. Esta fase suele denominarse

    backtesting.

    Del otro lado, se tiene un conjunto de desventajas que se deben considerar antes de

    incurrir en un proceso de obtencin e implementacin de un modelo scoring para el

    otorgamiento de crditos. La disponibilidad de una slida y extensa informacin es uno

    de los principales obstculos al momento de desarrollar un modelo estadstico. Adems,

    la cantidad de informacin registrada no debe slo ser buena sino vasta para que los

    modelos desarrollados puedan compensar la ausencia de informacin financiera con

    mucha capacidad de pronstico empleando un gran nmero de caractersticas menos

    significativas. La calidad de las bases de datos es fundamental, no slo en cantidad de

    registros almacenados en cada variable (porcentaje bajo de clientes en blanco) sino en la

    confiabilidad de la informacin archivada. Por ejemplo, puede ser que la variable sueldo

    no sea un buen predictor dentro de los modelos tal vez porque los clientes tienden a

    mentir sobre su salario, por lo que la correlacin entre sueldo y riesgo es falsa, o por que

    los vendedores de crdito adulteran la cifra ante la posibilidad de obtener una

    aprobacin segura del crdito vendido por parte del analista.

  • 21

    2.2 MTODOS EMPLEADOS EN LA CONSTRUCCIN DE SCORE

    DE CREDITOS

    Las tcnicas ms importantes en la construccin de modelos de score crediticio son:

    Modelos Estadsticos Se consideran los siguientes mtodos:

    Mtodos Paramtricos Comprenden tcnicas como Anlisis Discriminante

    (Discriminant Analysis) y Regresin Logstica (Logistic Regression).

    Mtodos No Paramtricos. Incluye tcnicas de rboles de Decisin, K-Nearest

    Neighbor (K-NN) y Kernel Density.

    Modelos de Computacin Suave o Soft Computing Se plantean principalmente dos

    modelos:

    Redes Neuronales Artificiales (Artificial Neural Networks, ANN).

    Mquinas Vectoriales de Soporte (Support Vector Machines, SVM). Conjuntos

    Rugosos (Rough Sets).

    Modelos Hbridos Estos mtodos representan una extensin a los modelos existentes y

    consisten en una combinacin de tcnicas estadsticas o de soft computing otros

    modelos relacionados.

  • 22

    La ilustracin 3 muestra un organigrama sobre las tcnicas mas utilizadas para

    desarrollar un modelo de score crediticio explicados anteriormente, adems de una

    clasificacin de las tcnicas influyentes en la construccin del modelo.

    Ilustracin 3. Tcnicas Para el Desarrollo Scoring Crediticio

    El organigrama presenta un resumen de la clasificacin de los diferentes modelos para

    el desarrollo de un scoring crediticio, estos se clasifican en modelos estadsticos del cual

    se dividen en paramtricos (Anlisis Discriminante y Logit) y tres no paramtricos

    (rboles de regresin, K vecinos mas cercanos y la densidad de Kernel), adems del

    modelo soft computing del que se deriva los modelos que utilizan redes neuronales y

    por ltimo tambin se encuentran los modelos hbridos.

    Modelos de Scoring

    Crediticio

    Modelos Estadisticos

    Paramtricos

    Anlisis Discriminante

    Regresion Logstica

    No Paramtricos

    K vecinos ms cercanos

    Arboles de Decisin

    Densidad de Kernel

    Soft Computing

    Redes Neuronales

    Modelos Hibrido

    Fuente: Revisin Bibliogrfica Elaborado Por: Daniel Flores

  • 23

    Los modelos paramtricos parten de una funcin de distribucin o clasificacin

    conocida, y reducen el problema a estimar los parmetros que mejor ajusten las

    observaciones de la muestra6. Los modelos no paramtricos, conocidos tambin como

    mtodos de distribucin libre pues no se encuentran sujetos a ninguna forma funcional,

    estos modelos presentan pocas restricciones, por lo que en ocasiones resultan, ms

    fciles de aplicar que los paramtricos y permiten reconstruir la funcin de clasificacin

    en todo tipo de situaciones, incluidas aquellas en las que la funcin sea sencilla y

    conocida (por ejemplo, lineal).

    En los modelos de soft computing del que se deriva el modelo de redes neuronales esta

    conformado por un conjunto de procesadores simples interconectados a los cuales se les

    denomina nodos, organizados en capas lo que permite el procesamiento de la

    informacin.

    2.3 REGRESION LOGSTICA

    La Regresin Logstica (Logistic Regression, LR) es una tcnica estadstica

    ampliamente utilizada en los modelos de score crediticio, as como en otras reas. Esta

    tcnica considera un conjunto de variables independientes o predictoras y una variable

    dependiente con dos posibles valores (variable dictoma) ejemplo:

    Vota o no vota en unas elecciones

    Diagnstico positivo o negativo en una prueba mdica

    6 Martha Galicia Romero, nuevos Enfoques de Riesgo de Crdito

  • 24

    Las principales caractersticas que presenta este modelo se resumen en:

    Variables binarias: Identifica la pertenencia del individuo a cada uno de los grupos

    analizados:

    Se identifica con un 1 al individuo que pertenece al grupo cuya probabilidad de

    pertenencia estimar el modelo.

    Se identifica con un 0 al individuo que no pertenece al grupo objeto de anlisis.

    Variables explicativas: Son las variables que sirven para discriminar entre los grupos y

    que determinan la pertenencia de un elemento a un grupo u otro. Pueden ser:

    Variables cuantitativas que un campo de variacin que toma todos los valores

    reales

    Variables cualitativas con distintas alternativas u opciones posibles.

    Resultado del anlisis: El resultado es un valor numrico que indica la probabilidad de

    pertenencia de un elemento al grupo que se le asign el valor 1, es decir, el grupo objeto

    de anlisis.

    La funcin logstica es una funcin de distribucin, y como se ha explicado toma los

    valores entre 1 y 0, tiene la forma de S como se muestra en el siguiente grafico:

  • 25

    Ilustracin 4. Grfico Funcin Logstica

    La forma general es:

    Ecuacin 2. Modelo General

    zez

    11

    Fuente: Introduccin al anlisis de regresin lineal Elaborado Por: Daniel Flores

    Fuente: Introduccin al anlisis de regresin lineal Elaborado Por: Daniel Flores

  • 26

    Donde Z es la probabilidad de la clase recordando que la variable dependiente posee dos

    valores posibles. Para el caso de un modelo de score, se consideran dos posibles

    resultados: un cliente con buen hbito de pago y uno moroso. Para complementar, z obedece al siguiente modelo matemtico:

    Ecuacin 3. Funcin Lineal con Parmetros

    nnxwxwxwz ....2211

    Donde Xi (i = 1,2,..., n) es el conjunto de variables predictoras o conjunto de entrada,

    es el punto de interseccin y Wi es el conjunto de coeficientes o vector de pesos W

    que ajustan el modelo.

    En nuestro caso las variables predictoras o Wi podran ser las siguientes a modo de

    ejemplo:

    Monto del crdito.

    Plazo del crdito.

    Das de mora.

    Nmero de Calificaciones E en la base de la Central de riesgo, etc

    Fuente: Introduccin al anlisis de regresin lineal Elaborado Por: Daniel Flores

  • 27

    Puesto que el modelo anterior no es lineal respecto a las variables independientes, se

    considera la inversa de la funcin logstica, que es el logit o logaritmo de la odds o

    ventaja de que un suceso ocurra, definindose sta como el cociente entre la

    probabilidad de que ocurra un acontecimiento y la probabilidad de que no ocurra, que es

    su complementaria, como puede observarse en la siguiente expresin:

    Ecuacin 4. Funcin Logstica

    nn xwxwxwpp

    .....]1

    log[ 2211

    En donde p es la probabilidad del resultado de inters, ejemplo: la probabilidad a priori

    de que un individuo tenga buen hbito de pago o la probabilidad de que un individuo

    pueda ser moroso o incurrir en fraude.

    La formulacin anterior facilita la interpretacin del modelo y de sus coeficientes, que

    reflejan, de este modo, el cambio en el logit correspondiente a un cambio unitario en la

    variable independiente considerada.

    Fuente: Introduccin al anlisis de regresin lineal Elaborado Por: Daniel Flores

  • 28

    Ejemplo:

    Predecir la probabilidad de tener tarjeta de crdito basado en los ingresos de una

    persona.

    Basado en la siguiente tabla de datos:

    Rango Ingresos #Tarjetas Crdito # Casos yi 0-500 19 6 3,16666667 500-600 0 0 0 600-700 0 0 0 700-800 15 4 3,75 800-900 32 7 4,57142857 900-1000 70 22 3,18181818 1000-1100 163 47 3,46808511 1100-1200 269 56 4,80357143 1200 - 1300 332 58 5,72413793 1300 - 1400 385 59 6,52542373 1400 - 1500 329 43 7,65116279 1500 - 1600 185 26 7,11538462 1600 - 1700 85 9 9,44444444 1700 - 1800 5 2 2,5 1800 - 1900 26 4 6,5 1900 - 2000 0 0 0 2000 - 2100 0 0 0 2100 - 2200 0 0 0 2200 - 2300 2 1 0 2300 - 2400 12 1 12

    Fuente: Datos Central de Riesgo Muestra de Ejemplo Elaborado Por: Daniel Flores

  • 29

    Variable Dependiente:

    1 = Posee

    Poseer Tarjeta (previamente categorizada )

    0 = No posee

    Variables que no son cuantitativas:

    Nivel de Ingresos

    Nivel de Ingresos Variables Dummy

    Alto Medio Bajo

    Alto 1 0 0

    Medio 0 1 0

    Bajo 0 0 1

    Sin Ingresos 0 0 0

    Creamos tres variables dicotmicas o categricas las cuales no van a ser numricas

    siendo estas unas variables dicotmicas: basndonos en el nivel de ingresos la primera

    de ellas sera Alto. Quien lo sea tendr valor 1 en esa variable y valor cero en las

    variables Medio y Bajo. Los de nivel de Ingreso Medio tendrn valor 1 en la

    segunda variable y cero en las otras, etc. No necesitamos crear, en cambio, una variable

    llamada Sin Ingresos: lo ser quien tenga valores cero en las tres anteriores. Esta

    ltima es la categora base de las dummy.

    Fuente: Tabla de Ejemplo Nivel de Ingreso Elaborado Por: Daniel Flores

  • 30

    Una vez realizada esta transformacin, estas variables pueden ser incorporadas en una

    ecuacin de regresin: sus valores slo pueden variar entre cero y uno y sus coeficientes

    b indicarn, en cada caso, cuanto aumentan o disminuyen los odds de probabilidad del

    evento que se procura predecir cuando una de estas variables pasa de cero a uno.

    De lo explicado anteriormente la probabilidad de tener tarjeta de crdito se ver

    reflejada en la siguiente la funcin logstica

    =

    Donde:

    = Probabilidad de poseer Tarjeta de Crdito

    = Probabilidad de no poseer Tarjeta de Crdito

    Puesto que los datos se encuentran agrupados por el ingreso anual, la variable es la

    media del grupo.

    As por ejemplo de la tabla indicada anteriormente de 6 personas con un ingreso de

    entre 0 y 500 dlares su media es de 19/6, observando que hay 20 rangos de ingresos

    diferentes de la muestra tomada.

    Elaborado Por: Daniel Flores

  • 31

    Obteniendo el siguiente grafico (Ilustracin 5)

    Ilustracin 5. Grfico de Dispersin

    As pues arbitrariamente a manera de ejemplo se determin que la probabilidad de

    poseer una tarjeta de crdito basada en los ingresos de una persona sera la siguiente:

    =exp ( 1 + )

    1 + exp ( 1 + 2 )

    Donde:

    es la probabilidad de que un sujeto posea una tarjeta de crdito con un ingreso .

    0

    2

    4

    6

    8

    10

    12

    14

    0 500 1000 1500 2000 2500 3000

    Y

    Ingresos

    Fuente: Microsoft Excel Datos de Ejemplo Elaborado Por: Daniel Flores

    Fuente: Revisin Bibliogrfica Elaborado Por: Daniel Flores

  • 32

    Interpretndose la misma de la siguiente manera: Cuando el ingreso es mayor existe la

    posibilidad de poseer mayor nmero de tarjetas de crdito basndonos en la media

    obtenida con el grupo de ejemplo.

    Para lo cual previamente toco realizar una nueva reagrupacin de los datos basndonos

    en la tabla de ejemplo anterior para no obtener valores igual a 0 y verificar que el

    modelo no sea rechazado.

    Rango

    Ingresos

    #Tarjetas

    Credito # Casos yi

    0-500 19 6 3,16666667

    700-800 15 4 3,75

    800-900 32 7 4,57142857

    900-1000 70 22 3,18181818

    1000-1100 163 47 3,46808511

    1100-1200 269 56 4,80357143

    1200 - 1300 332 58 5,72413793

    1300 - 1400 385 59 6,52542373

    1400 - 1500 329 43 7,65116279

    1500 - 1600 185 26 7,11538462

    1600 - 1700 85 9 9,44444444

    1700 - 1800 5 2 2,5

    1800 - 1900 26 4 6,5

    2300 - 2400 12 1 12

    Fuente: Datos Central de Riesgo Muestra de Ejemplo Elaborado Por: Daniel Flores

  • 33

    Donde se obtuvo la grfica ajustada en la que se observa la curva logstica.

    Ilustracin 6. Grfica Resultado Ejemplo Regresin Logstica

    Con la imagen se puede demostrar que los puntos se ajustan a una curva en forma de s

    en la que se observa que a mayor ingreso existe mayor probabilidad de obtener o poseer

    mayor nmero de tarjetas de crdito.

    0

    2

    4

    6

    8

    10

    12

    14

    0 500 1000 1500 2000 2500 3000

    Y

    Ingresos

    yi

    yi

    Fuente: Microsoft Excel Datos de Ejemplo Elaborado Por: Daniel Flores

  • CAPTULO III

  • 34

    CAPTULO III

    3. METODOLOGA

    En este captulo trataremos sobre la metodologa utilizada para el desarrollo del modelo

    del scoring y las fases que incluye el modelamiento.

    3.1 MODELAMIENTO

    El modelo busca determinar el riesgo de no pago o incumplimiento futuro asociado a

    una operacin crediticia, ordenando la poblacin y dando la posibilidad de manejar

    ofertas comerciales diferenciadas por punto de corte. Dando adicionalmente la facilidad

    de utilizar mltiples puntos de corte que van desde el rechazo (punto mas bajo) hasta la

    aprobacin inmediata (puntaje ms alto otorgando rpidamente el ndice de riesgo

    asociado a esa evaluacin).

    Las fases que incluyen el proceso de modelamiento son las siguientes:

    1. Seleccin de la muestra

    2. Definicin de buenos y malos clientes

    3. Definicin y seleccin de datos

    4. Anlisis preliminar de los datos

    5. Anlisis multivariado

    6. Diseo del scorecard

    7. Validacin del modelo

  • 35

    3.1.1 Seleccin de la muestra

    Con la finalidad de desarrollar un sistema scoring es necesario contar con una muestra

    de clientes que tengan informacin historial credticia. Este requerimiento genera una

    dicotoma entre dos elementos de decisin.

    La muestra debe incorporar informacin suficiente acerca de las diferentes conductas de

    pago de los clientes (buena y mala conducta en los extremos) a fin de identificar las

    mejores caractersticas que lograrn recoger estos comportamientos.

    Es aqu justamente donde se genera el conflicto, dado que con esta muestra se necesita

    definir el criterio de bueno y malo a emplear para encontrar las caractersticas relevantes

    en el modelo. Para esto, en cambio, se necesitar informacin histrica suficiente y por

    lo tanto un razonable horizonte temporal.

    Para el caso de esta tesis de fijar un perodo de 72 meses, de informacin de datos de la

    base de la Central de Riesgo donde se encuentra informacin consolidada de los

    prestamos otorgados por las instituciones reguladas por la misma, contando con

    informacin que a la vez recoja una madurez adecuada (comportamiento estable).

    El perodo de observacin es el tiempo t en el que el investigador decide situarse y

    observar el desempeo del cliente. Es este perodo de desempeo o performance el que

    va a ser empleado para predecir el comportamiento futuro. En el punto de resultado se

    asigna una calificacin (bueno o malo) al cliente con base en un resumen del

    comportamiento en el periodo de desempeo. De ah la importancia de madurez de la

  • 36

    cartera para no calificar como bueno a un cliente que es malo, pero que no logra denotar

    un comportamiento porque inicia a pagar su obligacin.

    Integrada la informacin de deudores directos del Sistema Crediticio, se puedo obtener

    una muestra de aproximadamente un 1% de personas registradas en la base de datos

    integrada de la Central de Riesgo (obteniendo una muestra de las personas que tienen

    en su documento de identificacin el dgito verificador ltimo digito igual a 3).

    Adicionalmente se obtuvo una muestra con la informacin de la central de riesgo de

    cdulas cuyo ltimo dgito sea igual a 8, esta muestra se utiliz para la validacin final

    del modelo (backtesting).

    Para efectos de anlisis se tomaron datos reportados por Instituciones Financieras

    Reguladas por la Superintendencia de Bancos a diferentes fechas desde enero 2002

    hasta la ultima fecha de corte que se pudo obtener informacin reportada por las

    Instituciones Bancarias a la Superintendencia de Bancos y de la cual se realizar un

    anlisis (backtesting) con la informacin mencionada hasta enero del 2007 hacia atrs

    para con esto verificar la probabilidad de prediccin que posee el score.

    Lo explicado en los anteriores prrafos se refleja en la siguiente tabla donde mostramos

    el nmero total registros en la base datos de la Central de Riesgos reportada por las

    instituciones reguladas por la Superintendencia de Bancos, divididos por el ltimo

    digito de la cdula de identidad y los primeros dos dgitos de la misma, de las cuales se

  • 37

    tomaron muestras aleatorias como se indic de las cdulas que su ltimo digito termina

    en 3 y en 8.

    Tabla 2. Nmero Registros por primeros y ltimos dgitos de la Cedula

    Fuente: Direccion Nacional del Registro Civil Elaborado Por: Daniel Flores

  • 38

    3.1.1.1 Perodo de performance

    Como se mencion anteriormente es importante escoger un perodo que reflejando la

    actual poblacin de clientes muestre un comportamiento estable de cartera. Un

    indicador til es la tasa de morosidad.

    entestotaldeclientesdemalosclisidadtasademoro

    ##

    Donde:

    entesdemaloscli# : Es el nmero de clientes malos

    entestotaldecli# : Es el total de clientes

    De tal forma que el indicar representa el porcentaje de clientes cuyo crdito se encuentra

    en estado de vencido en relacin con el total de clientes.

    La tasa de morosidad se construye por perodo de cosecha (fecha de venta de las

    operaciones de crdito) y tiene por objeto mostrar en forma grfica y por mes de

    colocacin la relacin clientes malos sobre total de clientes7, con el fin de sealar los

    perodos en que esta razn se estabiliza como equivalentes a un comportamiento estable

    de la cartera.

    Un periodo se considera como estable en la medida que la razn de la cosecha t presente

    pequeas variaciones en relacin a la cosecha t-1 y t+1. En trminos estadsticos se

    7 Credit Scoring and its Aplication, Lyn Tomas, David Edelman and Jonathan Crook

  • 39

    puede argumentar que se necesita, durante la ventana temporal elegida, que la razn tasa

    de morosidad siga una distribucin uniforme. La eleccin de periodos con tasas de

    morosidad decrecientes no implica necesariamente una mejora en el comportamiento de

    la cartera, puede ser que estas cosechas por ser cercanas a la fecha actual estn

    reflejando carteras poco maduras y por ende no comparables con otros periodos de

    anlisis. A este tipo de estudios se los conoce como anlisis de cosechas.

    El siguiente esquema sintetiza la importancia del proceso de seleccin de la muestra, un

    acertado periodo de performance, con lo cual aseguramos que la definicin de bueno y

    malo permita modelar un adecuado comportamiento de pago en el futuro.

    Ilustracin 7. Esquema de Seleccin de la Muestra

    Fuente: Credi Report Buro de Informacin Creditica Elaboracin Credit Report Buro de Informacin Crediticia

  • 40

    As tambin que en el esquema arriba expuesto se puede observar que identificando las

    caractersticas del sujeto en el punto de observacin basado en la informacin histrica

    que se posee se definir si este sujeto es bueno o malo y a su vez se podr verificar que

    tan predictor es el mismo al verificar su comportamiento basado en el score con

    informacin a fechas de corte de posteriores.

    3.1.2 Definicin de buenos y malos clientes

    La implementacin de un modelo credit score requiere la definicin de buen y mal

    cliente. Establecer que un cliente es malo no implica necesariamente que todos los

    restantes sean buenos. En el camino se pueden encontrar al menos dos definiciones

    adicionales. Los 'indeterminados' o aquellos casos que no se pueden definir como

    buenos o como malos, y los ' experiencia insuficiente' o aquellos casos en que la cuenta,

    producto de su poco o corto uso, no se puede definir como buena sin caer en un juicio

    prematuro.

    Resulta evidente que la definicin escogida no va a afectar la metodologa empleada

    para calificar al cliente. (esta asume que la definicin crea una particin). Sin embargo,

    la forma como definamos buenos y malos s va a tener efecto sobre los resultados del

    scoring.

    Cuando se habla de malos se busca describir al conjunto de clientes, que dada la

    experiencia no quiere seleccionar para su actividad intermediadora. Para el caso de los

  • 41

    modelos de riesgo, usualmente esta definicin hace alusin a esa cartera que de conocer

    su comportamiento no se hubiese aceptado.

    De aqu se sigue que la definicin de bueno y malo se basar prcticamente en el

    comportamiento de pago de los clientes: mora mxima histrica, mora promedio,

    contadores de mora (nmero de veces que ha cado en mora o reincidencia). Este

    criterio de seleccin es mucho ms deseable pues asocia el criterio de bondad a una tasa

    de rendimiento, decidiendo la eleccin de bueno o malo con base en la mxima prdida

    que se est dispuesto a asumir. Es evidente que estas definiciones pasan por un grado de

    subjetividad siendo tan conservadoras como lo quiera la entidad o viceversa.

    3.1.3 Definicin y seleccin de datos

    Como se mencion inicialmente una de las dificultades que puede afrontar un modelo

    scoring es la escasez de una buena base de datos o incluso la ausencia de esta.

    Es importante, por ende, contar no slo con una base de datos sino con un sistema de

    informacin adecuadamente construido con una lgica de almacenamiento de datos que

    permita contar con una codificacin o representacin numrica de las caractersticas

    cualitativas y cuantitativas que servirn para la aplicacin de tcnicas estadsticas. La

    definicin y seleccin de los datos a incluir en el modelo requiere identificar las escalas

    de medida que pueden presentarse.

  • 42

    Existen dos grupos de variables a estudiar: las cualitativas y las cuantitativas.

    Las primeras son aquellas que no aparecen en forma numrica, sino como categoras o

    atributos (gnero, actividad econmica, vivienda) y slo pueden ser nominales u

    ordinales.

    Las variables cuantitativas, en cambio son aquellas cuyas categoras pueden expresarse

    numricamente. Su naturaleza numrica permite un tratamiento estadstico ms

    elaborado debido a las operaciones matemticas que permiten. Estas variables pueden

    ser discretas o continuas. Las primeras son aquellas cuyas categoras slo pueden tomar

    valores enteros. Por ejemplo la variable nmero de cargas familiares, no existe un

    cliente que pueda tener 2,3 cargas familiares. Las segundas son aquellas cuyas

    categoras pueden fraccionarse segn cualquier entero, por ejemplo la variable salario.

    Una vez definido los tipos de datos con los que se puede trabajar se procede a

    seleccionar la informacin en funcin de las caractersticas disponibles.

    De lo expuesto se defini que esta tesis por tratarse de un modelo para deudores del

    sistema financiero ecuatoriano las variables a utilizar son las de un modelo de

    comportamiento, no de originacin por lo tanto se han escogido las siguientes variables

    de alta importancia y sus combinaciones que mide el comportamiento de un

    determinado sujeto dentro del periodo de performance las cuales se muestran en la tabla

    siguiente:

  • 43

    COD_TIPO_IDCOD_ID_SUJETO

    NUM_OPERACION

    FEC_OPERACION

    FEC_CORTE VAL_SALDO VAL_TOTALVAL_TOTAL_XV

    VAL_TOTAL_NDI

    VAL_VENCIDO

    VAL_DEM_JUDICIAL

    VAL_CART_CASTIGADA

    COD_CALIFICACION

    C 1714738331 0110001700252929/01/2003 30/06/2009 1570,59 1570,59 1570,59 0 0 0 0 AC 1714738331 493849345672401830/06/2009 30/06/2009 16,65 16,65 16,65 0 0 0 0 AC 1714738331 554511900846961030/06/2009 30/06/2009 127,33 127,33 127,33 0 0 0 0 AC 1714738331 554511900846961030/06/2009 30/06/2009 51,42 51,42 51,42 0 0 0 0 AC 1714738331 0110001700252929/01/2003 31/05/2009 1642,37 1642,37 1642,37 0 0 0 0 AC 1714738331 493849345672401831/05/2009 31/05/2009 16,65 16,65 16,65 0 0 0 0 AC 1714738331 493849345672401831/05/2009 31/05/2009 97,09 97,09 97,09 0 0 0 0 A

    VAL_VENC_0_1

    VAL_VENC_1_2

    VAL_VENC_2_3

    VAL_VENC_3_6

    VAL_VENC_6_9

    VAL_VENC_9_12

    VAL_VENC_12_24

    VAL_VENC_24_36

    VAL_VENC_36

    VAL_XVENCER

    VAL_XVENCER_1_3

    VAL_XVENCER_3_6

    VAL_XVENCER_6_12

    0 0 0 0 0 0 0 0 0 72,39 73 222,73 462,780 0 0 0 0 0 0 0 0 16,65 0 0 00 0 0 0 0 0 0 0 0 17,51 35,68 55,18 18,960 0 0 0 0 0 0 0 0 2,14 4,02 5,43 8,970 0 0 0 0 0 0 0 0 70,17 70,92 217,34 456,050 0 0 0 0 0 0 0 0 16,65 0 0 00 0 0 0 0 0 0 0 0 97,09 0 0 0

    VAL_XVENCER_12

    VAL_OPE_CUPO

    739,69 3359,970 5000 360

    30,86 360

    Fuente: Datos Central de Riesgo Muestra de Ejemplo Elaborado Por: Daniel Flores

  • 44

    Las mismas que estn definidas por:

    1. Nmero de Operaciones Actuales e Histricas que posee el sujeto a calcular el scoring,

    esto es cuantos prestamos un sujeto obtenido a travs de instituciones financieras

    dentro de un rango de tiempo.

    2. Cantidad de Calificaciones E que de acuerdo a la Superintendencia de Bancos esta se

    clasifica de la siguiente manera:

    Tabla 3. Periodo Morosidad en Meses

    CALIFICACION PERIODO DE MOROSIDAD EN MESES

    TIPO DE RIESGO MAYOR A HASTA

    Riesgo Normal ---- Uno

    Riesgo Potencial Uno Tres

    Deficiente Tres Seis

    Dudoso Recaudo Seis Nueve

    Perdida Nueve En adelante

    3. Saldo por vencer de 1 a 30 das.- Es el valor por vencer que consiste en la sumatoria de

    todos los dividendos por pagar en el plazo mencionado.

    Fuente: Superintendencia de Bancos y Seguros Elaborado Por: Daniel Flores

  • 45

    4. Saldo por vencer ms de 1 a 3 meses.- Es el valor por vencer que consiste en la

    sumatoria de todos los dividendos por pagar en el plazo mencionado

    5. Saldo por vencer ms de 3 a 6 meses.- Es el valor por vencer que consiste en la

    sumatoria de todos los dividendos por pagar en el plazo mencionado

    6. Saldo por vencer ms de 6 a 12 meses.- Es el valor por vencer que consiste en la

    sumatoria de todos los dividendos por pagar en el plazo mencionado

    7. Saldo por vencer ms de 12 meses.- Es el valor por vencer que consiste en la sumatoria

    de todos los dividendos por pagar en el plazo mencionado

    8. Valor que no devenga intereses de 1 a 30 das.- Es el valor que no genera inters

    cuando una operacin crediticia se encuentra vencida en el rango de tiempo indicado.

    9. Valor que no devenga intereses ms de 1 a 3 meses.- Es el valor que no genera inters

    cuando una operacin crediticia se encuentra vencida en el rango de tiempo indicado.

    10. Valor que no devenga intereses ms de 3 a 6 meses.- Es el valor que no genera inters

    cuando una operacin crediticia se encuentra vencida en el rango de tiempo indicado.

    11. Valor que no devenga intereses ms de 6 a 12 meses Es el valor que no genera inters

    cuando una operacin crediticia se encuentra vencida en el rango de tiempo indicado.

  • 46

    12. Valor que no devenga intereses ms de 12 meses.- Es el valor que no genera inters

    cuando una operacin crediticia se encuentra vencida en el rango de tiempo indicado.

    13. Valor vencido de 1 a 30 das.- Es el valor total vencido que consiste en la sumatoria de

    todos los dividendos que estn en mora en el rango de tiempo indicado.

    14. Valor vencido ms de 1 a 2 meses.- Es el valor total vencido que consiste en la

    sumatoria de todos los dividendos que estn en mora en el rango de tiempo indicado.

    15. Valor vencido ms de 2 a 3 meses.- Es el valor total vencido que consiste en la

    sumatoria de todos los dividendos que estn en mora en el rango de tiempo indicado.

    16. Valor vencido ms de 3 a 6 meses Es el valor total vencido que consiste en la sumatoria

    de todos los dividendos que estn en mora en el rango de tiempo indicado.

    17. Valor vencido ms de 6 a 9 meses.- Es el valor total vencido que consiste en la

    sumatoria de todos los dividendos que estn en mora en el rango de tiempo indicado.

    18. Valor vencido ms de 9 a 12 meses.- Es el valor total vencido que consiste en la

    sumatoria de todos los dividendos que estn en mora en el rango de tiempo indicado.

    19. Valor vencido ms de 12 a 24 meses Es el valor total vencido que consiste en la

    sumatoria de todos los dividendos que estn en mora en el rango de tiempo indicado.

  • 47

    20. Valor vencido ms de 24 a 36 meses Es el valor total vencido que consiste en la

    sumatoria de todos los dividendos que estn en mora en el rango de tiempo indicado.

    21. Valor vencido ms de 36 meses.- Es el valor total vencido que consiste en la sumatoria

    de todos los dividendos que estn en mora en el rango de tiempo indicado.

    22. Valor vencido de comisin Es el valor total vencido que consiste en la sumatoria de

    todos los dividendos que estn en mora en el rango de tiempo indicado.

    23. Valor en demanda judicial.- Es el valor de una operacin que se encuentra en proceso de

    Demanda Judicial por parte de la institucin financiera.

    24. Cartera castigada.- Es el valor establecido como dudoso de recaudar por parte de la

    Institucin Financiera.

    25. Edad.- La edad en aos de la persona a consultar el score, en este caso nos encontramos

    con un problema ya que no de todos las personas con crdito en el sistema ecuatoriano

    se posee la edad o a su vez depende de la calidad de la informacin que poseamos ya

    que esta puede no ser tan confiable y nos encontremos con valores inesperados como se

    indica en la ilustracin 8.

  • 48

    Ilustracin 8. Distribucin de los Sujetos por Rangos de Edad

    3.1.4 Anlisis preliminar de la Muestra

    En un principio todas las variables existentes en la base de datos deben ser

    seleccionadas, e incluso analizadas para que a partir de estas construir nuevas variables

    denominadas variables simples o de combinaciones de caractersticas como se describe

    en la ilustracin 9.

    Fuente: Instituciones Financieras Ecuatorianas Elaborado Por: Daniel Flores

  • 49

    Ilustracin 9. Transformacin de una variable

    Z4 X2

    La variable fecha de apertura de la operacin se puede

    transformar en la fecha en la que por primera vez fue reportada

    en la Central De Riesgo.

    As pues la ilustracin 9 explica como una variable de entrada Z4 como por ejemplo la

    fecha de nacimiento se puede convertir en la edad siendo esta una variable de salida X2.

    Adems en este anlisis es necesario decidir sobre un esquema de segmentacin para

    definir si se divide la muestra en subgrupos siempre y cuando estas tengan informacin

    especial o distintiva, en el caso de esta tesis no va a ser necesario ya que la muestra que

    se posee es homognea.

    Elaborado Por: Daniel Flores

  • 50

    3.1.5 Anlisis Multivariado

    En esta etapa se validar la calidad y cantidad de informacin que se posee a travs de

    un anlisis exhaustivo de los mismos los cuales se dividen en:

    3.1.5.1 Anlisis Univariado

    El objetivo de esto es validar la calidad por cada variable en la muestra

    seleccionada.

    Este estudio cumple con los siguientes propsitos:

    Verificar con la integridad de los datos

    Deteccin de valores extremos

    Tratamiento por datos faltantes

    3.1.5.2 Anlisis Bivariado

    El objetivo de este anlisis es evaluar la relacin entre las variables

    independientes y las variables dependientes por ejemplo

    Variable Dependiente: Variable Dicotmica (1 Si es mayor a 60 dias de

    vencido en un prstamo otorgado por una institucin financiera o 0 en caso

    contrario)

  • 51

    Variables Independientes Monto del prstamo otorgado, que tipo de crdito

    (vivienda, consumo, microcrdito, etc), montos vencidos, etc.

    Es as que a modo de ejemplo en las 2 siguientes tablas se puede identificar que

    se uso la combinacin de las variables el valor por vencer a las cuales se les

    realiz una suma, el valor en mora siempre y cuando sea mayor a 2 meses, y un

    conteo de las operaciones las que cumplan con las dos condiciones anteriores.

    De los cuales se obtuvo los coeficientes de media y comparacin, permitiendo

    analizar el comportamiento actual y pasado, verificando que estos valores se

    encuentran dentro de los rangos ptimos definidos para el modelamiento del

    score.

    As tambin en la segunda tabla se realiza una combinacin de variables como

    son los valores de cartera castigada y valores en demanda judicial a los cuales

    se les suma dentro de un rango de tiempo de los ltimos 24 meses que se tiene

    en la informacin de la Central de Riesgo.

    Y de igual manera se obtuvieron los coeficientes y se observ que los ratios o

    coeficientes de medida y comparacin se encuentran dentro de los parmetros

    aceptables.

  • 52

    Ejemplo:

    Ha tenido una o ms operaciones con mora mayor o igual a 2 meses en los ltimos 24 meses, pero el total de deuda por vencer es

    mayor o igual a 0.33333 del deuda total tomando en cuenta los ltimos 3 meses? La variable se denominara rfp3_2_cd_con

    rfp3_2_cd_con Bivariada (slo buenos y malos) Poblacin Total

    BMRatio MBRatio Total Malo Tasa de Malos %Total Total %Total

    0 (no) 1.17 0.85 77,123 18,143 23.5% 94.6% 77,123 94.6%

    1 (s) 0.09 10.56 4,379 3,469 79.2% 5.4% 4,379 5.4%

    Total de deuda en cartera castigada o demanda judicial en los ltimos 24 meses. La variable se denominar deuda_castplus

    deuda_castplus Bivariada (slo buenos y malos) Poblacin Total

    BMRatio MBRatio Total Malo Tasa de Malos %Total Total %Total

    0 1.38 0.73 74,671 15,485 20.7% 91.6% 74,671 91.6%

    0

  • 53

    3.1.6 Diseo del Score Card

    Diseo del Score Card se basa en los pesos y signos asignados a las caractersticas

    relevantes para identificar comportamiento de pago de un cliente. En su forma ms

    simple es una tabla en la que se listan las variables seleccionadas y sus atributos con el

    puntaje asignado a cada uno8. Un puntaje negativo indica que la variable estara

    premiando al cliente que cumpla con este atributo, mientras que una variable positiva

    estara castigando.

    Un mayor o menor valor significa cun importante es la variable en la calificacin.

    De acuerdo al anlisis realizado para esta tesis el score card que se utilizar ser el

    siguiente:

    8 Un score card es una tabla donde se presentan las caractersticas (variables) resultantes de la aplicacin del modelo logstico, con el valor respectivo del parmetro ajustado para representar el valor de score con el que aporta cada una de las caractersticas.

  • 54

    Y como explicacin se indicar la obtencin de una de las variables que se utilizan en el

    diseo del score card, las dems se encuentran en el anexo 3

    set @n_score = -5.0418819189 + @i_b_avgmo_1_ec * 0.426007907 + @i_b_avgmo_2_ec * 0.615325305 + @i_b_avgmo_3_ec * 0.746487979 + @i_b_avgmo_4_ec * 0.835391271 + @i_b_avgmo_5_ec * 0.940640093 + @i_b_avgmo_6_ec * 1.163488941 + @i_b_avgmo_7_ec * 1.305610914 + @i_b_avgmo_8_ec * 1.525070427 + @i_b_wcurr_1_all * 0.633003213 + @i_c1a10_1_all * 0.527885872 + @n_c12_1a10_1_all * 0.435848447 + @n_c3_2a10_1_all * 0.372657094 + @i_cant_calificacion_e_1_all * 1.584073234 + @i_cant_no_devenga_12_1_pd * 0.169503353 + @i_cant_no_devenga_12_2_all * 0.31779479 + @i_cant_no_devenga_24_1_ec * 0.484176497 + @i_cant_por_vencer_12_1_all * 0.383397711 + @i_cant_tipo_riesgo_titular_1_ec * 0.378465063 + @i_cl1 * 0.687503404 + @i_cl2 * 0.495688296 + @i_cl3 * 0.384044386 + @i_cl4 * 0.187988401 + @i_copen_vig_3_1_all * -0.2652798865 + @i_copen_vig_3_1_ec * -0.1950141455 + @i_mnew_1_pd * 0.959436817 + @i_mold_vig_1_all * 0.639567949 + @n_rdt1s3_2_ec * 0.628773397 + @n_rdt1s3_3_ec * 0.281621939 + @i_rdt24_3a10_1_all * 0.538599523 + @i_rdt3_2a10_1_all * 0.936851865 + @i_rdt6_1a10_1_all * 0.302253614 + @i_rfp12_2_all * 0.18566022 + @i_rfp12_3_all * 0.430115998 + @i_rfp3_2_cd * 0.479899586 set @n_score = round(1000/(1+exp(-@n_score)),0)

    Ilustracin 10. Diseo del Score Card Cgido Sql

    Fuente: Cdigo Sql Elaborado Por: Daniel Flores

  • 55

    Desarrollo de la variable @i_rdt24_3a10_1_all

    Si el valor de la variable (@n_rdt24_3a10 < .00001) entonces la variable

    @i_rdt24_3a10_1_all toma el valor de 1 caso contrario toma el valor de 0

    Donde:

    La variable @n_rdt24_3a10 toma el valor de 0 si @n_deuda_total_24 es igual a 0

    caso contrario la variable se calcula de la siguiente manera @n_rdt24_3a10 =

    @n_d24_3a10/@n_deuda_total_24

    Para lo que previamente se debe obtener las siguientes variables:

    @n_deuda_total_24

    @n_d24_3a10

    As pues la variable @n_deuda_total_24 se obtiene de la suma total de los valores que

    adeuda una persona a las entidades reguladas por la Superintendencia de Bancos en los

    24 meses anteriores a la fecha de calculo del credit scoring

    Y la variable @n_d24_3a10 se obtiene suma de los valores vencidos o en estado de

    mora con las entidades reguladas por la Superintendencia de Bancos en los 24 meses

    anteriores a la fecha de calculo del credit scoring

  • 56

    3.1.7 Validacin del Modelo

    Para validar el modelo se realiz pruebas de backtesting o pruebas de pasado que tienen

    como fin probar la predictibilidad del modelo con datos del pasado y compararlos con el

    score calculado con informacin actual.

    As pues la prueba de backtesting realizada se bas en el historial crediticio del sujeto

    con la cual se desarrollo una variable de prueba la cual consista en que si el sujeto a

    partir de la fecha de calculo del scoring crediticio hasta un ao despus colocaba 1 si

    este caa vencido o tenia valores en mora o 0 si este no tenia valores vencidos o en mora

    en las instituciones reguladas por la Superintendencia de Bancos (Anexo 2).

  • CAPTULO IV

  • 57

    CAPTULO IV

    4. DESARROLLO

    En este captulo se explicar sobre las herramientas utilizadas para el desarrollo de esta

    tesis y el sistema diseado para la explicacin del scoring crediticio.

    4.1 DISEO Y DESARROLLO

    La aplicacin tiene como objetivo ayudar al analista de crdito para que con el historial

    crediticio pueda darse cuenta que tan apto es una persona para ser sujeto de crdito ya

    que se basa en la probabilidad de mora del mismo.

    Adems al ser una aplicacin Web Service ayuda a que cualquier institucin o persona

    pueda desarrollar su aplicativo y con la informacin enviada va XML a travs del

    internet pueda desarrollar sus propias pantallas de acuerdo a los estndares de la

    institucin que desea utilizar.

    As tambin los rangos de aprobacin del crdito pueden ser parametrizables de acuerdo

    a la institucin que utilice el sistema.

  • 58

    4.2 HERRAMIENTAS DE DESARROLLO

    4.2.1 Microsoft .Net

    Es un entorno de desarrollo integrado (IDE, por sus siglas en ingls) para

    sistemas operativos Windows. Soporta varios lenguajes de programacin tales

    como Visual C++, Visual C#, Visual J#, ASP.NET y Visual Basic .NET, aunque

    actualmente se han desarrollado las extensiones necesarias para muchos otros.

    Visual Studio permite a los desarrolladores crear aplicaciones, sitios y

    aplicaciones web, as como servicios web en cualquier entorno que soporte la

    plataforma .NET. As se pueden crear aplicaciones que se intercomuniquen entre

    estaciones de trabajo, pginas web y dispositivos mviles.

    Microsoft .Net es una herramienta de desarrollo que puede usarse para crear

    plataformas independientes y dispositivos independientes del software. Se puede

    usar .Net Framework para tener datos disponibles a travs del internet como es

    el caso de esta tesis.

    Algunas caractersticas principales y que se destacan por su relevancia son:

    Es un potente lenguaje orientado al desarrollo basado en objetos.

    Permite realizar aplicaciones ms robustas y fciles de depurar.

  • 59

    Es un lenguaje ms simplificado y uniforme.

    El cdigo es reutilizable y fcil de leer.

    Ilustracin 11. Caractersticas Herramientas .Net

    Fuente: Curso 2310. Developing web Applications Using Microsoft Visual studio 2008 Elaborado Por: Daniel Flores

  • 60

    4.2.2 SQL Server 2005

    Ilustracin 12. Sql Server 2005

    Microsoft SQL Server es un sistema de gestin de bases de datos relacionales

    (SGBD) basado en el lenguaje Transact-SQL, y especficamente en Sybase IQ,

    capaz de poner a disposicin de muchos usuarios grandes cantidades de datos de

    manera simultnea, as como las siguientes caractersticas:

    Soporte de transacciones.

    Escalabilidad, estabilidad y seguridad.

    Soporta procedimientos almacenados.

    Incluye tambin un potente entorno grfico de administracin, que permite el

    uso de comandos DDL y DML grficamente.

    Fuente: Sql Server 2005 Elaborado Por: Daniel Flores

  • 61

    Permite trabajar en modo cliente-servidor, donde la informacin y datos se

    alojan en el servidor y las term