You are on page 1of 20

UNIVERSIDAD DE CONCEPCIAN

FACULTAD DE CIENCIAS FASICAS Y MATEMATICAS

DEPARTAMENTO DE ESTADASTICA

PROPUESTA DE PROYECTO DE TITULO

MODELO LINEAL GENERALIZADO DE RESPUESTA BINARIA CON ENLACE


DE CREDIT SCORING
SKEW-T APLICADO EN ESTIMACIAN

Profesor GuAa

Dra. Maria Paz Casanova Laudien.

Firma

.........................

Colaborador

M.Sc. Luis Emilio Espinoza Araya.

Firma

.........................

Profesor Consejero

Dra. Katia Lorena Saez Carrillo

Firma

.........................

Nombre Memorante

Pablo Fernando Medina Cabezas.

Firma

.........................

e-mail

: pablofmedina@udec.cl

3 n, 2014
ConcepciA

Indice general
3n
1. IntroducciA

2. Objetivos
2.1. Objetivo General . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2.2. Objetivos EspecAficos


. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3. Actividades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

6
6
6
7

3. Marco Conceptual
3.1. Conceptos Financieros . . . . . . . . . . . . . . . . . . . .
3.1.1. Credit Scoring . . . . . . . . . . . . . . . . . . . . .
EstadAstica

3.2. MetodologAa
. . . . . . . . . . . . . . . . . .
3
nalosM odelosLinealesGeneralizados
3.2.1. IntroducciA
3.2.2. Familia Exponencial . . . . . . . . . . . . . . . . .
3.2.3. Modelos de Respuesta Binaria . . . . . . . . . . . .
3 nEnlace . . . . . . . . . . . . . . . . . . .
3.2.4. FunciA
3.2.5. Funciones de Enlaces Propuestas . . . . . . . . . .

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

9
10
10
13
13
14
16
16
17

todos
c
4. Materiales y MA

18

5. Plan de Trabajo

19

6. Financiamiento

20

Captulo 1
3n
IntroducciA

Dentro de las necesidades de las


instituciones financieras, una de las
importantes es poseer criterios
mAs
de determina 3nconf iablesparadecidiraquiA nesdebenotorg
c
ciA
nimaexpresiA3ncuandosepresentanclientesnuevos
El presente trabajo corresponde a un
estudio de modelos de credit scoring,
utilizados para estimar la
probabilidad de que un cliente falle en
el pago de sus obligaciones financieras,
y en base a estas probabilidades poder
construir provisiones financieras para
rdida
c
estimar la pA
esperada.
3

3n
Universidad de ConcepciA

F ac.Cs.F isicasyM atemA!ticas

Depto.EstadAstica

3N
CAPITULO 1. INTRODUCCIA

Como se dijo anteriormente, los


modelos de credit scoring se pueden
definir como un conjunto de
todos
cnicas
c
c
mA
y tA
cuantitativas que se utilizan para
predecir la probabilidad de que un
cliente falle en el pago de sus
obligaciones, y por ende, no se
dito
c
recupere el crA
otorgado por
3nf inanciera.?
una instituciA
cnicas
c
Las tA
de credit scoring
fueron introducidas en los

aAos70,
perosuusosegeneraliz A3enlosaA
os90, graciasaldesarrollodemejoresrecursosestadA

sticosycomputacionales.HoyendA
a, prA!cticamentetodaslasentidadesf
inancierasem
as, almenosparaoriginarsusf inanciaciones.?

Seminario Proyecto de Titulo

Pablo Medina

3n
Universidad de ConcepciA

F ac.Cs.F isicasyM atemA!ticas

Depto.EstadAstica

3N
CAPITULO 1. INTRODUCCIA

Para la construc 3ndelmodelodecreditscoringseutilizanmodelosl


ciA

aoadmitancolasmA!spesadas,
talescomolosenlaces

SkewN ormal, Skew tolog Asticageneralizada.


La importancia de utilizar un enlace
skew-t, para la modela 3ndeunarespuestabinaria, radicaenlaf ormadel
ciA
como, teA3ricamente, permitenconmayorprobabilid

menossensiblesalaexistenciadevaloresatApicos.
El
3sitodeesteestudioesdesarrollarunmodeloqu
propA
tparamodelosdecastigo.Elproblemaseenf ocaenconc
La aplica
3nprA!cticaparaelmodelopropuestosedesarroll
ciA

Seminario Proyecto de Titulo

Pablo Medina

Captulo 2
Objetivos
2.1.

Objetivo General

Presentar, estudiar y analizar

caracterAsticas
asociadas a un modelo
de Credit Scoring, aplicando un
modelo de respuesta binaria con
enlace skew-t, para calcular
provisiones financieras en base a los
score de castigo.
2.2.

Objetivos EspecAficos

Para concretar el objetivo general, se


plantean los siguientes objetivos

especAficos:
6

3n
Universidad de ConcepciA

F ac.Cs.F isicasyM atemA!ticas

Depto.EstadAstica

CAPITULO 2. OBJETIVOS

Desarrollar el modelo lineal


generalizado de respuesta binaria
con enlace skew-t para modelo de
castigo.
Analizar una base de datos real
actual
comparando la metodologAa
propuesta.
y la metodologAa
2.3.

Actividades

Para poder llevar a cabo los objetivos

especAficos
se proponen las siguientes
actividades.

3ndelmodelodecreditscoring.P resen
DescripciA

3nyestudiodelosmodelosderespues
PresentaciA
t.

Seminario Proyecto de Titulo

Pablo Medina

3n
Universidad de ConcepciA

F ac.Cs.F isicasyM atemA!ticas

Depto.EstadAstica

CAPITULO 2. OBJETIVOS

3ndelmodelolinealgeneralizadoder
PresentaciA

t.Analizarlabasededatosmediantelametodolog A
aactual(modeloderegresiA3nlog Astica).
Analizar la base de datos mediante la
propuesta (modelo de
metodologAa
3nbinariaconenlaceskew t).
regresiA

Seminario Proyecto de Titulo

Pablo Medina

Captulo 3
Marco Conceptual

El objetivo de este capAtulo


es
exponer y describir los principales
conceptos asociados con el modelo de
estudio final. Se contextualiza la
tratado
perspectiva bajo la cual serA
el problema, es decir, defini 3ndeconceptosf inancieroseintroducciA3nalsop
ciA

stico.SepresentanlosconceptosimplAc talescomo; creditscor


citosenelmodelodeinterA s,
student.

3n
Universidad de ConcepciA

F ac.Cs.F isicasyM atemA!ticas

Depto.EstadAstica

3.1.
3.1.1.

CAPITULO 3. MARCO CONCEPTUAL

Conceptos Financieros
Credit Scoring

Algunas preguntas que se hacen las


c su banco
personas son Apor
quA
le
3uncrA ditohipotecario,
c
otorgA
peronoasucolega
La industria financiera presenta una
creciente necesidad de obtener en
forma eficiente y eficaz informa 3ndecalidadycontarconundominiodelasN ormas
ciA
adeinf ormaciA3nentrelosclientesylainstituciA3nf
oan
Las instituciones financieras evalA
el riesgo crediticio de un cliente
s
c de los
principalmente a travA
todos
c
mA
de credit scoring. Esto
implica el uso de herramientas

estadAsticas
que permiten diferenciar
grupos de una pobla 3n, aAoncuandonosepuedaverclaramentelascar
ciA
sticasquedef inenacadagrupo, utilizandoinf ormaci
Seminario Proyecto de Titulo

10

Pablo Medina

3n
Universidad de ConcepciA

F ac.Cs.F isicasyM atemA!ticas

Depto.EstadAstica

CAPITULO 3. MARCO CONCEPTUAL

Usualmente credit scoring es asociado


de datos, dado el
a minerAa
requerimiento de informa 3nquepermitaencontrarpatronesdecomportami
ciA
rminos
c
En tA
generales, los modelos

analAticos
de credit scoring se pueden
definir como un conjunto de
todos
cnicas
c
c
mA
y tA
cuantitativas que se utilizan para
predecir la probabilidad de que un
cliente falle, y por ende, no se
dito
c
recupere el crA
otorgado por
3nf inanciera.?
una instituciA
Un punto clave de la implementa 3nyposicionamientodeestetipodemodelos, seexp
ciA
rminos

c
En tA
prActicos,
los
modelos de credit scoring permiten la
reduc 3nsignif icativaenlostiemposdeejecuciA3ndelos
ciA

Seminario Proyecto de Titulo

11

Pablo Medina

3n
Universidad de ConcepciA

F ac.Cs.F isicasyM atemA!ticas

Depto.EstadAstica

CAPITULO 3. MARCO CONCEPTUAL

Los principales usuarios de este tipo


de modelos son los bancos e
como las
instituciones financieras, asA

AcompaA
asdesegurosolascadenasderetail.Entrelasprincipal

sticasquetienenencomAonestosmodelos, estA!lapo
asreduccionesenelriesgodelascarterassignif icanen
Los beneficios reportados por la aplica 3ndeestosmodelosnosA3loaf ectaalosbancoseins
ciA
adevariables, concentrandoenunsolomodelomAolti
todos
c
Como resultado, estos mA
entregan un puntaje (ranking, score)
a un cliente particular, ordenando y
on su riesgo
comparando sujetos segA
crediticio. Esta cuantifica 3npermiteestimardemejormaneraelriesgoatra
ciA

Seminario Proyecto de Titulo

12

Pablo Medina

3n
Universidad de ConcepciA

F ac.Cs.F isicasyM atemA!ticas

Depto.EstadAstica

3.2.
3.2.1.

CAPITULO 3. MARCO CONCEPTUAL

EstadAstica

MetodologAa
3 nalosM odelosLinealesGeneralizados
IntroducciA

Los Modelos Lineales Generalizados


son una exten
3ndelmodelolinealclA!sico,
siA
tomandocomopunto
Consideremos un vector de
observaciones Y de n componentes,
cuyas componentes son distribuidas
independientes con media .
El sistema comienza especificando un
rminos
c
modelo para , en tA
de un
omero pequeAodevariablespredictorasx

nA
1, . .
de respectivos coeficientes 1, . . . , p. En
el caso de modelos lineales ordinarios
Pp
3

esta formulaciA nesdelaf orma : = j=1 xj j do

los j son parAmetros


cuyos valores usualmente son desconocidos y debemos estimarlos a
s
c de los datos. El modelo puede ser escrito como:
travA
E(Yi ) = i =

p
X

xij j , i = 1, . . . , n;

j=1

sima
3 nj.
c
donde xij es el valor de la j-A
covariable de la observaciA
Para los errores se asume independencia y varianza constante. Estos supuestos son
fuertes y necesitan ser comprobados.

Seminario Proyecto de Titulo

13

Pablo Medina

3n
Universidad de ConcepciA

F ac.Cs.F isicasyM atemA!ticas

Depto.EstadAstica

CAPITULO 3. MARCO CONCEPTUAL

En general, los modelos lineales deben cumplir las siguientes propiedades.


1. Componente aleatorio: Los componentes de Y son independientes, normalmente distribuidos con E(Y ) = y varianza constante 2 .

2. Componente sistemAtico:
Las covariables x1 , . . . , xp generan un predictor lineal dado
por:
p
X
=
xij j .
j=1

3. El enlace entre el componente sistemAtico


y el aleatorio se denota por = .
rmino,
c
Esta forma de presentar el modelo introduce un nuevo tA
, para el predictor
3

lineal y una tercera condiciA nqueexigeque y sean iguales. En efecto,


= g(),
3 ndeenlace00 .??
donde g() es conocida como funciA

3 nclA!sicadeunmodelolineal,

En la formulaciA
presentadaanteriormente, elcomponentealeatoriosigu
comolosmodeloslinealesgeneralespresentandosextensionesaestaf ormulaciA3 n :
3 ndelcomponentealeatoriopuedevenirdadaporunadistribuciA3 ndelaf amiliaexponenci
La distribuciA
T
xi ; i = E(Yi ).

3.2.2.

Familia Exponencial

3
Se dice que Y
 exponencial si su funciA ndedensidadsepuedeescribircomo :
 pertenece a la familia
y b()
+ c(y, ) ,donde
?f (y; , ) = exp

: ParAmetro
natural.

3 n).b(), c() : funciones conocidas.


i : ParAmetro
de escala (dispersiA
3 nenM LG
EstimaciA
Se tiene y1 , . . . , yn variables aleatorias que satisfacen condiciones de MLG.?
depende de x1 , . . . , xp .
constante para yi .
3 ndeverosimilitudestA!dadapor

La funciA
:to


Pn
Pn
yi i b(i )
l(, ; y) = i=1
+ i=1 c(yi , ).

Seminario Proyecto de Titulo

14

Pablo Medina

3n
Universidad de ConcepciA

F ac.Cs.F isicasyM atemA!ticas

Depto.EstadAstica

CAPITULO 3. MARCO CONCEPTUAL

s
3 ndelosparA!metros

c se centra en la estimaciA
El interA
1 , . . . , p del predictor lineal.
Para ello se debe resolver el sistema de ecuaciones:
n

l(, , y) X li
=
= 0, j = 1, . . . , p;
U=
j
j
i=1
donde:
li =

yi i b(i )
+ c(yi , ).

Por regla de la cadena tenemos:


li
li
i
i j
=

.
j
i i
j
j
3 ndeli obtenemos:
De la definiciA
0

li
yi b ()
.
=
i

i = b (), de donde se tiene:


AdemAs,
i
yi i
=
.
i

Finalmente, el predictor lineal i = g(i ) = 1 xi1 + . . . + b xip proporciona los datos


requeridos para:
i
1
i
0
= g (i )
= 0
i
i
g (i )
i
y
= xij .
j
Sustituyendo se obtiene:
li
j
.Uj



yi i xij i
=
V ar(Y )
i
n
X yi i xij  i 
=
= 0.
V ar(Y )
i
i=1

todos
c
En general las ecuaciones Uj son no lineales y deben ser resueltas por mA
iterativos,
como por ejemplo Newton Raphson o Fisher Scoring.

Seminario Proyecto de Titulo

15

Pablo Medina

3n
Universidad de ConcepciA

F ac.Cs.F isicasyM atemA!ticas

Depto.EstadAstica

3.2.3.

CAPITULO 3. MARCO CONCEPTUAL

Modelos de Respuesta Binaria

3 ndeP robabilidad
DistribuciA

?to

3 nrevisaremosmodeloslinealesgeneralizadosdondelasvariablesderespuestasonbinaria
En esta secciA

xito
c
1 si es un A
Y =
con P (Y = 1) = y P (Y = 0) = 1 .
0 si es un fracaso,

Se dispone de n variables aleatorias Y1 , . . . , Yn independientes con P (Yi = 1) = i(i =



Qn
Pn
j
Yj
3
1Y j

1, . . . , n), entonces su funciA ndeprobabilidadconjuntaes : j=1 j (1j )


= exp
j=1 Yj log
1
cual pertenece a la familia exponencial.
La idea de los modelos lineales generales de respuesta binaria, consiste en predecir la
probabilidad o P (Y = 1) dado ciertos valores de las variables predictoras.
simo
c
Supongamos que tenemos r grupos con ni unidades en el i-A
grupo, donde el
T

c
i-A simo
grupo de respuestas presenta el valor xi = (xi1,...,xip ) en las variables predictoras
o mero de unidades que presentan respuesta 1 (A
xito)
c
y donde yi es el nA
en el grupo
y
i
3

3 ndexi ,
c
i (i = 1, . . . , r). Queremos describir la proporciA ndeA xitos
como funciA
i =
nj
es decir;
g(i ) = xTi i , i = 1, . . . , r;
donde:
xi es un vector de variables explicativas.

es un vector de parAmetros.
3 ndeenlace. El caso mas simple consiste en considerar g la funciA
3 nidentidad, =
g es una funciA
xTi . Este caso es usado en algunas aplicaciones, pero tiene la desventaja que los valores ajustados xT pueden estar fuera del intervalo [0, 1].

3 ndedistribuciA3 nacumulad
Para asegurarse de Rque se restringa al intervaloR[0, 1] se utiliza una funciA
t
+
1 T
= g (xi ) = F (t) = f (s)ds,donde f (s) 0, f (s)ds = 1.

3.2.4.

3 nEnlace
FunciA

definidas se obtienen a partir de una


Naturalmente, como las funciones de enlace asA
3
3
ndedistribuciA n, esposibleobtenerunagrancantidaddef uncionesdeenlaceg(). En la
funciA

utilizadas.
prActica, tres son las mAs



3
3
ndedistribuciA nlog Asticaest

1. Logit o funciA
A!ndarinversa
: g1 () = log
.
(1 )
3 nN ormalinversa : g2 () = 1 ().
Probit o funciA
3 ncomplementarialog log : g3 () = log {log(1 )} .
FunciA
Seminario Proyecto de Titulo

16

Pablo Medina

3n
Universidad de ConcepciA

F ac.Cs.F isicasyM atemA!ticas

Depto.EstadAstica

3.2.5.

CAPITULO 3. MARCO CONCEPTUAL

Funciones de Enlaces Propuestas

1. t Student
Z

F (t) =
nf

(( + 1)/2)
 


(+1)/2
x2
1+
dx

2. Skew normal

F (x) =


2T

x
,

Donde:

3 n(media): ParAmetro

: ParAmetro
de localizaciA
de escala (varianza)

: ParAmetro
de forma (AsimetrAa)
3 ntdeOwen0 s
T (h, a): FunciA
1
T (h, a) =
2

exp1/2(1+x )
dx
1 + x2

3. Skew t ?
Z

Fy (y|, , , ) =
nf

2
ft( ) (z)Ft( ) (z)dz

Donde:

3 n: ParAmetro

: ParAmetro
de localizaciA
de escala

: ParAmetro
de asimetrAa

: ParAmetro
de forma (grados de libertad)
y
z:

3 ndedensidadyf unciA3 nacumuladat studentcon grados de


ft( ) y Ft( ) : FunciA
libertad

Seminario Proyecto de Titulo

17

Pablo Medina

Captulo 4
todos
c
Materiales y MA

necesario contar con los equipos computacionales


Para llevar a cabo este proyecto, serA
3

del Laboratorio de ComputaciA ndelDepartamentodeEstadAsticadelaU


niversidaddeConcepciA3 nycompu

3 ndelasestimacionesdemA!ximaverosimilituddeutilizar

c
Para la obtenciA
A!elm
A tododeN
ewtonR
apropuesta.

18

Captulo 5
Plan de Trabajo

Figura 5.1: Carta Gant de actividades a realizar

19

Captulo 6
Financiamiento

3 ndelprof esorguAacorreporcuentadelDepartamentodeEstad

El tiempo de atenciA
A3
3

sticadelaU niversidaddeConcepciA n, yeltiempodeatenciA ndelcolaboradorserA!solventadoenf


ormapers

Las copias, impresiones y encuadernaciones requeridas para la memoria de tAtulo


costeadas por el alumno.
serAn

20

You might also like