Professional Documents
Culture Documents
ndice de figuras
Figura 1: Proceso de direccin estratgica ....................................................... 8
Figura 2: Estndar CRISP_DM ..................................................................... 11
Figura 3: Esquema de direccin estratgica ................................................... 16
Figura 4: Esquema del proceso de planificacin. ........................................... 16
Figura 5: Etapas proceso planificacin. ......................................................... 17
Figura 6: Modelo de negocios ....................................................................... 18
Figura 7: Tabla factores crticos externos: oportunidades y amenazas. ........... 24
Figura 8: Variable externa: amenaza (precio petrleo). .................................. 24
Figura 9: Tabla de factores internos: fortalezas y debilidades. ........................ 25
Figura 10: Factor interno: fortaleza ............................................................... 26
Figura 11: Clster, mtodo K medias. ........................................................... 26
Figura 12: Proceso Knowledge Discovery in Databases. ................................ 27
Figura 13: Esquema estrategia fundamental de la organizacin, paradigma
rombo. .......................................................................................................... 28
Figura 14: Mapa estratgico, caso acadmico. ............................................... 36
Figura 15: Tablero de objetivos estratgicos e indicadores de gestin en
docencia........................................................................................................ 37
Figura 16: Esquema en estrella, caso acadmico. ........................................... 38
Figura 17: Tablero de control e iniciativas estratgicas, caso empresa de
transporte. ..................................................................................................... 39
Figura 18: Estudios para la preparacin y evaluacin de un proyecto. ............ 39
Figura 19: Ejemplo grfico, regresin lineal .................................................. 40
Figura 20: Distribucin homocedstica.......................................................... 45
Figura 21: Distribucin heterocedstica. ........................................................ 45
Figura 22: Grficos del error y las variables exgenas. Homocedasicidad y
heterocedasticidad. ........................................................................................ 52
Figura 23: Histograma ejemplo test Jarque-Bera............................................ 56
Figura 24: Test de Durbin y Watson .............................................................. 60
Figura 25: Tendencia en una serie de tiempo. ................................................ 73
Figura 26: Estacionalidad en una serie de tiempo .......................................... 74
INTRODUCCIN
La globalizacin, el entorno multicultural, el cambio tecnolgico, la reduccin
de los ciclos de vida y satisfaccin de los productos y servicios, y -en generalel acelerado cambio de la sociedad actual, estn configurando una serie de retos
que los directivos y las organizaciones deben enfrentar para generar estrategias
exitosas que aseguren el futuro de sus instituciones. Las decisiones estratgicas
se han vuelto cada vez ms complejas y tienen efectos sobre la estructura
organizacional, los procesos administrativos y productivos, las tecnologas de
la informacin y las comunicaciones.
En los ltimos aos se han presentado muchos cambios y de una profundidad
nunca antes conocida en la historia de la humanidad, por lo cual se hace cada
vez ms imprescindible para un directivo recurrir a modelos que describan
detalladamente cmo dirigir estratgicamente una organizacin.
En este libro se propone un mtodo de direccin estratgica que se caracteriza
por ser un proceso simple y prctico en la formulacin de las estrategias,
implementacin y control.
Para apoyar el mtodo de direccin estratgica es fundamental un proceso de
extraccin de datos desde bases de datos internas y externas a la organizacin y
luego- el anlisis de estos, para extraer informacin susceptible de usar para
tomar decisiones y acciones estratgicas informadas. Estos mtodos, tcnicas y
herramientas de software, para proveer informacin son parte del paradigma
del business intelligence y el proceso de data mining o minera de datos.
La organizacin del libro est orientada a la presentacin de los conceptos de
direccin estratgica y el apoyo de modelos matemticos, estadsticos y de
minera de datos.
En los captulos 1 y 2, se introduce el modelo de direccin estratgica
propuesto, el cual sigue un proceso dinmico y recursivo; comenzando con la
fase de planificacin estratgica, que a su vez se descompone en 9 etapas con
sus respectivos hitos y resultados, la fase de implementacin y cambio
organizacional y finalmente- la fase de control.
En el captulo 3, se presentan algunos conceptos bsicos del modelo de
regresin lineal y se introducen los supuestos del mtodo de mnimos
cuadrados ordinarios (MCO), para estimar los parmetros del modelo de
regresin lineal simple y mltiple.
El captulo 4, trata sobre los modelos de series de tiempo, con los mtodos de
promedios mviles, tcnicas de suavizamiento exponencial y modelos
autorregresivos.
CAPTULO 1
1.1 Direccin Estratgica
La direccin estratgica debe ser liderada por altos directivos, dado que es el
corazn de la actividad de una organizacin, (Hunger, 2003) , (Drucker, 2004),
(Hax, A. & Wilde, D., 1999). El modelo de direccin estratgica propuesto es
un mtodo holstico, continuo y recursivo; que tiene como principal
caracterstica ser democrtico, sistemtico y participativo.
Tambin se puede definir una UEN como aquel sistema que es capaz de
amoldarse a las variaciones de un entorno turbulento y cambiante, que debe
poseer las siguientes caractersticas (Beer, 1988):
i) Capaz de auto-organizarse: mantener la organizacin del sistema en forma
permanente y adaptarse de acuerdo a las exigencias del medio ambiente;
ii) Capaz de auto-controlarse: mantener las variables principales del sistema
dentro de ciertos lmites de normalidad;
iii) Deben poseer cierto grado de autonoma: poseer un suficiente nivel de
libertad, determinado por sus recursos, para mantener las variables esenciales
en su rea de regularidad.
Adems, poseen una misin nica y diferenciada, la estrategia de cada unidad
es as autnoma, si bien no independiente de las dems unidades estratgicas,
puesto que se integran en la estrategia de la institucin.
El mtodo de direccin estratgica en su fase de planificacin estratgica se
compone de un esquema grfico, que representa el proceso de planificacin y
un procedimiento que se realiza de manera secuencial en cascada con iteracin.
Este procedimiento est constituido por 9 etapas, de las cuales algunas de sus
actividades se pueden desarrollar de manera simultnea, en paralelo, y adems
pueden existir iteraciones entre actividades, porque se pueden presentar
situaciones dnde sea necesario volver a etapas anteriores, en razn de no
cumplir con ciertos requisitos y supuestos fundamentales en la actividad.
1.1 Business Intelligence
Se denomina inteligencia empresarial, inteligencia de negocios o BI (business
intelligence) (Shmueli, G., Patel, N., & Bruce, P., 2007), al conjunto de
mtodos, tcnicas y herramientas enfocadas a la administracin y creacin de
conocimiento mediante el anlisis de datos internos y externos en una
organizacin o empresa.
El trmino BI se refiere al uso de datos en una institucin para facilitar la toma
de decisiones. Ayuda a comprender el funcionamiento actual de la
organizacin, y tambin a pronosticar con anticipacin los acontecimientos
futuros, con el objetivo de ofrecer conocimientos para respaldar los objetivos
estratgicos y estrategias organizacionales.
Los mtodos y las herramientas del BI (Shmueli, G., Patel, N., & Bruce, P.,
2007) se basan en la utilizacin de un sistema de informacin de inteligencia
que se forma con distintos datos extrados de los datos bsicos del subsistema
operacional, con informacin relacionada con la institucin y su mbito y con
datos financieros y econmicos.
Este proceso se conoce como estndar CRISP-DM (Shmueli, G., Patel, N., &
Bruce, P., 2007).
10
La relacin entre todas estas fases es lineal slo sobre el papel. En realidad, es
mucho ms compleja y esconde toda una jerarqua de subfases. A travs de la
experiencia acumulada en proyectos de minera de datos se han ido
desarrollando metodologas que permiten gestionar esta complejidad de una
manera ms o menos uniforme.
Las tcnicas de la minera de datos provienen de la inteligencia artificial y de la
estadstica, que son algoritmos ms o menos sofisticados que se aplican sobre
un conjunto de datos para obtener informacin o conocimiento de un tema
particular.
Las tcnicas (Shmueli, G., Patel, N., & Bruce, P., 2007), (Hernndez, J., Ferri
Ramirez, C., Ramirez Quintana, Ma, 2004) ms representativas son:
Redes neuronales: Son un modelo de aprendizaje y procesamiento que imita o
se basa en el funcionamiento del sistema nervioso central. Es una estructura
interconectada de neuronas en red que producen un estmulo de salida. Los
perceptrn (simples y multicapas) y las redes de Kohonen (mapas auto
organizados), estn entre las ms conocidas.
Regresin lineal: La ms usada para generar vnculos entre informacin
diferente. Rpida y eficaz, pero insuficiente en espacios multidimensionales
donde puedan relacionarse ms de 2 variables.
Serie de tiempo: Es un conjunto de observaciones sobre valores que toma una
variable cuantitativa en diferentes momentos de tiempo.
11
14
15
17
e.
19
20
22
24
25
Tambin se puede aplicar BI (Shmueli, G., Patel, N., & Bruce, P., 2007), que es
el proceso de extraccin de datos desde bases de datos internas y externas a la
organizacin y luego el anlisis de estos, para extraer informacin susceptible
de usar para tomar decisiones y acciones de negocios informadas. Y se dispone
de tcnicas y software de redes neuronales (MLP, mapas auto organizativos),
rboles de decisin (CART, ID3, C4.5, CHAID); regresiones: lineal, lgica,
probit, reglas de asociacin, lgica difusa; software, por ejemplo: Oracle, SAS,
SPSS, Data Engine, Clementine, Matlab, Eviews, entre otros.
26
27
i)
ii)
iii)
iv)
Luego, hay que definir las ventajas competitivas para cada uno de los negocios,
esto consiste en pensar en el corazn de las estrategias, y radica en determinar
de qu manera especfica dicho negocio va a competir en su mercado. Por qu
28
29
30
Reingeniera de producto.
parecera poco atractiva. Por lo cual, esta organizacin realiz una re-ingeniera
en el servicio de la entretencin, reconocida en todo el mundo por presentar
entretenimiento artstico de muy buena calidad.
Creado en 1984, las producciones del Cirque du Soleil han sido vistas por unos
40 millones de espectadores a travs del mundo. Su nivel de ingresos ha
alcanzado en slo 20 aos cifras similares a los de los circos Ringling BROS y
Barnum & Bailey durante ms de 100 aos (Chang, W. & Mauborgne, R.,
2005).
Montando un espectculo totalmente diferenciado de sus competidores, el
Cirque du Soleil alcanza un xito sustentado en la creacin de un nuevo
mercado que hizo que la competencia se convirtiera en irrelevante. Este circo
no crece a costa de los consumidores habituales de los circos competidores,
sino que su espectculo se dirige a un nuevo grupo de consumidores adultos
dispuestos a pagar una entrada sustancialmente ms cara a fin de ver un
espectculo que no tiene precedentes.
En este sentido se sugiere orientar la estrategia fundamental, pasando a
focalizar en alternativas en lugar de competidores y en no clientes en lugar de
clientes.
b.- La estrategia de nuevos productos se desarrolla cuando se potencia la I+D
en una organizacin con el fin de que permita llevar a cabo polticas de
lanzamiento de nuevos productos, de adaptacin de procesos, de diferenciacin
de productos, de venta de tecnologa y de independencia tcnica respecto a
otras empresas y pases. Estrategia de diferenciacin en calidad, servicio o
distribucin. Estrategia de nicho, que consiste en la especializacin por
producto, clientes o zonas geogrficas.
Esta estrategia consiste en crear nuevos productos para el mundo, en construir
algo que no existe, en inventar satisfactores nuevos, como en su momento lo
fueron el telfono celular, el fax, la Internet, las agendas palm, etctera.
Las decisiones estratgicas que pueden acompaar la estrategia de nuevo
producto son (Hax, A. & Majluf, N., 1996):
Estrategia de alta penetracin. El producto nuevo se lanza a un precio elevado
con el propsito de recobrar el beneficio bruto de cada unidad. Al mismo
tiempo, se gastar mucho en promocin con la finalidad de convencer o atraer
al mercado sobre los beneficios y excelencias del producto, no importando su
alto precio. La promocin facilitar o acelerar la penetracin del producto en
el mercado; esta decisin estratgica se explica con las siguientes suposiciones:
el mercado potencial no conoce el producto; quienes se enteran del nuevo
producto, estn impacientes por comprarlo, lo hacen al precio establecido; la
organizacin tendr que crear la preferencia de marca.
32
35
36
37
38
Tcnico
Tributario, legal y ambiental
Administrativo y organizacional
Econmico y financiero
39
-3,00
-2,50
-2,00
-1,50
-1,00
-0,50
0,00
0,50
1,00
X
FIG. 19: EJEMPLO GRFICO, REGRESIN LINEAL
pendiente cambio que tendr Y por cada unidad que cambie X. El trmino
constante
se emplea en muchos casos, pero generalmente no es esencial para
el anlisis.
Cuando se habla de varias variables se dice que es una regresin mltiple y
sera de la siguiente forma (Gujarati, 2004):
Ct 1 2Yt t
No hay que confundir esta hiptesis de linealidad con la linealidad entre las
variables. Por ejemplo, en las relaciones entre Y y X que se dan a continuacin,
slo la primera es formalmente lineal. Sin embargo, cumplen la hiptesis de
linealidad en los parmetros las tres ecuaciones:
41
y 1 2 x
y 1 2e x
y 1 2 ln x
En determinadas relaciones econmicas no se cumple la hiptesis de linealidad
en los coeficientes. El ejemplo clsico de una funcin que no cumple con la
linealidad de los parmetros es la funcin de produccin de tipo Cobb-Douglas,
donde se representa la funcin de produccin de la empresa, como una relacin
entre la variable trabajo y la variable stock de capital:
Y AK L
2. Hiptesis de especificacin correcta. Esta hiptesis supone que las
variables explicativas, o las X del modelo, son aquellas variables
relevantes que explican el comportamiento de la variable endgena o
Y. No existe alguna variable exgena que no explique nada de la
variable endgena; es decir, que no hay X que no aporte al modelo. En
otras palabras, el modelo est bien planteado o especificado.
Esta hiptesis supone aceptar en la prctica dos cosas no siempre ciertas
(Wooldridge, 2006):
Aceptar que siempre hay una teora detrs que me permite saber cules
son las variables relevantes en cada modelo.
Aceptar que sobre estas variables dispongo siempre de informacin
muestral adecuada.
3. Hiptesis de grados de libertad positivos. Los grados de libertad de un
modelo se definen como la diferencia entre el nmero de datos (n) y el
nmero de variables explicativas (p). Es decir,
.
Esta hiptesis supone que, como mnimo, es necesario disponer de tantos datos
como parmetros a estimar. No obstante, es preferible siempre disponer de ms
datos que parmetros a estimar.
4. Hiptesis de parmetros constantes. Esta hiptesis supone que los
parmetros son constantes en el tiempo.
5. Hiptesis de independencia lineal entre las variables explicativas. Esta
hiptesis implica que cada variable explicativa contiene informacin
adicional sobre la endgena que no est contenida en otras. Si hubiera
informacin repetida, habra variables explicativas dependientes
linealmente de otras. Formalmente, se puede resumir la informacin
muestral sobre las variables explicativas en una matriz, con la siguiente
estructura:
42
x11
x
n1
x1k
xnk
Donde cada columna recoge los datos asociados a cada variable. El hecho de
que cada columna sea linealmente independiente de las otras implica que el
rango de la matriz X es completo, es decir, igual al nmero de variables (n). Si
alguna variable es linealmente dependiente de otra, se dice que existe un
problema de multicolinealidad perfecta.
6. Hiptesis de regresores no estocsticos. Esta hiptesis implica que los
datos de las variables explicativas son fijos en muestras repetidas.
Existen tres situaciones en econometra donde no es posible mantener esta
hiptesis:
Modelos de ecuaciones simultneas. Por ejemplo, un modelo de demanda y de
oferta de un bien que se intercambia en un mercado competitivo en equilibrio,
se puede escribir:
qtd a bpt 1t
pt c dqto 2t
qtd qto , t 1, 2,
,n
Ct 1 2Ct 1 3Yt t
donde el propio modelo indica que el consumo retardado es un regresor
estocstico al depender de un error aleatorio.
Modelos con errores de medida en las variables explicativas. Bajo la hiptesis
de renta permanente de Friedman, el consumo slo depende del componente
permanente de la renta ( Yt P ):
Ct bYt P t
43
Yt Yt P YtT
donde el componente transitorio ( Yt T ) o las desviaciones aleatorias alrededor
de la renta media de un agente no es observable. Por tanto, la renta permanente
( Yt P ) es un regresor estocstico, ya que Yt P Yt YtT .
7. Hiptesis referentes a las perturbaciones aleatorias del modelo o
hiptesis de Gauss-Markov. El trmino de error satisface las siguientes
hiptesis:
Esperanza nula en todo instante de tiempo: Ya que es tratado como la suma de
muchos efectos individuales sobre la variable endgena o Y, donde el signo de
cada uno es desconocido, no existe ninguna razn para esperar cualquier valor
distinto de cero. Matemticamente (Gujarati, 2004):
Donde
es un escalar constante para toda i. Lo que significara que habra
una distribucin de probabilidad de idntica amplitud para cada variable
aleatoria.
Esta cualidad es necesaria, segn el Teorema de Gauss-Markov, para que en un
modelo los coeficientes estimados sean los mejores o eficientes, lineales e
insesgados. (Gujarati, 2004)
44
1 1
E . = .
n n
45
Matriz de varianzas y covarianzas: Sera una matriz que recoge las varianzas de
cada variable en la diagonal principal y las covarianzas entre una perturbacin
y otra diferente fuera de la diagonal. Es simtrica, definida positiva y de
tamao n n .
var(1 ) cov(1 2 )
cov( 21 ) var( 2 )
var( )
.
.
cov( n1 ) cov( n 2 )
. cov(1 n ) E (12 ) E (1 2 )
. cov( 2 n ) E ( 21 ) E ( 22 )
.
.
.
.
. var( n ) E ( n1 ) E ( 2 n )
. E (1 n )
. E ( 2 n )
.
.
2
. E ( n )
n(n 1)
. No obstante, si la
2
= ( ) ;
46
=( )
)(
( )
Y X
La funcin objetivo minimizar la suma de cuadrados de los residuos con
respecto a los p parmetros del modelo se puede escribirse como:
n
Operando:
47
T
2 X T Y 2 X T X 0
donde se han tenido en cuenta los siguientes resultados sobre las derivadas
matriciales:
z T w
w
z
zT Az
2 Az
z
48
( )
Para usar este mtodo se piden los mismos supuestos que en MCO agregado el
de la distribucin normal de los errores. (Reguera, 2000), (Gujarati, 2004).
Mnimos cuadrados generalizados o ponderados
Dada la existencia de autocorrelacin o de heterocedasticidad en los modelos
estos pueden ser calculados a travs del mtodo de los mnimos cuadrados
generalizados (Gujarati, 2004). El nico requisito que se mantiene es que la
media de los residuales debe ser cero (Reguera, 2000). Donde los estimadores
se pueden calcular como:
Siendo G:
( )
49
Grados de
libertad
P
Suma de
cuadrados
Residual
n-p-1
Total
n-1
Cuadrados Medios
Cuadrados Medios
Regresin mltiple:
Fuente de la
Variacin
Regresin
Grados de
libertad
P
Residual
n-p-1
Total
n-1
Suma de
cuadrados
Ha = una o ms j 0
50
Ha: j0 0
y
| |
j=0,1,2,p
|
Donde:
n = tamao de la muestra
k = nmero de variables independientes
51
Como ya se vio antes, para usar las tcnicas anteriormente nombradas para el
clculo de los modelos, se tienen que evitar la existencia de heteroestacidad,
multicolinealidad perfecta y autocorrelacin en ellos (Gujarati, 2004). A
continuacin se ver como identificar estos fenmenos:
Heterocedasticidad: es una importante violacin a los requerimientos de una
estimacin de parmetros por MCO o MV y uno de los supuestos a considerar
en una regresin. Esta invalida los resultados, ya que hace que la estimacin de
los parmetros no sea eficiente, a pesar de que sigan siendo insesgados. La
heteroestacidad es cuando los residuales o errores no tienen una varianza
constante. El principal modo de ser detectada es por el mtodo grfico:
52
Donde (g2) representa el coeficiente de curtosis, (Xi) cada uno de los valores,
la media de la muestra y (ni) la frecuencia de cada valor. Los resultados de
esta frmula se interpretan:
53
Donde (g1) representa el coeficiente de asimetra de Fisher, (Xi) cada uno de los
valores, la media de la muestra y (ni) la frecuencia de cada valor. Los
resultados de esta ecuacin se interpretan:
Desde luego entre mayor sea el nmero (positivo o negativo), mayor ser la
distancia que separa la aglomeracin de los valores con respecto a la media.
Con este antecedente, Jarque y Bera desarrollaron un estadstico que evala en
forma conjunta la hiptesis nula si el coeficiente de asimetra y curtosis toman
valores de 0 y 3 respectiva y conjuntamente.
H0: t se aproxima a una distribucin normal.
H1: t no se aproxima a una distribucin normal.
Jarque - Bera se formula:
54
T: Tamao de muestra
K: Es la curtosis
S: Es la asimetra
k: Nmero de regresores
2
T k 2 K 3
JB
S
6
4
Regla de decisin:
JB (2 ;2)
Para ilustrar mejor, tomaremos datos del caso que se plantea al final del
captulo. Veremos si el error no estandarizado tiene una distribucin normal,
segn el test de Jarque Bera. En este caso tenemos:
k=3
T = 25
(20,95;2) 0,1026
Nos quedara calcular la asimetra y la curtosis, esto lo haremos con el
programa SPSS:
Estadsticos
Unstandardized Residual
N
Vlidos
25
Perdidos
Asimetra
,513
,464
Curtosis
-1,044
,902
55
JB
2
1,044 32 15,956061
T k 2 K 3 25 3
2
S
0
,
513
6
4
6
4
Supngase que
en la forma:
Donde
es una constante. Esto significara que
sera proporcional al
cuadrado de . Si este resulta ser el caso, es muy probable que exista
heterocedasticidad en el modelo (Gujarati, 2004). Para probar esto Goldfeld y
Quandt sugieren los siguientes pasos.
1.- Ordenar las observaciones de acuerdo con los valores de
el ms bajo.
56
. Empezando por
Es decir, con los residuos al cuadrado se hace una regresin sobre las variables
X originales pero sobre sus productos cruzados (recordar que el anterior
57
Si algn
, indica colinealidad perfecta o matemtica. Es decir, la variable
Xi se puede escribir como una combinacin lineal de las anteriores. Al formar
un modelo se debe evitar la colinealidad perfecta; si ocurre, hay que eliminar la
variable que la produce.
La multicolonealidad aumenta la varianza de los estimadores MCO, lo cual trae
como consecuencia: Las dcima de t-student para los son insensibles y las
observaciones se tornan influyentes.
Para poder detectar la multicolonealidad hay muchas formas, entre ellas:
Siendo SCE la suma de cuadrados del error, CME los cuadrados medios del
error.
Para interpretar este estadstico, se define el error cuadrtico medio de
prediccin para los puntos observados cuando se utiliza un modelo con p
parmetros como
( )
donde
( )
3.6 Autocorrelacin
La autocorrelacin es la dependencia de un valor de su anterior valor dado si
estos son ordenados. Si esto ocurre al nivel de los residuales se violan los
requisitos para estimar un modelo por MCO o por MV. La autocorrelacin
invalida las dcima global de los estimadores (F) y la particular de cada
estimador (t), (Wooldridge, 2006).
Para detectar la autocorrelacin de primer orden AR (1) existe la dcima de
Durbin y Watson (Gujarati, 2004). En la cual es estadgrafo sera:
En la figura, donde dice ???, es que las zonas no son concluyentes sobre la
autocorrelacin.
Prueba de rachas: El contraste de rachas permite verificar la hiptesis nula de
que la muestra es aleatoria, es decir, si las sucesivas observaciones son
independientes. Este contraste se basa en el nmero de rachas que presenta una
muestra. Una racha se define como una secuencia de valores mustrales con
una caracterstica comn precedida y seguida por valores que no presentan esa
caracterstica. As, se considera una racha la secuencia de k valores
consecutivos superiores o iguales a la media muestral (o a la mediana o a la
moda, o a cualquier otro valor de corte) siempre que estn precedidos y
seguidos por valores inferiores a la media muestral (o a la mediana o a la moda,
o a cualquier otro valor de corte).
60
61
Se cree que con estas nuevas variables, se obtiene informacin suficiente para
evaluar casos atpicos y/o influyentes.
62
63
R cuadrado
a
,986
R cuadrado corregida
,972
estimacin
,968
Durbin-Watson
1,12749E10
,898
Coeficientes
Modelo
1
(Constante)
Coeficientes no
Coeficientes
Estadsticos de
estandarizados
tipificados
colinealidad
Error tp.
Beta
-8,097E10
1,165E10
IPC
9,297E8
9,103E7
Cobre
3,782E8
Desocupados
3,462E7
Sig.
Tolerancia
FIV
-6,948
,000
,578
10,214
,000
,396
2,523
2,983E7
,531
12,680
,000
,725
1,380
3,143E7
,056
1,102
,283
,500
2,000
64
Diagnsticos de colinealidad
Proporciones de la varianza
ndice de
Modelo
Dimensin
Autovalores
condicin
(Constante)
IPC
Cobre
Desocupados
3,789
1,000
,00
,00
,01
,00
,120
5,610
,04
,00
,74
,03
,078
6,986
,14
,50
,10
,00
,013
16,826
,82
,50
,15
,97
Correlacin
0 - 1,078
Positiva
1,078 - 1,66
Incierta
1,66 - 2,34
Nula
2,34 - 2,922
Incierta
2,922 - 4
Negativa
Si es que quedara en una zona incierta, habra que aplicar otro test, como lo es
el test de rachas.
El siguiente paso ser sacar la variable desocupados y hacer de nuevo un
modelo con las variable que quedan, para ver si es que se elimina el problema
de la autocorrelacin tambin.
65
Modelo
R cuadrado
Error tpica de la
corregida
estimacin
R cuadrado
a
,985
,971
,968
Durbin-Watson
1,13272E10
,885
ANOVA
Suma de
Modelo
1
cuadrados
Gl
Media cuadrtica
Regresin
9,710E22
4,855E22
Residual
2,951E21
23
1,283E20
Total
1,001E23
25
Sig.
a
378,398
,000
Coeficientes
Modelo
1
(Constante)
Coeficientes no
Coeficientes
Estadsticos de
estandarizados
tipificados
colinealidad
Error tp.
-7,010E10
6,229E9
IPC
9,993E8
6,582E7
Cobre
3,706E8
2,916E7
Beta
66
Sig.
Tolerancia
FIV
-11,253
,000
,622
15,184
,000
,765
1,307
,520
12,710
,000
,765
1,307
Diagnsticos de colinealidad
Proporciones de la varianza
Dimensi
Modelo
Autovalores
ndice de condicin
(Constante)
IPC
Cobre
2,827
1,000
,01
,01
,02
,095
5,447
,47
,04
,88
,078
6,035
,51
,94
,10
67
De los grficos se aprecia que los residuos no presentan ninguna clara relacin
con alguna de las variables, por lo que a simple vista se puede decir que el
modelo no presenta heterocedasticidad.
Es importante mencionar que si posteriormente no se fuese aplicar MCP, sera
necesario aplicar un test ms formal para ver si efectivamente el modelo
presenta o no heterocedasticidad. Ya que si existiera, y se dejara la regresin
actual, los estimadores serian insesgados, pero ineficientes. Y esto impedira
que el modelo sea un buen predictor del PIB, sirviendo nada ms para saber el
comportamiento y, a groso modo, de esta variable con respecto a las variables
independientes.
Anlisis de normalidad de los residuos
Este anlisis busca corroborar que los residuos se comporta de manera normal,
para lo cual se grafican sus valores esperados con respecto a los estimados.
Buscando que si lo errores se comportan de manera normal, el grfico se
asemeje a lo que es una lnea recta.
68
A pesar de la tendencia a una lnea recta, se puede ver algunas curvas. Se puede
decir que hay cierto grado de heterocedasticidad. Igual comprobaremos con el
test de Jarque-Bera y la dcima de Shapiro Wilk para confirmar (Gujarati,
2004), (Wooldridge, 2006).
Jarque - Bera se formula:
T: Tamao de muestra
K: Es la curtosis
S: Es la asimetra
k: Nmero de regresores
JB
T k
6
2 K 32
S
Regla de decisin:
JB (2 ;2)
69
Para ilustrar mejor, tomaremos datos del caso que se plantea al final del
captulo. Veremos si el error no estandarizado tiene una distribucin normal
segn el test de Jarque Bera. En este caso tenemos:
k=3
T = 25
(20,95;2) 0,1026
Nos quedara calcular la asimetra y la curtosis, esto lo haremos con el
programa SPSS:
Estadsticos
Unstandardized Residual
N
Vlidos
25
Perdidos
Asimetra
,513
,464
Curtosis
-1,044
,902
JB
2
1,044 32 15,956061
T k 2 K 3 25 3
2
S
0
,
513
6
4
6
4
70
b,c
Error tp. de la
Modelo
R cuadrado
a
,981
R cuadrado corregida
,963
estimacin
,959
Durbin-Watson
1,62045E10
1,107
b,c
ANOVA
Modelo
1
Suma de cuadrados
Gl
Media cuadrtica
Regresin
1,550E23
7,751E22
Residual
6,039E21
23
2,626E20
Total
1,611E23
25
Sig.
295,174
,000
Coeficientes
a,b
Coeficientes
Coeficientes no estandarizados
Modelo
1
(Constante)
Error tp.
tipificados
Beta
-5,650E10
7,401E9
IPC
8,708E8
1,031E8
Cobre
3,887E8
4,678E7
Estadsticos de colinealidad
t
Sig.
Tolerancia
-7,634
,000
,527
8,445
,000
,419
2,387
,518
8,309
,000
,419
2,387
71
FIV
72
Ao
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
Recta Tendencia
4
3
2
Datos observados
1
0
2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011
Aos
como las ventas de trajes de bao, tarjetas de saludo, frutas frescas y similares.
La palabra "estacional" se refiere directamente a las estaciones climatolgicas
del ao, pero la idea es referirse a movimientos oscilatorios dentro del ao,
coincidan o no con las estaciones climticas.
Ventas
2,5
2,1
3,9
2,5
3,2
4,1
3,2
4,6
4,3
3,7
5,1
5,4
Millones de dlares
Mes
Enero
Febrero
Marzo
Abril
Mayo
Junio
Julio
Agosto
Septiembre
Octubre
Noviembre
Diciembre
Variacin Estacional
3
2
1
0
Meses
74
Tiempo
FIG. 30: COMPONENTE NO SISTEMICO EN UNA SERIE DE TIEMPO
Modelo multiplicativo:
Se expresa por Yt = Tt * St * Ct * I t. En este caso slo la tendencia est
expresada en las unidades de Y, mientras que los otros componentes se
expresan como razones, nmeros puros o porcentajes.
El modelo aditivo sufre el supuesto irreal de que los movimientos o
componentes son independientes uno de otro, algo que difcilmente se da en el
caso de la vida real.
75
76
Media mvil: Definimos una media mvil de primer orden MA(1) como un
proceso aleatorio que responde a una expresin del tipo:
77
con
en diferencias a la media
estacionario.
78
X(t)
X(1)
X(2)
X(3)
X(4)
X(5)
X(6)
--
t 2.
79
80
|
|
82
Ao
1975
1976
1977
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
CME
Precio
118
120
115
122
210
240
218
220
150
130
308
370
360
345
290
300
255
525
540
480
440
610
615
650
625
630
510
670
720
750
790
740
670
685
700
705
725
740
a=0,0779
118,0
118,0
119,8
115,4
121,5
203,1
237,1
219,5
220,0
155,4
132,0
294,3
364,1
360,3
346,2
294,4
299,6
258,5
504,2
537,2
484,5
443,5
597,0
613,6
647,2
626,7
629,7
519,3
658,3
715,2
747,3
786,7
743,6
675,7
684,3
698,8
704,5
723,4
5719,04
a=0,5
118,0
118,0
119,0
117,0
119,5
164,8
202,4
210,2
215,1
182,5
156,3
232,1
301,1
330,5
337,8
313,9
306,9
281,0
403,0
471,5
475,7
457,9
533,9
574,5
612,2
618,6
624,3
567,2
618,6
669,3
709,6
749,8
744,9
707,5
696,2
698,1
701,6
713,3
6366,91
a=0,7
118,0
118,0
118,6
117,5
118,9
146,2
174,3
187,4
197,2
183,0
167,1
209,4
257,6
288,3
305,3
300,7
300,5
286,9
358,3
412,8
433,0
435,1
487,6
525,8
563,1
581,6
596,1
570,3
600,2
636,1
670,3
706,2
716,3
702,4
697,2
698,0
700,1
707,6
8259,45
PronosSPSS
118,1
118,0
119,8
115,4
121,5
203,0
237,1
219,5
220,0
155,5
132,0
294,1
364,0
360,3
346,2
294,4
299,6
258,5
504,0
537,2
484,5
443,5
596,9
613,6
647,1
626,7
629,7
519,4
658,1
715,1
747,3
786,6
743,7
675,8
684,3
698,8
704,5
723,4
5719,67
83
Modelo_1
Simple
Serie
206,0
199,0
181,3
205,6
225,7
218,7
201,0
225,3
245,4
238,4
220,7
245,0
Serie SPSS
202
195
177
201
224
218
202
226
250
242
223
248
271
264
246
271
84
2010
10,417
-0,506
-24,429
-6,352
2011
19,725
9,802
-17,121
3,956
2012
16,033
1,110
-15,813
3,264
R prom
E(i)
15,392
3,469
-19,121
0,289
0,0072
FE(i)
15,385
3,462
-19,128
0,282
Consumo Helado
Modelo_1
Aditivo de Winters
Previsin
Modelo
Consumo HeladoModelo_1
T1 2013
T2 2013
T3 2013
T4 2013
Previsin
271
264
246
271
LCS
280
274
256
281
LCI
262
255
237
261
Para cada modelo, las predicciones comienzan despus del ltimo valor no perdido del rango del perodo de
estimacin solicitado y finalizan en el ltimo perodo para el que hay disponibles valores no perdidos de todos los
predictores o en la fecha de finalizacin del perodo de prediccin solicitado, lo que ocurra antes.
85
2011
2012
2013
Serie
204,440
198,610
182,680
205,347
225,563
218,614
200,628
225,038
246,687
238,619
218,576
244,730
Serie SPSS
202
195
177
201
224
218
202
226
250
242
223
248
271
264
246
271
2010
1,055
0,997
0,878
0,969
2011
1,094
1,046
0,922
1,018
2012
1,070
1,005
0,934
1,013
R prom
E(i)
1,073
1,016
0,911
1,000
1,0000
FE(i)
1,073
1,016
0,911
1,000
86
Por supuesto, es muy probable que la serie de tiempo Yt, tenga caractersticas
de AR y MA a la vez, es decir, un proceso autorregresivo y de media mvil,
ARMA. Por ejemplo, si Yt sigue un proceso ARMA(1,1), este puede escribirse
como
Yt = at + 1Yt-1 + 1t + 2t-1
Porque hay un trmino autorregresivo y uno de media mvil, y a t representa un
trmino constante.
En general, en un proceso ARMA(p,q), habr p trminos autorregresivos y q
trminos de medias mviles.
Se sabe que muchas series econmicas no son estacionarias (Gujarati, 2004),
los supuestos para que una serie sea estacionaria son, que la media y varianza
de la serie son constantes y su covarianza es invariante en el tiempo, por
consiguiente se deben diferenciar d veces para hacerla estacionaria.
Si se debe diferenciar una serie de tiempo d-veces para hacerla estacionaria y
luego se aplica a sta el modelo ARMA(p,q), se dice que la serie original es
ARIMA(p,d,q), es decir, es una serie de tiempo autorregresiva integrada de
87
Del grfico se puede apreciar una leve tendencia al alza en el precio. Adems
no se ven claramente las estacionalidades, por lo que podramos deducir
que la serie no presenta estacionalidad.
4.5 Anlisis de Autocorrelaciones
89
90
En el primer grfico, se puede ver una clara tendencia. Este tipo de diagramas
es comn en los procesos que no son estacionarios, por lo que se confirma la no
existencia de estacionalidad vista en el grafico de la serie.
Al analizar el grfico de autocorrelaciones parciales, que considera la
relacin existente solo con el retardo sealado, eliminando la de
anteriores rezagos, se pueden realizar afirmaciones ms concluyentes sobre
la relacin entre periodos. En este caso podemos ver que existe una alta
correlacin con el retardo uno, pero adems, se puede ver una correlacin
significativa para los retardos 2,3 y 14.
Modelo:
Ahora para crear el modelo para la serie, se utiliza la herramienta crear
modelo del SPSS. Esta es capaz de elegir el mejor modelo para la
serie, dndonos adems la posibilidad de elegir nosotros el modelo.
Adems, pregunta cuantos pronsticos se quieren obtener, grficos que se
desean, etc.
En esta ocasin se deja que se elija solo el mejor modelo, pidindole al
programa las 6 proyecciones siguientes a los datos que se tienen, obteniendo lo
siguiente.
Descripcin del modelo
Tipo de modelo
91
Petrleo
Modelo_1
Tendencia amortiguada
Estadstico de
ajuste
R-cuadrado
Media
ET Mnimo Mximo
10
25
50
75
90
95
,206 .
,206
,206
,206
,206
,206
,206
,206
,206
,206
,963 .
,963
,963
,963
,963
,963
,963
,963
,963
,963
RMSE
4,999 .
4,999
4,999
4,999
4,999
4,999
4,999
4,999
4,999
4,999
MAPE
7,265 .
7,265
7,265
7,265
7,265
7,265
7,265
7,265
7,265
7,265
estacionaria
R-cuadrado
MaxAPE
MAE
MaxAE
BIC normalizado
25,602 .
3,740 .
3,740
19,611 .
3,740
3,740
3,740
3,740
3,740
3,740
3,740
3,740
3,331 .
3,331
3,331
3,331
3,331
3,331
3,331
3,331
3,331
3,331
Modelo
Nmero de
R-cuadrado
predictores
estacionaria
petrleo-
Ljung-Box Q(18)
Nmero de
R-cuadrado
,206
,963
Estadsticos
20,306
GL
Sig.
15
valores atpicos
,161
Modelo_1
Parmetros del modelo de suavizado exponencial
Modelo
petrleo-Modelo_1
Estimacin
Sin transformacin
ET
Sig.
Alpha (Nivel)
,849
,250
3,393
,001
Gamma
,998
1,062
,939
,349
(Tendencia)
92
Modelo
Nmero de
R-cuadrado
predictores
estacionaria
Ljung-Box Q(18)
Nmero de
R-cuadrado
Estadsticos
Phi (Factor de
GL
Sig.
,600
,208
valores atpicos
2,885
,005
amortiguacin de la
tendencia)
Previsin
Modelo
Nov 2010
petrleo-Modelo_1
Dic 2010
Ene 2011
Feb 2011
Mar 2011
Abr 2011
Previsin
84,01
85,91
87,05
87,74
88,15
88,39
LCS
93,91
102,60
110,48
117,45
123,60
129,10
LCI
74,12
69,23
63,62
58,03
52,69
47,69
Para cada modelo, las predicciones comienzan despus del ltimo valor no perdido del rango del perodo de
estimacin solicitado y finalizan en el ltimo perodo para el que hay disponibles valores no perdidos de todos los
predictores o en la fecha de finalizacin del perodo de prediccin solicitado, lo que ocurra antes.
94
ascendente, hasta que, al final del proceso, todos los casos estn englobados en
un mismo conglomerado. Los mtodos disociativos o divisivos realizan el
proceso inverso al anterior. Empiezan con un conglomerado que engloba a
todos los individuos. A partir de este grupo inicial se van formando, a travs de
sucesivas divisiones, grupos cada vez ms pequeos. Al final del proceso se
tienen tantos grupos como individuos en la muestra estudiada.
Independientemente del proceso de agrupamiento, hay diversos criterios para ir
formando los conglomerados; todos estos criterios se basan en una matriz de
distancias o similitudes. Por ejemplo, dentro de los mtodos aglomerativos
destacan:
1.
2.
3.
4.
5.
6.
b) El Quick-Clster anlisis.
c) El mtodo de Forgy.
d) El mtodo de las nubes dinmicas.
Mtodos de bsqueda de la densidad:
Dentro de estos mtodos estn los que proporcionan una aproximacin
tipolgica y una aproximacin probabilstica.
En el primer tipo, los grupos se forman buscando las zonas en las cuales se da
una mayor concentracin de individuos. Entre ellos destacan:
a) El anlisis modal de Wishart.
b) El mtodo Taxmap.
c) El mtodo de Fortn.
En el segundo tipo, se parte del postulado de que las variables siguen una ley
de probabilidad segn la cual los parmetros varan de un grupo a otro. Se trata
de encontrar los individuos que pertenecen a la misma distribucin. Entre los
mtodos de este tipo destaca el mtodo de las combinaciones de Wolf.
Mtodos directos:
Permiten clasificar simultneamente a los individuos y a las variables. El
algoritmo ms conocido dentro de este grupo es el Block-Clustering.
Mtodos de reduccin de dimensiones:
Estos mtodos consisten en la bsqueda de unos factores en el espacio de los
individuos; cada factor corresponde a un grupo. Se les conoce como Anlisis
Factorial tipo Q.
5.2 Etapas de un Anlisis Clster
Para hacer un anlisis clster se debe seguir los siguientes pasos:
1. Seleccin de muestra de datos.
2. Seleccin y transformacin de variables a utilizar.
3. Seleccin del mtodo y concepto de distancia o similitud.
Cuando se refiere a seleccin del concepto de distancia o similitud habla del
criterio que se usar para definir los grupos, por lo tanto es importante tenerlo
en mente para el anlisis antes de formar los clster y despus de ellos. Los
criterios pueden ser variados y depende de la persona encargada del estudio.
Los criterios pueden ser de:
D2 de Manhalanobis
98
Este diagrama se lee de abajo hacia arriba. Al principio todos los casos estn
separados, excepto el 146 y el 77 que se unen formando el primer grupo.
Mientras ms se avanza hacia arriba ms grupos se van uniendo y menos son
los nmeros de conglomerados, hasta llegar arriba donde todos son un gran
conglomerado.
Tambin el dendograma puede ser mostrado en forma horizontal:
Rescaled Distance Cluster Combine
C A S E
Label Num
0
5
10
15
20
25
+---------+---------+---------+---------+---------+
72
146
231
174
145
171
209
20
126
181
117
178
336
275
333
-+
-+
-+
-+-------+
-+
+-----------------------+
-+-------+
+---------------+
-+
|
|
---------------------------------+
|
-+
|
-+
|
-+-+
|
-+ |
|
-+ +---------------------------------------------+
-+ |
---+
99
102
Conglomerado 1
Conglomerado 2
Coeficientes
Conglomerado 1
Prxima
Conglomerado 2
etapa
23,662
67,994
154,551
293,459
436,388
599,637
H I E R A R C H I C A L
C L U S T E R
A N A L Y S I S
0
5
10
15
20
25
+---------+---------+---------+---------+---------+
1
2
3
4
5
-+-+
-+ +-------------------+
---+
+-------------------------+
-----------------------+
|
-----------+-----------------------+
|
103
6
7
-----------+
+-------------+
-----------------------------------+
104
o
o
106
Races
< 25 aos
25 aos
Rechazar
Experiencia
3 aos
< 3 aos
Rechazar
Aceptar
107
Hojas
Criterio
109
Min(p1,p2,,pc)
1-(pi)2
pi log(pi)
2(pi)1/2
Error Esperado
GINI
Entropa (gain)
DKM
Los nodos que estn por debajo del lmite de poda se eliminan, ya que se
consideran demasiado especficos.
Los mtodos de poda pueden dividirse en dos: prepoda y pospoda.
110
Talla 21,7
Color = verde
Talla 21,7
Color = verde
Color = verde
IND (Buntine 1992, LMDT (Brodley & Utgoff 1995) y otros sistemas
hbridos: incorporan caractersticas de varios sistemas o aaden otras
tcnicas de aprendizaje y construccin de rboles de decisin:
regresin lineal, perceptrones, etc.
Ratio Financiero
Capital de Trabajo / Total
de Activos
Activo Circulante / Pasivo
Circulante
Ventas / Total de Activos
EBIT / Gastos Financieros
Total de Deuda / Total de
Activos
Total de Deuda / Total de
Patrimonio
Margen Operacional /
Total de Activos
Utilidad del Ejercicio /
Total de Activos
Categora
Liquidez
Liquidez
Actividad
Cobertura
Solvencia
Solvencia
Rentabilidad
Rentabilidad
113
1_Entrenamiento
15
88,24%
2
11,76%
114
Total
17
'Particin'
Correctos
Errneos
Total 13
2_Comprobacin
10
76,92%
3
23,08%
115
Particin
Correctos
Errneos
Total 17
1_Entrenamiento
17
100%
0
0%
'Particin'
2_Comprobacin
116
Correctos
Errneos
Total 13
9
4
69,23%
30,77%
117
118
119
Donde x1 ,x2 ,...,xp son las seales de entrada; wk1 ,wk2 ,...,wkp son los pesos
sinpticos de la neurona k; uk es la combinacin lineal de la salida; k es el
umbral; (.) corresponde a la funcin de activacin; e yk es la seal de salida
de la neurona.
120
Patrones
de
entrada
Patrones
de
Salidas
121
Este modelo neuronal en particular, que utiliza una funcin umbral como
funcin de activacin, corresponde al llamado modelo de McCulloch-Pitts
(McCulloch and Pitts, 1943). Aqu la salida de la neurona toma el valor de1 si
el nivel de actividad interna total de esa neurona es no negativo y 0 en
cualquier otro caso. Dicho de otro modo, si la suma de los entradas ponderadas
que llegan a una neurona desde otras (
), supera (o es mayor) al
umbral de esa neurona (k), la salida tomar valor de 1, y en cualquier otro caso
tomar un valor de 0.
2.- Funcin lineal por tramos: Se ilustra esta funcin en la siguiente figura, se
tiene:
122
123
127
Pesos Chilenos
3,5E+13
Multifondos - Chile
3E+13
2,5E+13
2E+13
1,5E+13
1E+13
5E+12
0
Fondo A
Fondo D
Fondo B
Fondo E
Fondo C
Para las variables de entrada, por parte del mercado se vio lo que las mismas
AFP dicen que afecta a la rentabilidad, para as representar esa parte de la
variabilidad de la cantidad del fondo. Sobre los cambios que hace el afiliado
entre fondos, se sabe que tienen cierta relacin con la economa y como se ven
en el fondo, algo que se ve claramente en el grfico en el caso del fondo E,
donde aumento entre el 2008 y el 2009 en momentos de crisis. Esto ltimo se
debe por decisin propia del afiliado o por consejos de la misma AFP. Por
ende, se supondr que los cambios en la rentabilidad son los que explican en su
totalidad o en gran parte, la variabilidad de los fondos.
Las AFP dicen que la rentabilidad de los fondos est dividida en dos tipos de
papeles, los de renta variable y los de renta fija, los cuales tambin pueden
clasificarse en papeles internacionales y nacionales. Sobre la segunda
clasificacin nombrada las AFP dicen tener sus papeles en, (Contreras, 2012):
Internacional:
Asia Emergente
Latino Amrica
Norteamrica
Asia Pacifico Desarrollada
Europa emergente
frica-Medio Oriente
Europa
Nacional:
Servicios
128
Elctrico
Recursos naturales
Industrial
Telecomunicaciones
Correlaciones de Pearson
SSE Composite Index - China
0.499
DowJones
0.369
Nikkei
-0.377
RTSI
0.490
Next150
0.315
IPC - Mexico
0.950
IBOVESPA
0.909
BSE SENSITIVE
0.921
TEL AVIV
0.826
Banca
0.202
CONST.&INMOB.
0.928
UTILITIES
0.802
INDUSTRIAL
0.846
130
RETAIL
0.874
CONSUMO
0.882
Comodities
0.948
Quedando:
Variable objetivo
1. Cantidad diaria fondo A . Fuente: Superintendencia de pensiones.
Variables de entrada
BSE SENSITIVE (India). Fuente: Yahoo Finanzas.
IPC (Mxico). Fuente: Yahoo Finanzas.
IBOVESPA (Brasil). Fuente: Yahoo Finanzas.
Const.&Inmob. (Chile). Fuente: Bolsa de Santiago.
Consumo (Chile). Fuente: Bolsa de Santiago.
Comodities (Chile). Fuente: Bolsa de Santiago.
Para entrenar estas redes se decidi hacer tres grupos de datos. Primero un
grupo de Entrenamiento, el cual es el grupo con que se entrena la red en el
programa, el grupo de Comprobacin, que son datos dentro de la misma fecha
del grupo de entrenamiento que no se ocupan en la red, que sirven para ver si la
red fue bien entrenada y el de Validacin, que sirve para ver como se comporta
la red fuera de los datos que se dieron. Estos fueron conformados as,
(Contreras, 2012):
Datos 2006-2011
Entrenamiento
Comprobacin
Datos enero-abril 2012
Validacin
FIG. 57: GRUPOS DE ENTRENAM IENTO, COMPROBACIN Y VALIDACIN,
CASO RED NEURONAL ARTIFICIAL
Despus de esto se entrenaron todos los modelos disponibles dentro del SPSS
Clementine. Se decidi elegir el mejor modelo considerando dos ndices: El
error absoluto promedio y la Correlacin lineal, que representan en cierta forma
lo deseado para predecir una variable.
Comprobacin
Entrenamiento
Correlacin lineal
Poda Exhaustiva
Poda
Dinmico
Mltiple
Rpido
2,91491E+11
3,3053E+11
3,64206E+11
4,003E+11
4,56332E+11
0,991
0,99
0,986
0,985
0,98
Validacin
Entrenamiento
Rpido
Poda
RBFN
Dinmico
Mltiple
Poda Exhaustiva
Para este caso fue elegido el modelo generado por el entrenamiento del SPSS
Poda. Principalmente porque es el que muestra los mejores resultados en los
dos grupos de entrenamiento y una correlacin lineal positiva.
132
FIG. 59: GRFICO GRUPO DE VALIDACIN, CASO RED
NEURONAL
Pas
% crecimiento
Anual
Q1
Q2
Q3
Q4
2,40%
2,20%
2,50%
2,50%
2,50%
-0,10%
0,00%
-0,30%
0,30%
0,70%
Japn
2,00%
4,10%
0,80%
1,20%
1,40%
Mxico
3,60%
Brasil
3,20%
China
8,20%
India
7,10%
Rusia
4,50%
Israel
3,20%
USA
Euro rea
Anual
Q1
Construccin e
Inmobiliaria
7,50%
Banca
5,30%
Utilities
6,76%
Consumo
6,09%
Industrial
-7,40%
Retail
-16,50%
Comodities
-10,70%
Q2
Q3
Q4
Anual
Q1
0,0065%
0,0239%
Q2
0,0271%
0,0271%
0,0271%
-0,0003%
0,0000%
-0,0033%
0,0033%
0,0076%
0,0054%
0,0440%
0,0087%
0,0131%
0,0152%
133
Q3
Q4
Mxico
0,0097%
Brasil
0,0086%
China
0,0216%
India
0,0188%
Rusia
0,0121%
Israel
0,0086%
Anual
Construccin e
Inmobiliaria
0,0198%
Banca
0,0142%
Utilities
0,0179%
Consumo
0,0162%
Industrial
-0,0211%
Retail
-0,0494%
Comodities
-0,0310%
Q1
Q2
Q3
Q4
Prediccin
Real
Valor
(Pesos chilenos)
13.239.091.863.295.13.009.402.685.534.-
Variacin
Abril-Mayo
-5,88%
-4,22%
134
135
Peter Drucker, abogado y tratadista austraco, autor de numerosas obras sobre gestin de las
organizaciones y sociedad del conocimiento, reconocido como padre del management moderno.
Fue uno de los lderes ms influyente del siglo XX.
136
138
Bibliografa
Beer, S. (1988). Brain of the Firm Second Edition. London and New York:
John Wiley.
Chang, W. & Mauborgne, R. (2005). La estrategia de Ocano Azul. Editorial
Norma.
Contreras, R. (2012). Modelos matemticos para el anlisis estratgico de un
sector financiero. Valparaso: UTFSM.
Drucker, P. F. (2004). What Makes An Effective Executive. Harvard Business
Review.
Godoy, F. (Octubre de 2012). Prediccin de la probabilidad de quiebra de
empresas en Chile mediante redes neuronales artificiales. Chile:
UTFSM.
Gujarati, D. N. (2004). Econometra. McGraw-Hill Interamerica.
Hax, A. & Majluf, N. (1996). Gestin de Empresa. Ediciones Dolmen.
Hax, A. & Wilde, D. (1999). The Delta Model: Adaptive Management for
Changing World. Sloan Management Review, 11-28.
Hax, A. & Wilde, D. (2003). Delta Project. Bogot: Editorial Norma.
Hernndez, J., Ferri Ramirez, C., Ramirez Quintana, Ma. (2004). Introduccin
a la Minera de datos. Editorial Pearson.
Hunger, J. D. (2003). Strategic Management. Prentice Hall.
Johnson, G. & Scholes, K. (2001). Strategic Administration. Prentice Hall.
Kaplan, R. & Norton, D. (Septiembre-Octubre de 2000). Having Trouble with
Your Strategy? Then Map It. Harvard Business Review, 167-176.
Kaplan, R., & Norton, D. (September-October de 1993). Putting the Balance
Scorecard to Work. Harvard Business Review, 134-142.
Kaplan, R., & Norton, D. (Enero-Febrero de 1996). Using the Balanced
Scorecard as a Strategic Management System. Harvard Business
Review, 75-85.
Kaplan, R., & Norton, D. (2001). Cmo Utilizar el Cuadro de Mando Integral
para Implantar y Gestionar su Estrategia. Espaa: Gestin 2000.
Kaplan, R., & Norton, D. (2004). Mapas Estratgicos. Espaa: Gestin 2000.
Kaplan, R., & Norton, D. (2004). The Strategy Map: Guide to Aligning
Intangible Assets. Strategy & Leadership, 32(5), 10-17.
Porter, M. E. (1980). Competitive Strategy. New York: Free Press.
Porter, M. E. (1987). Ventaja Competitiva. Mxico: CECSA.
Porter, M. E. (Marzo-Abril de 1990). The Competitive Advantage of Nations.
Harvard Business Review, 73-93.
Reguera, P. F. (2000). Apuntes de Econometra.
Saavedra, O. & Kristjanpoller, W. (2012). Direccin Estratgica en
organizaciones sin fines de lucro & Data Warehouse (pgs. 10-18).
Colombia: Congreso Iberoamericano, SOCOTE.
Saavedra, O., Saavedra, D. & Torres, A. (2012). Modelo de Direccin
Estratgica (pgs. 100-110). ENEFA.
Samuelson, P. N. (2001). Macroeconoma, Decimosexta edicin. Espaa:
McGraw-Hill.
139
Shmueli, G., Patel, N., & Bruce, P. (2007). Data Mining for Business
Intelligence. Estados Unidos de Norteamerica : John Wiley & Sons,
Inc.
Viuela, P. I., & Len, I. M. (2004). Redes de Neuronas Artificiales. Un
enfoque prctico. Madrid: Pearson Prentice Hall.
Wooldridge, J. M. (2006). Introduccin a la Econometra, Un enfoque
Moderno. Paraninfo.
140
Anexos
Anexo 1: Anlisis de Regresin Lineal en SPSS
Statistical Package for the Social Sciences (SPSS) es un programa estadstico
informtico muy usado en las ciencias sociales y las empresas de investigacin
de mercado. En la actualidad, la sigla se usa tanto para designar el programa
estadstico como la empresa que lo produce. Originalmente SPSS fue creado
como el acrnimo de Statistical Package for the Social Sciences aunque
tambin se ha referido como "Statistical Product and Service Solutions".
Como programa estadstico es muy popular su uso debido a la capacidad de
trabajar con bases de datos de gran tamao. El programa consiste en un mdulo
base y mdulos anexos que se han ido actualizando constantemente con nuevos
procedimientos estadsticos. Cada uno de estos mdulos se compra por
separado.
Como se mencion en el captulo 3, los modelos de regresin lineal son los
modelos que la variable predictora X, la variable respuesta Y y los parmetros
son lineales. Lo cual se puede presentar como:
141
En la parte izquierda, tenemos una lista con todas las variables de nuestro
archivo de datos. El icono que tiene cada variable representa el tipo de dato que
fue especificado para esta variable (en la vista de variables). De esta lista
seleccionaremos, haciendo click sobre la variable correspondiente y luego
presionando el botn con una flecha para cada opcin. Las que son:
Variable Dependiente: Es la variable endgena de la regresin, y es la
que ser explicada por las dems variables independientes o exgenas.
Generalmente es se refiere a ella como Y en la literatura.
Variables Independientes: Son las variables exgenas de la regresin, y
son aquellas que explicaran el comportamiento de la variable
dependiente.
Los mtodos disponibles son:
Introducir: En este mtodo se introducen todas las variables del bloque
de un solo paso.
Por pasos: En cada paso se introduce la variable independiente que no
se encuentre ya en la ecuacin y que tenga la probabilidad para F ms
pequea, si esa probabilidad es suficientemente pequea. Las variables
ya introducidas en la ecuacin de regresin se eliminan de ella si su
probabilidad para F llega a ser suficientemente grande. El mtodo
termina cuando ya no hay ms variables candidatas a ser incluidas o
eliminadas.
Eliminar: Las variables de un bloque se eliminan todas de un solo paso.
Este mtodo no es muy til si se utiliza un solo bloque, ya que
eliminamos todas las variables del modelo. Es til cuando tenemos ms
de un bloque y queremos elegir que variables eliminar para realizar
comparaciones entre modelos con distintas variables.
142
Variables
Modelo
introducidas
eliminadas
Mtodo
Introducir
Error tp. de la
Modelo
R cuadrado
corregida
estimacin
,737a
,543
-,829
,98324
En resumen del modelo observamos los valores R y R 2 que son los coeficientes
de determinacin, los cuales nos permiten ver cunto se explica del
144
ANOVA
Suma de
Modelo
1
cuadrados
Gl
Media cuadrtica
Sig.
Regresin
1,147
,382
,396
,790
Residual
,967
,967
Total
2,114
Aqu se nos muestra la tabla Anova explicada en el captulo III, adems de esto
nos da la significacin o el valor p (Tambin llamado p-value) este nos sirve
para poder comparar las dcimas sin tener que calcular los estimadores. El
valor p es la probabilidad de rechazar la hiptesis nula cuando esta es
verdadera, mientras menor sea es mejor, el cual se compara con el nivel de
significacin que se requiere (generalmente es 0,05). En este caso se muestra
un valor p bastante alto (0,79) por lo cual no se puede rechazar la hiptesis nula
del estadstico F.
Coeficientesa
Coeficientes
Coeficientes no estandarizados
Modelo
1
Error tp.
(Constante)
-35,066
55,497
X1
,459
2,909
X3
8,516
X4
-7,017
tipificados
Beta
Sig.
-,632
,641
,146
,158
,000
18,732
,535
,455
,728
6,737
-,971
-1,042
,487
a. Variable dependiente: Y
TABLA 3: RESULTADOS MODELO REGRESIN LINEAL SPSS. (FUENTE:
ELABORACIN PROPIA)
145
146
Siendo estos:
DEPENDNT: Variable dependiente.
*ZPRED: Valores pronosticados tipificados.
*ZRESID: Residuales tipificados.
*DRESID: Residuales eliminados.
*ADJPRED: Valores pronosticados corregidos.
*SRESID: Residuales estudentizados.
*SDRESID: Residuales estudentizados eliminados.
Tambin se pueden obtener el valor de los residuos tipificados o no en el SPSS.
Al entrar en anlisis en la regresin se aprieta en Guardar, ah nos mostrar la
siguiente ventana:
Multicolonealidad
Para hacer pruebas de multicolonealidad en SPSS se hace un anlisis de
colinealidad que se puede hacer entrando en Estadsticos de la ventana de
Regresin Lineal.
147
Se ven los ndices de condicin mayores que 30, para estos si alguna de las
proporciones de la varianza es mayor que 90%, significa que hay colinealidad.
Autocorrelacin
Para detectar la autocorrelacin en el SPSS se tienen dos herramientas
principalmente en lo que es regresin lineal. Graficar los residuos (Explicado
en la parte de heteroestacidad) y la dcima de DW, la cual al ser seleccionada
en la ventana de estadsticos aparece en el resumen de la regresin:
Resumen del modelo
Modelo
1
R cuadrado
Error tp. de la
corregida
estimacin
R cuadrado
a
,094
,009
-,322
Durbin-Watson
,83573
1,935
Entre
0 - 1,078
1,078 - 1,66
1,66 - 2,34
2,34 2,922
2,922 - 4
Correlacin
Positiva
Incierta
Nula
Incierta
Negativa
Anlisis de residuos
Todos lo explicado en el captulo 3, para anlisis de residuos puede encontrarse
en la opcin Regresin lineal: Guardar, en el software SPSS.
149
a
Estadsticos sobre los residuos
Valor pronosticado
Valor pronosticado tip.
Error tpico del v alor
pronosticado
Valor pronosticado
corregido
Residuo brut o
Residuo t ip.
Residuo estud.
Residuo eliminado
Residuo eliminado est ud.
Dist . de Mahalanobis
Dist ancia de Cook
Valor de inf luencia
centrado
Mnimo
8,3397
-2,168
Mximo
49,8464
3,440
Media
24,3844
,000
Desv iacin
tp.
7,40139
1,000
,701
2,513
,948
,286
294
8,4853
50,5264
24,3848
7,39960
294
-31,97624
-2,663
-2,675
-32,27098
-2,704
,001
,000
38,33554
3,192
3,205
38,65010
3,258
11,835
,050
,00000
,000
,000
-,00046
,001
,997
,004
11,98817
,998
1,002
12,07426
1,006
1,559
,007
294
294
294
294
294
294
294
,000
,040
,003
,005
294
N
294
294
La tabla Estadsticos sobre los residuos nos ofrece informacin del rango,
tendencia central y dispersin de las variables que hemos creado con objeto de
identificar casos alejados y/o influyentes. No es necesario para saber si hay
casos atpicos o influyentes listar todos esos valores. Es suficiente con evaluar
si el valor mximo y/o mnimo de las medidas de alejamiento o influencia
superan los umbrales establecidos. En tal caso conviene realizar un histograma,
un grfico de puntos o un grfico de dispersin colocando el nmero del caso
(filas de la matriz de datos) en el eje de abscisas y las medidas de alejamiento o
de influencia en el eje de ordenadas. En este caso no parece que haya ningn
caso claramente influyente.
150
Histograma
50
Frecuencia
40
30
20
10
0
-3
-2
-1
Media =1,6E-16
Desviacin tpica =0,
998
N =294
0,8
0,6
0,4
0,2
0,0
0,0
0,2
0,4
0,6
0,8
1,0
151
Grfico de dispersin
-1
-2
-3
-3
-2
-1
Los grficos histograma y grfico P-P normal de regresin nos permiten valorar
el alejamiento del supuesto de normalidad. Comparando la curva normal con la
distribucin emprica en el histograma y evaluando el alejamiento de los puntos
representados en el segundo grfico con respecto a la diagonal. Podemos
concluir que no existen grandes desviaciones de la curva normal.
Por ltimo el grfico de dispersin de residuos frente a puntuaciones ajustadas.
Con este grfico podemos evaluar errores en la especificacin del modelo por
incumplimiento del supuesto de linealidad. En la medida en que aparezcan
tendencias curvilneas en el grfico, el modelo utilizado sera incorrecto.
152
DEFINIR
SPSS
> Crear
FECHAS -
153
Estacional:
o
155
156
a,b
Casos
Vlidos
N
Perdidos
Porcentaje
15
100,0
Total
Porcentaje
0
,0
Porcentaje
15
100,0
Historial de conglomeracin
Etapa en la que el conglomerado
Conglomerado que se combina
Etapa
Conglomerado 1 Conglomerado 2
Prxima
Conglomerado 1 Conglomerado 2
etapa
72
146
,000
72
231
25,000
117
178
36,000
126
181
2885,000
117
336
9874,000
117
275
19873,000
72
174
69023,333
10
117
126
141724,500
11
171
209
168325,000
12
10
72
145
360497,500
12
11
117
333
519727,333
14
12
72
171
1990572,900
10
13
13
20
72
7131117,571
12
14
157
Historial de conglomeracin
Etapa en la que el conglomerado
Conglomerado que se combina
Etapa
Conglomerado 1 Conglomerado 2
Prxima
Conglomerado 1 Conglomerado 2
etapa
72
146
,000
72
231
25,000
117
178
36,000
126
181
2885,000
117
336
9874,000
117
275
19873,000
72
174
69023,333
10
117
126
141724,500
11
171
209
168325,000
12
10
72
145
360497,500
12
11
117
333
519727,333
14
12
72
171
1990572,900
10
13
13
20
72
7131117,571
12
14
11
14
20
117
1,096E7
13
RESULTADOS CONGLOMERADOS ANLISIS CLUSTER, SPSS.
158
Despus de esto se puede realizar un grafico para ver como se agruparon los
datos. En Grficos -> Generador de grficos se puede realizar un grafico de
dispersin, utilizando la nueva variable para clasificar los datos:
1
2
3
159
160
1
3
2
VENTANA DE USUARIO SPSS CLEMENTINE
161
162
P(t)
FUNCIN SIGMOIDE
El nodo red neuronal tiene varias opciones, divididas en cinco partes: Campos,
Modelo, Opciones, Experto y Anotaciones.
Campos: Aqu uno puede definir las variables objetivo y las variables
de entrada. Las variables objetivo son las que se quiere predecir y las
de entrada son las que uno usa para predecir. Tambin se puede
seleccionar la opcin de usar la configuracin del nodo tipo. Lo
importante es que en alguna parte, sea en el nodo tipo, en la misma red
neuronal o en el nodo donde se importan los datos, se defina las
variables objetivo y las entradas. Si esto no se hace el nodo red
neuronal no funcionar.
Modelo: En esta opcin uno define las propiedades principales del
entrenamiento. El mtodo, cuando se detiene el entrenamiento y que
uno prefiere optimizar en el computador. En los mtodos de
entrenamiento el Clementine nos ofrece:
o Rpido: Este mtodo utiliza reglas de miniaturas y
caractersticas de los datos para seleccionar una forma
adecuada (Topologa) para la red. Esta formula puede cambiar
segn versin que se use del Clementine.
164
3
4
165
5
Comprobacin
Validacin
7
RUTA PARA GENERAR REDES NEURONALES EN EL SPSS CLEMENTINE
Para hacer una red neuronal se necesita primero definir cuales sern los grupos
de datos y variables con que se entrenaran. Despus tener todo eso y ordenarlos
en una base de datos (Sea SPSS, Excel o cualquiera que acepte el Clementine).
En este ejemplo, haremos como si fueran tres grupos de datos los que se
usarn. El grupo de entrenamiento, que se usar para entrenar la red, el grupo
de comprobacin, que se usar para comprobar si los datos dentro del rango de
la red y el grupo de validacin, que es usado para ver el comportamiento de una
red neuronal con datos que no pertenecan al grupo principal.
1. Importar los datos: Sea de SPSS, Excel o cualquier otro tipo de archivo de
base de datos, es imprescindible exportar los datos. Los nodos de origen
tienen 4 campos principalmente
Datos, donde se ve el archivo de origen y que parte de l se quiere
importar.
Filtro, aqu se puede escoger que variables se quiere que importen.
Muy til si la base de datos tiene muchas variables que no se usarn en
el anlisis.
166
167
3. Dividir las variables: Despus se tiene repartir los datos en dos o tres
grupos, en esto se ocupa el nodo particin. En este nodo uno puede definir
que porcentaje de datos quedarn en cada grupo que saldr del nodo. Para
definir por donde saldr cada uno se da una etiqueta en donde dice Valor.
Esta servir para definir en el nodo seleccionar porque parte de la ruta se
irn.
4. Entrenar la red: Despus de esto, se entrena la red con el nodo red neuronal
con las opciones que se prefieran, explicadas anteriormente.
5. Aplicar modelo al grupo de comprobacin: En el paso 5 sacamos el nodo
del modelo generado de la pantalla de modelos y lo conectamos al nodo
seleccionar. Tras esto se pueden agregar distintos nodos de resultado segn
se estime conveniente.
168
169
170
El nodo CHAID genera rboles de decisin utilizando estadsticos de chicuadrado para identicar las divisiones ptimas. A diferencia de los nodos
C&RT y QUEST, CHAID puede generar rboles no binarios, lo que signica
que algunas divisiones tendrn ms de dos ramas. Los campos objetivo y
predictor pueden ser de rango o categricos. CHAID exhaustivo es una
modicacin de CHAID que examina con mayor precisin todas las divisiones
posibles, aunque necesita ms tiempo para realizar los clculos.
172
El Generador de rboles
Esta opcin puede generar un modelo de rbol automticamente, que permita al
algoritmo seleccionar la divisin ms adecuada para cada nivel, o bien, puede
utilizar el Generador de rboles interactivos para tomar el control, aplicando
sus conocimientos empresariales para refinar o simplificar el rbol antes de
guardar el modelo generado.
Cree una ruta y aada uno de los nodos de generacin de rboles C&RT,
CHAID o QUEST. (Nota: los rboles C5.0 no admiten la generacin de rboles
interactivos.)
En la ficha Modelo, seleccione Iniciar seccin interactiva.
Seleccione los campos objetivo y predictor y especifique las opciones del
modelo adicionales que considere necesario. Para obtener instrucciones
especficas, consulte la documentacin de los distintos nodos de generacin de
rboles.
Ejecute la ruta para abrir el generador de rboles.
Se muestra el rbol actual desde el nodo raz. Antes de generar uno o varios
modelos, puede editar y podar el rbol nivel a nivel y acceder a ganancias,
riesgos e informacin relacionada.
Anexo 7: Datos Caso Quiebra
Caso quiebra, rbol de decisin.
WCTA
CACL
TSTA
EBITTI
TDTA
TDTE
OMTA
ROA
Si quiebra o no
-0,74
0,54
1,02
0,28
1,02
-43,72
0,09
-0,01
1,00
-0,08
0,13
0,01
-60,87
0,08
0,09
0,00
-0,01
1,00
0,11
1,13
0,14 47281,47
0,87
6,65
0,04
0,04
1,00
7,36
559,53
758,13
1,00
4358,95
-0,79
0,19
0,01
6,17
0,98
41,52
0,00
0,01
1,00
-0,29
0,77
0,24
1,00
1,10
-10,59
0,15
-0,03
1,00
-0,62
0,30
0,01
-6,64
0,70
2,36
0,00
-0,24
1,00
-1,03
0,22
1,25
-2,41
1,22
-5,54
-0,16
-0,31
1,00
-0,38
0,81
0,80
-1,39
0,74
2,80
0,01
-0,18
1,00
-0,16
1,35
0,46
2,46
0,50
0,98
0,11
0,00
0,00
-0,64
1,03
0,76
2,35
0,84
5,07
0,10
0,09
0,00
-4,39
0,04
54,40
2,46
4,59
0,08
12,92
0,30
0,00
0,24
1,43
0,41
4,87
0,75
1,09
0,22
0,09
0,00
173
-0,02
0,98
0,06
1,02
-63,64
0,03
0,04
0,00
-0,44
1,19
0,07
1,84
0,49
0,95
0,01
0,01
0,00
-0,44
0,52
0,16
2,93
1,66
3,50
0,62
1,62
0,40
0,07
0,00
0,55
13,61
0,33
0,50
0,12
0,10
0,00
0,25
3,43
0,36
5,52
0,22
0,29
0,08
0,02
0,00
-0,13
5,59
0,20
12,01
0,41
0,69
0,07
0,12
0,00
-1,80
2,69
0,01
-5887,25
2,03
-1,97
0,00
-0,53
0,00
-0,69
0,68
0,77
2,73
0,90
8,63
0,13
0,05
0,00
-0,18
0,40
0,00
-145,03
0,19
0,23
0,00
-0,92
0,00
0,23
255,46
0,01
-177,15
0,00
0,00
0,01
-0,21
0,00
0,12
1,14
0,12
1,01
0,87
6,69
0,04
0,04
0,00
0,08
1,09
0,05
1,02
0,92
10,90
0,02
0,01
0,00
0,72
3,73
0,07
0,30
0,27
0,36
0,00
-0,01
0,00
0,89
11,04
0,50
1,04
0,09
0,10
0,14
0,11
0,00
0,81
5,56
0,57
176,37
0,18
0,22
0,38
0,15
0,00
0,04
1,04
0,21
1,02
0,96
22,48
0,01
0,01
0,00
-1,03
0,21
1,47
-5,46
1,25
-5,06
0,09
-0,47
0,00
PIB
17722536671,00
20902096532,00
24640912616,00
28385038397,00
31558927517,00
36424168146,00
44467946384,00
47693992627,00
55154226760,00
71349202309,00
75769008174,00
82808986192,00
79373597080,00
72995286764,00
75210511780,00
68568293067,00
67265403373,00
73989608529,00
95652734478,00
123055000000,00
154670000000,00
173079000000,00
179627000000,00
IPC
21,06
25,25
28,96
33,89
42,71
52,02
60,04
67,69
75,43
81,64
87,65
93,03
97,78
101,04
104,93
108,67
111,38
114,51
115,71
119,25
123,29
128,72
139,94
Desocupados
449,15
424,02
370,83
341,86
363,05
353,22
322,36
349,68
431,06
363,82
301,98
303,63
431,15
561,03
536,94
533,72
546,28
548,11
602,67
541,11
409,93
510,81
544,68
174
Cobre
110,40
139,30
195,80
204,40
184,30
161,50
156,70
129,60
154,10
189,50
144,80
143,70
107,00
100,80
110,00
94,60
95,80
103,70
157,30
187,80
328,20
331,60
292,30
2009
2010
2011
172591000000,00
216309000000,00
248585000000,00
142,02 632,79
144,18 563,76
148,99 534,40
239,10
373,40
2000
27,3
29,4
29,9
25,8
28,8
31,9
29,7
31,3
33,9
33,1
34,4
28,4
2001
29,5
29,6
27,2
27,4
28,6
27,6
26,4
27,5
26,2
22,2
19,6
19,3
2002
19,7
20,7
24,4
26,2
27
25,5
26,9
28,4
29,7
28,9
26,3
29,4
2003
33
35,8
33,3
28,2
28,1
30,7
30,8
31,6
28,3
30,3
31,1
32,1
2004
34,2
34,7
36,7
36,7
40,3
38
40,8
44,9
45,9
53,3
48,5
43,2
2005
46,8
48
54,2
53
49,8
56,4
58,7
65
65,5
62,4
58,3
59,4
2006
65,5
61,6
62,9
69,5
70,9
70,9
74,4
73
63,8
58,9
59,1
62
2007
54,2
59,3
60,6
63,9
63,5
67,5
74,1
72,4
79,9
85,9
94,8
91,4
2008
93
95,4
105,5 112,6
125,4
133,9 133,4
116,6
103,9
76,6
57,3
41,4
2009
41,7
39,2
48
49,8
59,1
69,6
64,1
71,1
69,4
75,8
78
74,5
2010
78,4
76,4
81,3
84,5
73,7
75,4
76,4
76,6
75,3
81,9
Edad
Fondo A
Nmero de
Saldo
ahorrantes
promedio
Fondo B
Nmero de Saldo
ahorrantes
promedio
Fondo C
Nmero de
Saldo
ahorrantes
promedio
Fondo D
Nmero de
ahorrantes
Saldo promedio
15-19
231
20414
126
6540
54
1195
431
20-24
4122
537789
1947
108830
811
32788
114
10109
25-29
21108
4661675
8722
963323
2962
444652
525
158314
30-39
78439
52651074
36679
13447883
20576
7366291
2520
2484086
40-49
72679 117274477
19566
37342610
67000
50652600
3662
8845674
50-59
60 y
ms
40493 118911569
14540
55577562
59809
115545799
19851
29971745
6410
40803031
19264
88835461
40969
60211284
Edad
9932
50767031
Fondo E
Nmero
de
ahorrante Saldo
s
promedio
15-19
54
3659
20-24
608
121063
25-29
2410
596815
30-39
9288
9162804
40-49
12092
33959731
50-59
11240
71457261
16,90596
2,83778
13,3135
8,2608
17,4185
2,88559
13,35355
9,68421
14,81486
3,66478
13,46485
10,7893
13,97234
4,76635
13,07702
11,0234
13,77392
6,96278
13,14368
11,0805
13,23452
11,17458
13,7282
11,4454
175
60 y
ms
6955
66064499
5,39189
14,22697
15,56975
15,26988
6 El desempleo
7 La salud
1 La pobreza
15-19
4,46411
8,35886
19,11282
20-24
6,66303
9,75863
18,01984
25-29
8,2837
8,94863
17,59088
30-39
7,42283
9,51429
15,92277
40-49
7,54623
9,49843
15,14606
50-59
7,51108
10,69749
15,85761
60 y ms
4,86568
12,36294
16,6018
176
11,6521