Professional Documents
Culture Documents
2.
2.2.
2.2.1.
2.2.2.
2.3.
2.3.1.
2.3.2.
2.3.3.
2.4.
2.5.
Relaciones cuasi-bibaricentricas.................................................................................................39
2.6.
2.7.
2.7.1.
2.7.2.
2.8.
Un ejemplo de aplicacin: estudio de la situacin regional de la educacin media en Colombia
(1997-1998). ............................................................................................................................................43
2.8.1.
Presentacin .......................................................................................................................43
2.8.2.
2.8.3.
Conclusiones. .....................................................................................................................46
2.9.
Ejercicio: Estudio de la situacin regional de la educacin media en Colombia (1997-1998).
Desagregando educacin oficial y educacin privada en cada departamento. ........................................49
2.9.1.
Presentacin. ......................................................................................................................49
2.9.2.
TABLAS Y GRAFICOS
Tabla 2-1: Tabla de contingencia: razones x mtodo...................................................................................31
Tabla 2-2: tabla de frecuencias relativas (%) ...............................................................................................32
Tabla 2-3: perfiles fila..................................................................................................................................34
Tabla 2-4: perfiles columna..........................................................................................................................34
Grfico 2-1: distancia jicuadrado .................................................................................................................36
Grfico 2-2: primer plano factorial con razones de abandono .....................................................................38
Grfico 2-3: primer plano factorial con mtodos anticonceptivos ...............................................................38
Tabla 2-5: Resultados del ejemplo razones x mtodos ................................................................................40
Grfico 2-4: representacin simultnea para el ejemplo razones x mtodos ...............................................41
Grfico 2-5: coseno cuadrado ......................................................................................................................42
Pardo C.E. y Cabarcas G.
ii
Tabla 2-6: Clasificacin de los planteles de educacin media por departamentos. Segn resultados
obtenidos por los estudiantes de grado 11 en los exmenes de Estado. Agosto 1997 y Marzo 1998 ......... 44
Tabla 2-7: Histograma de los 4 primeros valores propios.......................................................................... 44
Tabla 2-8: coordenadas, contribuciones y cosenos cuadrados .................................................................... 45
Grfico 2-6: Primer Plano Factorial. Proyeccin conjunta de los perfiles filas y los perfiles columnas.... 46
Grfico 2-7: Agrupamiento aproximado de los Departamentos................................................................. 46
Grfico 2-8: Perfiles de los Departamentos Reordenados.......................................................................... 48
Tabla 2-9: Departamentos (Educacin Oficial Educacin Privada) contra Categora ............................. 51
Tabla 2-10: Resultados del ejercicio ........................................................................................................... 52
Grfico 2-9: Proyeccin de los Puntos-Departamentos sobre el primer plano factorial.............................. 53
Grfico 2-10: Proyeccin conjunta de los puntos-departamentos y los puntos-categoras sobre el primer
plano factorial.............................................................................................................................................. 53
31
Dominio de aplicacin
FUER
OTRO
COND
Tot.fila
EMBA
431
632
71
1134
DEEM
1166
425
92
1683
NONE
205
142
81
428
SALU
1106
43
1157
Tot.columna
2908
1242
252
4402
Conviene tener una notacin generalizada para cualquier tabla de contingencia: sea K la tabla de
contingencia, k el nmero total de individuos, ki. la marginal de la fila i, k.j la marginal de la columna j.
32
k11 L k1 j
M
M
K = L L k ij
M
M
k n1 L k nj
L k1 p k1 .
M M
p
L L k i . k i . = k ij
j =1
M M
L k np k n .
. . k .1 L k . j
L k. p
kk =
i =1
k
j =1
ij
i =1
j =1
= k i . = k. j
k . j = k ij
i =1
En la Tabla 2-1: k21 =1166, k22 =425, k23 =92 y k2o =1166+425+92 =1683. Sumando la ltima columna o
la ultima fila se obtiene el total de mujeres de la muestra: k =4402.
2.2.
Lo que interesa en el anlisis de una tabla de contingencia es el estudio de las asociaciones entre las
modalidades de las dos variables. Estas se pueden ver mediante la comparacin de los distribuciones
condicionales (perfiles) de las modalidades fila por un lado y de las columnas por el otro. No es entonces
la tabla de contingencia la que se representa geomtricamente sino dos tablas de perfiles en dos espacios
diferentes pero que estn relacionados. Es decir que el mtodo requiere de transformaciones de las tabla
de contingencia inicial.
2.2.1.
Si la Tabla 2-1 se hubiera construido con una muestra de otro nmero de mujeres y suponiendo que las
reparticiones fueran exactamente las mismas, los nmeros de la tabla seran todos diferentes a pesar de
tener la misma estructura de interrelaciones. Para eliminar este inconveniente basta dividir todas las celdas
de la tabla por el total, k =4402, con lo cual se obtiene una tabla de frecuencias relativas, la que se presenta
en la Tabla 2-2. Si se multiplican todos los nmeros de la tabla por 100, se tiene la misma informacin
pero expresada en porcentajes.
Tabla 2-2: Frecuencias relativas razones x mtodo (%)
FUER
OTRO
COND
EMBA
9.8
14.4
1.6
Tot.fila
OCO
25.8
DEEM
26.5
9.7
2.1
38.2
NONE
4.7
3.2
1.8
9.7
SALU
25.1
1.0
0.2
26.3
Tot.col.
OFI
66.1
28.2
5.7
100.0
El total de la tabla suma 100%, al interior de la tabla se tiene la distribucin de frecuencias conjunta entre
las dos variables (mtodos y razones). Por ejemplo el 3.2% del total de mujeres usaban otro mtodo y lo
33
abandonaron porque no lo necesitaban; el 25.1% de las mujeres de la muestra, usaban mtodos fuertes y
los abandonaron por razones de salud.
La ltima columna de la Tabla 2-2 es la distribucin marginal de la variable razones: 25.8% de las mujeres
abandonaron el mtodo que usaban (cualquiera) por que quedaron embarazadas o porque buscaban un
mtodo ms seguro; 38.2% por que deseaban embarazo; 9.7% porque no lo necesitaban y 26.3% por
razones de salud.
La ltima fila de la Tabla 2-2 es la distribucin marginal de los mtodos: de las mujeres de la muestra el
66.1% usaba mtodos fuertes, el 28.2% otros mtodos y el 5.5% usaba condn.
Una notacin generalizada de una tabla de frecuencias, calculada a partir de una tabla de contingencias es
la siguiente:
f ij =
k ij
k
fi . =
f 11 L
M
F = L L
M
f n1 L
ki .
,
k
f1 j
M
f ij
M
f nj
f .1 L
f.j =
L
L
L
f1 p
M
L
M
f np
f .j
k. j
f .p
f1 .
M
p
f i . f i . = f ij
j =1
M
fn.
p
11 =
i =1
j =1
i =1
j =1
f ij = f i . = f . j
f . j = f ij
i =1
2.2.2.
34
FUER
OTRO
COND
Tot.fila
EMBA
38.01
55.73
6.26
100.00
DEEM
69.28
25.25
5.47
100.00
NONE
47.90
33.18
18.93
100.00
SALU
95.59
3.72
0.69
100.00
SALU
COND
OTRO
FUER
NONE
DEEM
EMBA
0.00
50.00 100.00
Tanto en la tabla como en grfico se pueden comparar fcilmente los perfiles fila: el abandono del mtodo
por embarazo o por buscar uno ms seguro se da ms en los otros mtodos (58%), luego en los mtodos
fuertes (38%) y finalmente en el condn (6%). Los abandonos por salud ocurren en los mtodos fuertes
(96%). Los perfiles desea embarazo y no necesita son los ms parecidos en su forma. En ambos los
mtodos se ordenan segn frecuencia as: lo mtodos fuertes, en otros y en condn.
La Tabla 2-4 contiene los perfiles columna expresados en porcentaje, calculados a partir de la Tabla 2-1 o
de la Tabla 2-2, dividiendo la celda en cada columna por la marginal, por ejemplo para la columna 3:
1.6/5.7 = 0.2817 = 28.17%
2.1/5.7 = 0.3651 = 36.51%
1.8/5.7 = 0.3214 = 32.14%
0.2/5.7 = 0.0317 = 3.17%
Tabla 2-4: Perfiles columna, mtodos segn razone de abandono
FUER
OTRO
COND
EMBA
14.82
50.89
28.17
DEEM
40.10
34.22
36.51
NONE
7.05
11.43
32.14
SALU
38.03
3.46
3.17
Tot.col.
100.00
100.00
100.00
60.00
50.00
EMBA
40.00
DEEM
30.00
NONE
20.00
SALU
10.00
0.00
FUER
OTRO
COND
A partir de la Tabla 2-4 y su grfico asociado se pueden comparar los tres perfiles columna: lo que
diferencia a los tres mtodos son los abandonos por salud y por no necesidad, siendo ms abandonado por
salud el grupo de mtodos fuertes y por no necesidad el condn.
Pardo C.E. y Cabarcas G.
35
De los perfiles filas y columnas en conjunto se puede concluir principalmente que hay una
correspondencia entre los mtodos fuertes y el abandono por salud y efectos secundarios. Tambin se
puede observar una correspondencia entre los otros mtodos y el abandono por embarazo y por buscar un
mtodo ms seguro.
En trminos generalizados los perfiles se pueden representar de la siguiente forma, si se obtienen a partir
de la tabla de frecuencias relativas:
L L L 1
f ij
perfiles. fila L
L.1
fi .
L L L 1
perfiles. columna M
M
.
M
f .j
M M
1. 1 .. 1
M
f ij
En el anlisis de correspondencias simples (ACS) se busca una representacin ms adecuada para analizar
simultneamente los perfiles fila y columna obtenidos a partir de una tabla de contingencia. Cuando se
tienen tablas de contingencia de gran tamao es muy difcil obtener una sntesis apropiada de forma como
se hizo en el ejemplo. Para el ACS se parte de la representacin de los perfiles fila en un espacio
multidimensional, donde las columnas son los ejes y simtricamente de otra nube de perfiles columna,
donde las lneas son los ejes. Para ello se requiere del uso de una distancia apropiada: la distancia jicuadrado entre distribuciones.
2.3.
En el ejemplo se tienen cuatro puntos fila que se pueden representar haciendo corresponder a cada una de
las tres columnas un eje, es decir que cada punto necesita tres coordenadas para poderlo ubicar en el
espacio de tres dimensiones. Para cada una de las filas las coordenadas se pueden leer en la Tabla 2-3. A
cada punto se le asocia como peso la marginal de la fila que representa y que se puede leer en la Tabla 2-2.
Las coordenada de los puntos fila y sus pesos se transcriben a continuacin:
EMBA:
DEEM:
NONE:
SALU:
Coordenadas
[38.01 55.73
[69.28 25.25
[47.90 33.18
[95.59 3.72
Pesos
6.26]
5.47]
18.93]
0.69]
0.258
0.382
0.097
0.263
La representacin de estos cuatro perfiles se hace mediante 4 puntos en el espacio de tres dimensiones y
adems a cada punto se le asocia una masa o peso que es igual a la marginal de la fila de la tabla de
frecuencias (ltima columna de la Tabla 2-2).
Pero la distancia que se utiliza no es la euclidiana convencional sino la distancia ji-cuadrado, la cual se
presenta ms adelante.
Para los perfiles columna la situacin en simtrica: hay tres puntos representados en un espacio de cuatro
dimensiones, FUER, OTRO, COND.
A continuacin se hace la descripcin de los perfiles en forma generalizada.
Nube de perfiles fila
En el espacio Rp se representan los n perfiles fila, dotados del peso pi = fi.
Pardo C.E. y Cabarcas G.
36
f ij
con. p i = f i .
f ij
, i = 1,2.....n, j = 1,2..... p
f . j
2.3.1.
con. p j = f . j
d (i , i ) =
2
j =1
f ij
1 f ij
f . j f i . f i .
Para el caso de dos lneas, esta distancia, es la suma de la diferencia de cada una de las respectivas
componentes de los dos perfiles, ponderadas por el inverso de las frecuencias marginales de las columnas
respectivas. Con este peso las diferencias se amplifican cuando se deben a columnas de baja frecuencia, es
decir tiende a destacar los casos raros. El Grfico 2-1 se presenta para facilitar la comprensin de los
elementos de la distancia ji-cuadrado.
Grfico 2-1: distancia jicuadrado
(j)
(i )
(l)
Perfil i:
f ij
f i ( j )
Perfil l:
f lj
f l ( j )
37
d ( j, k ) =
2
i =1
1
f i.
f ij
f
ik
f
f k
j
Sea g el vector de p componentes, centro de gravedad de la nube de perfiles fila, la componente j es:
n
f ij n
f
= f i ij
g j = p i
i =1
f i i =1 f i
es decir que g = f 1
f j
fp
= f j
En el ejemplo el centro de gravedad es: (0.6606, 0.2821, 0.0572), que es la distribucin marginal de la
variable que esta en columna, es decir la distribucin de los mtodos anticonceptivos usados por las
mujeres de la muestra. Esta es la distribucin promedio con la cual se comparan las distribuciones
condicionales de las razones de abandono. Esta distribucin se coloca en el centro de representacin.
2.3.3.
i =1
j =1
I = p i d (i, g ) = f i o
2
i =1
1
fo j
f ij f i o f o j
f io
p (f f f )
n
2
io o j
= ij
=
f io f o j
k
i =1 j =1
2.4.
38
Encontrar el subespacio (plano cuando son dos dimensiones) que se aproxime lo mejor posible a la nube
de n puntos (perfiles fila i), dotados de los pesos fi., equivale a hacer un anlisis de en componentes
principales sobre la tabla de los perfiles fila, cada uno ponderado por su frecuencia marginal y utilizando
la distancia ji-cuadrado entre perfiles.
Los planos factoriales de los individuos permiten comparar los perfiles fila entre s y con el perfil marginal
(promedio). El perfil marginal esta ubicado en el centro de las grficas y por lo tanto la ubicacin de los
puntos perfiles indican el parecido (cerca) o la diferencia (lejos) de la distribucin de la muestra o
poblacin segn las modalidades de la variable que est en columna.
El Grfico 2-2 es el primer plano factorial de razones de abandono. Las razones de SALUD y
EMBARAZO tienen las distribuciones ms opuestas. La razn DESEA EMBARAZO es la ms parecida
a la distribucin promedio de los mtodos utilizados. En este caso la representacin en el plano contiene
toda la informacin pues, para cada perfil fila (razones de abandono), se necesitan tres coordenadas
(mtodo), pero como cada perfil suma uno, se pierde una dimensin: una de las coordenadas se puede
encontrar restando de uno las dems.
Grfico 2-2: primer plano factorial con razones de abandono
De manera similar se obtiene la representacin para la nube de perfiles columna: puntos perfiles columna,
ponderados por sus marginales y con la distancia ji-cuadrado (ponderacin por el inverso de las
marginales fila). El Grfico 2-3 presenta los puntos perfiles columna que representan las distribuciones de
los mtodos anticonceptivos segn sus razones de abandono. Las ms opuestas son mtodos fuertes y
otros mtodos.
2.5.
39
Relaciones cuasi-bibaricentricas
Los ejes factoriales de los anlisis de las dos nubes de perfiles estas relacionadas puesto que provienen de
la misma tabla de contingencia. En Lebart et al. (1995) y otros textos se pueden ver las denominadas
relaciones entre los dos espacios. Las ms importantes desde el punto de vista de la interpretacin de las
grficas son las denominadas relaciones cuasi-bibaricentricas, propiedad derivada de utilizar la distancia
ji-cuadrado.
Grfico 2-3: primer plano factorial con mtodos anticonceptivos
La coordenada sobre un eje factorial de una modalidad fila (perfil) se puede calcular as:
i =
f ij
j
j =1
io
p
Esta frmula significa que la coordenada de un perfil fila es igual al promedio aritmtico de las
coordenadas de los perfiles columna pero cada una ponderada por el valor de la coordenada del perfil fila
que se est considerando y adems dilatado por el inverso del la raz del valor propio.
Para entender mejor esta propiedad se procede a calcular la coordenada de EMBA (-0.60) en funcin de
las coordenadas de mtodos:
1
(0.3801x0.33 + 0.5573x(-0.66) + 0.0626x(-0.52))
0.2095
= 2.1848(0.1254 0.3678 0.0326) = 2.1848(0.275) = 0.60
EMBA,1 =
Las ponderaciones se toman de la Tabla 2-3, el valor propio y las coordenadas de la Tabla 2-5. La media
ponderada es 0.275, este es un baricentro de las coordenadas de las modalidades columna. Como la
Pardo C.E. y Cabarcas G.
40
modalidad otros mtodos es la de mayor frecuencia (55.73%) en el perfil de embarazo, otros mtodos
va a atraer a la modalidad embarazo y grficamente se va a observar una cercana, dando cuenta de este
hecho. Desde luego hay una dilatacin (alejamiento) de la coordenada de 2.1848, la cual generalmente
hace destacar esa asociacin. La dilatacin (por la que se introduce la palabra cuasi) es la que permite la
representacin simultnea de las proyecciones de los dos espacios.(Grfico 2-4).
De manera simtrica, la coordenada de un perfil columna se calcula como el promedio ponderado por su
perfil de las coordenadas de los perfiles propios y dilatada por el inverso de la raz del valor propio:
j =
f ij
i
i =1 o j
41
y Tabla 2-4). Obviamente el mtodo es til en grandes tablas de contingencia en donde un observador se
puede perder en la gran cantidad de cifras.
Porqu SALUD est ms alejada que la modalidad fuerte?. En la distribucin de las mujeres que
abandonaron el mtodo que usaban por razones de SALUD (ver Tabla 2-3) casi el 96% estaba usando
mtodos fuertes. En cambio para el grupo que usaba mtodos fuertes el 38% lo abandonaron por razones
de SALUD y el 40% porque deseaban quedar embarazadas, es decir que los mtodos fuertes tambin estn
atrados por DEEM (ver Tabla 2-4).
Grfico 2-4: representacin simultnea para el ejemplo razones x mtodos
2.6.
Al igual que en ACP sobre los ejes factoriales se pueden proyectar filas y columnas que no hayan
participando en el anlisis. Se hace mediante las relaciones cuasi-bibaricntricas y por lo tanto se
interpreta de la misma forma, pero debe hacerse por cada modalidad ilustrativa con respecto a las
modalidades activas. No es apropiado interpretar modalidades ilustrativas entre s pues no han participado
en la construccin de los ejes. Esto se ilustrar en los ejemplos de ms adelante.
2.7.
Ayudas a la interpretacin
En un ACS las modalidades aparecen repartidas a ambos lados de los ejes, lo que conlleva a la lectura de
las contraposiciones ms importantes entre modalidades. En el ejemplo de mtodos x razones, en el eje
uno se contraponen los mtodos otros con fuertes y las razones EMBARAZO con SALUD (ver
Grfico 2-4). En una tabla de contingencia de gran tamao se puede buscar las modalidades ms
importantes sobre cada eje recurriendo a las denominadas contribuciones absolutas. En el ejemplo se leen
en la Tabla 2-5.
Pardo C.E. y Cabarcas G.
42
Las proyecciones sobre los ejes y sobre los planos factoriales sern muy buenas para algunos puntos
pero tambin pueden ser de mala calidad para otros puntos. Se requiere entonces de un ndice que ponga
en evidencia este hecho, que se denomina coseno cuadrado o contribucin relativa. Los cosenos
cuadrados para el ejemplo se pueden leer en la Tabla 2-5.
A continuacin se presentan las expresiones de las contribuciones absolutas y relativas para las
modalidades fila. Las expresiones para las modalidades columna tienen la misma forma y la misma
interpretacin.
2.7.1.
ca (i ) =
f i o i2
Es la proporcin con que cada punto contribuye a la inercia del eje. Los puntos que tengan contribucin
absoluta alta son los que fijan la posicin del eje. La suma de las contribuciones es 1, por comodidad se
expresan en porcentaje. La contribucin absoluta depende tanto del peso de la modalidad como del valor
de la proyeccin, y la combinacin de estos dos valores da origen a distintas situaciones: una modalidad
no tan alejada del origen puede ser muy contributiva si tiene una frecuencia alta. No necesariamente los
puntos ms alejados del origen son los ms contributivos.
2.7.2.
cr (i ) =
i2
d 2 (i, G )
Estos valores son el cociente de las longitudes al cuadrado de la proyeccin sobre el eje, sobre la distancia
del punto al centro de gravedad (centro de la representacin). Es el valor del coseno al cuadrado del
ngulo que forman las rectas que unen el origen con cada uno de los dos puntos (el punto perfil y su
proyeccin sobre el eje). El coseno cuadrado tiene valores entre 0 y 1 y la suma de los cosenos cuadrados
de un punto sobre cada uno de los ejes da uno, hechos estos que facilitan su interpretacin. Un coseno
cuadrado cercano al 100% indica buena calidad de la proyeccin, es decir, buena representacin de la
distancia original del punto al origen sobre un eje. Valores cercanos a 0 indican mala calidad de
representacin y por lo tanto los puntos que los posean no deben leerse sobre ese eje (ver Grfico 2-5). El
coseno cuadrado sobre un plano se obtiene sumando los cosenos cuadrados de los ejes que los conforman.
Grfico 2-5: coseno cuadrado
Cos2(i)1
Cos2(i)0
i. mal representado sobre el eje
43
2.8.
Un ejemplo de aplicacin: estudio de la situacin regional de la educacin
media en Colombia (1997-1998).
2.8.1.
Presentacin
Para este estudio se parte de informacin aportada por el ICFES. El instituto clasifica los planteles
educativos teniendo en cuenta los resultados obtenidos por los estudiantes que egresan de los mismos.
Cada colegio es clasificado en una de 7 categoras, desde Muy Inferior hasta Muy Superior. El criterio de
clasificacin es el promedio de los puntajes obtenidos por sus egresados en la prueba que el Icfes aplica a
todos los egresados de la educacin media. La Tabla 2-6 es una tabla de contingencia: cada celda contiene
el nmero de planteles clasificados en una categora y departamento especificado. Es decir, en Antioquia
14 planteles fueron clasificados en la categora Muy Superior, mientras que en Bolvar 20 fueron
clasificados en Alto.
Frente a esta tabla cabe preguntarse si la distribucin de los planteles educativos en cuanto a su calidad es
aproximadamente igual para todos los departamentos, o si por el contrario, es posible encontrar tipologas
de departamentos, es decir, grupos de departamentos con una distribucin similar entre ellos que los
diferencia, a su vez, de otros grupos de departamentos.
Despus de una primera exploracin se decidi eliminar los departamentos con una muy baja cobertura (se
restringi la tabla a aquellos departamentos cuyo nmero de planteles supera el 1 % del total nacional), al
departamento del Choc por tener una distribucin muy atpica, y juntar Bogot y Cundinamarca en una
sola categora.
Las preguntas ms importantes son: Cuales son las distribuciones que se apartan del perfil promedio? Qu
tipologas de Departamentos podran ser establecidas?.
Para responder a estos interrogantes una de las tcnicas mas adecuadas es el Anlisis de Correspondencia
Simples o Binarias. Se proceder a continuacin a explicar como hacer dicho anlisis en este caso
particular.
2.8.2.
44
Tabla 2-6: Clasificacin de los planteles de educacin media por departamentos. Segn resultados obtenidos
por los estudiantes de grado 11 en los exmenes de Estado. Agosto 1997 y Marzo 1998
Departamento
Muy
Superior Superior
Alto
Medio
Bajo
Muy
Inferior Inferior
Total
Amazonas
Antioquia
Arauca
Atlantico
Bolivar
Bogota
Boyaca
Caldas
Caqueta
Casanare
Cauca
Cesar
Cordoba
Cundinamarca
Choco
Guainia
Guaviare
Huila
La Guajira
Magdalena
Meta
Nario
N. de Santander
Putumayo
Quindio
Risaralda
San Andres
Santander
Sucre
Tolima
Valle
Vaupes
Vichada
0
14
0
8
5
62
1
2
0
0
3
2
1
2
0
0
0
3
1
0
0
3
4
0
1
3
0
9
0
2
13
0
0
0
15
0
13
4
58
10
10
0
0
3
2
2
12
0
0
0
3
2
2
2
6
5
0
2
2
0
12
2
3
24
0
0
0
52
3
26
20
222
33
14
1
4
13
6
5
40
0
0
0
13
1
6
14
27
24
2
8
18
0
41
7
11
61
0
0
0
100
12
42
42
363
130
61
10
16
50
15
15
155
7
1
1
69
8
18
44
93
69
10
23
24
3
113
18
82
131
1
3
3
343
12
183
130
277
60
91
32
12
60
76
87
148
16
1
3
56
42
76
57
64
106
17
43
79
4
116
60
140
275
1
1
2
89
3
130
75
2
5
23
12
1
37
61
36
11
34
0
0
12
30
78
11
29
16
2
1
8
4
11
18
28
91
1
0
0
1
0
1
0
0
0
0
0
0
0
0
0
0
9
0
0
0
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
5
614
30
403
276
984
239
201
55
32
166
162
146
368
66
2
4
156
85
181
128
222
224
31
78
134
11
302
105
266
595
3
4
Total
139
194
672
1729
2671
861
13
6279
(Fuente: ICFES)
45
46
Grfico 2-6: Primer Plano Factorial. Proyeccin conjunta de los perfiles filas y los perfiles columnas
2.8.3.
Conclusiones.
Siguiendo el arco formado por los departamentos en el primer plano factorial es posible reordenar los
perfiles de los departamentos y verificar el parecido de dichos perfiles entre s. Esta situacin se puede
apreciar en el Grfico 2-8. Lo que se observa en el plano factorial (Grfico 2-6), se puede ahora verificar
aqu: los departamentos ubicados en el circulo de la derecha del plano factorial son los mismos ubicados
en la parte inferior del grfico, caracterizados por el gran peso que tiene en ellos la categora Infer. Los del
circulo inferior son los mismos departamentos ubicados en la mitad de la tabla y caracterizados por la
categora Bajo. Y los del circulo izquierdo estn ubicados en la parte superior de la tabla, en el peso
relativo de las categoras Infer y Bajo en pequeo al tiempo que tienen un mayor peso las categoras
Medio, Alto y Super . El departamento del Cauca, que aparece ubicado en el plano en el foco del arco
parablico que arman los dems departamentos se ubica hacia el centro de la tabla y es el que muestra un
perfil en el cual estn ms equilibradas las cinco categoras.
47
48
Boyaca
Bog+Cun
Narino
Huila
Santander
Norte
Meta
Caldas
Risaralda
Quindio
Tolima
Valle
Cauca
Antioquia
Sucre
Caqueta
Cordoba
Bolivar
Atlantico
Guajira
Cesar
Magdalena
0%
20%
Super
40%
Alto
60%
Medio
80%
Bajo
100%
Infer
49
2.9.
Ejercicio: Estudio de la situacin regional de la educacin media en Colombia
(1997-1998). Desagregando educacin oficial y educacin privada en cada
departamento.
2.9.1.
Presentacin.
A continuacin se muestra una tabla de contingencia (Tabla 2-9), que contiene la informacin
correspondiente al nmero de planteles educativos clasificados por el Icfes en cada una de las cinco
categoras usadas en el ejemplo anterior, pero ahora en cada departamento se han separado los colegios
pertenecientes a la educacin oficial de la privada. Los primeros estn identificados con una letra O y los
otros con una P. El objetivo es el mismo del ejemplo: estudiar la configuracin de las nubes de puntosdepartamentos y puntos-categoras. Como elementos necesarios para realizar el anlisis se incluye en la
informacin: la Tabla 2-10 que contiene la informacin acerca de los valores propios, las coordenadas,
contribuciones y cosenos cuadrados para las frecuencias (Categoras) y para los individuos
(Departamentos), y dos grficos: Grfico 2-9, la proyeccin de la nube de puntos-departamentos sobre el
primer plano factorial y Grfico 2-10, la proyeccin conjunta de las dos nubes de puntos: departamentos y
categoras sobre el primer plano factorial. A continuacin encuentra una serie de interrogantes para
orientar el anlisis.
2.9.2.
1. Que porcentaje de la inercia total es recogida por el primer eje factorial, por el segundo eje
factorial y por el primer plano factorial. Que se puede concluir de esta constatacin?
2. Anlisis de la proyeccin de la nube de puntos-categoras sobre el primer plano factorial.
a. Cules son las dos categoras ms contributivas al primer eje factorial? Cules son sus
coordenadas y cules sus pesos relativos?. Qu tan bien representadas estn esas
categoras en el primer plano factorial? Cul es la categora que est ms mal representada
en el primer plano factorial? Puede decirse que est muy mal representada? Como podra
denominarse al primer eje factorial?
b. Cuales son las dos categoras ms contributivas al segundo eje factorial? Cules son sus
coordenadas y sus pesos relativos?. Qu tan bien representadas estn esas categoras en el
primer plano factorial? Como podra denominarse al segundo eje factorial?
3. Anlisis de la proyeccin de la nube de puntos-departamentos sobre el primer plano
factorial.
a. Cules son los 6 departamentos mas contributivos al primer eje factorial? Cules son sus
coordenadas y cules sus pesos relativos?. Qu tan bien representadas estn estos
departamentos en el primer plano factorial? Cuales son los dos departamentos ms mal
representados en el primer plano factorial? Puede concluirse de lo anterior que algunos
departamentos estn muy mal representados? De qu manera estos resultados son tiles
para ayudar a la caracterizacin del primer eje factorial?
b. Cules son los 6 departamentos mas contributivos al segundo eje factorial? Cules son sus
coordenadas y cules sus pesos relativos?. Qu tan bien representadas estn estos
departamentos en el primer plano factorial? De qu manera estos resultados son tiles
para ayudar a la caracterizacin del segundo eje factorial?
4. Anlisis de la proyeccin conjunta de las dos nubes de puntos.
a. Puede evidenciarse algn patrn de comportamiento con respecto a los perfiles de
educacin oficial y privada? Teniendo en cuenta las proyecciones de las categoras, como
se puede caracterizar dicho patrn?
Pardo C.E. y Cabarcas G.
50
b. Liste los departamentos ms cercanos a cada una de las categoras. Se puede evidenciar
algn patrn especial en estos grupos respecto a la educacin oficial y privada?
c. Cuales son las cuatro parejas de perfiles de educacin (oficial-privada) de un mismo
departamento ms distanciadas entre s? En que sentido se da tal diferencia?
d. Cuales son las cuatro parejas de perfiles de educacin (oficial-privada) de un mismo
departamento menos distanciadas entre s? En que sentido se da tal diferencia?
e. Se puede sugerir un reordenamiento de los departamentos teniendo en cuenta su
disposicin en el primer plano factorial? Cul?
5. Escriba en un prrafo las conclusiones ms relevantes del anlisis.
51
Departamento
AN_O
AN_P
AT_O
AT_P
BG_O
BG_P
BL_O
BL_P
BY_O
BY_P
CA_O
CA_P
CE_O
CE_P
CL_O
CL_P
CO_O
CO_P
CQ_O
CQ_P
CU_O
CU_P
GJ_O
GJ_P
HU_O
HU_P
MA_O
MA_P
ME_O
ME_P
NA_O
NA_P
NO_O
NO_P
QU_O
QU_P
RI_O
RI_P
ST_O
ST_P
SU_O
SU_P
TO_O
TO_P
VL_O
VL_P
Super
0
0
0
0
0
0
2
20
4
3
1
0
0
0
1
0
0
3
1
2
1
0
3
4
2
3
0
3
0
3
113
7
11
5
8
3
11
5
18
29
6
6
3
37
6
37.00
Alto
1
1
0
3
0
4
5
21
3
0
5
12
1
12
2
8
3
7
7
3
5
9
16
17
4
22
7
22
11
25
147
75
18
10
8
5
7
10
19
40
6
8
5
49
4
49.00
Medio
7
1
2
6
1
22
11
33
9
7
9
40
9
40
13
18
15
63
47
16
5
39
56
76
19
84
55
104
28
107
256
107
51
17
23
8
14
6
29
60
14
13
13
91
11
91.00
Bajo
54
31
72
58
3
77
22
120
18
11
63
277
29
135
41
68
41
121
88
29
19
48
69
55
19
78
38
99
28
51
167
110
49
9
9
2
3
11
38
66
18
37
13
140
12
140.00
Infer
53
22
32
40
2
47
26
110
21
9
21
77
10
36
11
7
1
23
23
10
7
27
14
27
5
10
11
8
1
5
2
0
3
2
0
0
0
1
1
13
1
2
4
55
10
55.00
52
Tabla 2-10: Resultados del ejercicio
53
Grfico 2-10: Proyeccin conjunta de los puntos-departamentos y los puntos-categoras sobre el primer plano
factorial