You are on page 1of 5

Anlisis exploratorio de datos

El objetivo del presenta trabajo es realizar un anlisis exploratorio de datos espaciales


(AEDE) aplicado al caso chileno, para ello se emplean los salarios pertenecientes a la
Casen ao 2011, en trminos de georreferenciacin el mapa corresponde a la
distribucin administrativa del censo del ao 2002. Los resultados indican una marcada
concentracin de altos salarios en la regin Metropolitana puntualmente en comunas del
sector oriente de la capital, a su vez concentrando las escolaridades promedio
comunales ms elevadas del pas (en aos de educacin), por otro lado se encuentran
concentrados bajos salarios y escolaridades para comunas pertenecientes a la novena
regin.
Descripcin de los datos
La base de datos empleada el anlisis exploratorio pertenece a la Casen ao 2011
georeferenciada en el mapa de Chile segn censo ao 2002. Para alcanzar
representatividad a nivel comunal las observaciones fueron ponderadas de acuerdo a su
factor de expansin por comuna. Las variables de inters para el anlisis corresponden
al salario promedio por comunas, su variacin porcentual a travs de logaritmo natural,
la escolaridad promedio y las proporciones correspondientes a proporciones de altas y
bajas escolaridades por comunas. Se incluyen adems las proporciones promedio
comunales de los sectores econmicos.
Cabe destacar que la base de datos de la encuesta Casen contiene 324 comunas no
obstante prevalecieron para el anlisis espacial 322 comunas debido a la divisin
poltico administrativa de Chile para el ao 2002.
Anlisis exploratorio de datos espaciales (AEDE)
Para llevar a cabo el AEDE se encuentran presentes en la literatura diversas formas
grficas de poder representan la distribucin espacial de variables de inters y como
seala Chasco (2002) existen hoy en da mltiples opciones grficas, sin embargo se
seala segn Haining et al. (2000) la escasez de estudios que avalen la efectividad y
utilidad de llevar a cabo un AEDE.

El objetivo del anlisis ser visualizar la distribucin espacial de los salarios en Chile y
fenmenos especficos de asociacin espacial (global y local), con ello poder identificar
cules son las comunas en Chile que concentran los mayores salarios. Adicionalmente
se incluyen variables de inters como son la escolaridad promedio, proporciones de alta
y baja escolaridad y finalmente la proporcin de participacin por sectores econmicos
a nivel de comunas.
Distribucin espacial de los salarios
Se comenzar analizando el salario de acuerdo al diagrama de cajas 1 (boxplott) con el
nimo de poder visualizar la existencia de puntos atpicos outliers en los datos
espaciales.
Figura 1. Diagrama de caja de la variable salario promedio por comuna

Fuente: Elaboracin propia en base a las salidas de GeoDa.

1 La construccin del diagrama y mapa de caja parte del clculo de los cuartiles y la
media de una variable, as como de la obtencin de las llamadas cotas o valores
adyacentes superior e inferior, que se obtienen, a su vez, como el producto de los
valores del tercer (primer) cuartil por 1,5 veces el recorrido intercuartlico Chasco
(2002).

De acuerdo a la figura existen valores atpicos que sobrepasan y estn por debajo de las
cotas, dichos valores son representados en el mapa correspondiendo a comunas en
sector norte, centro y sur, presumiblemente existen salarios promedio que se alejan en
mayor proporcin a la media, por otro lado existen observaciones con valor cero
haciendo necesario excluirlas del anlisis2.
Fenmeno de dependencia espacial
Un elemento clave en el AEDE es como entender el espacio y la contigidad entre las
conunas de Chile, pues dada su accidentada geografa se torna complejo decidir si se va
a entender esta relacin de forma binaria travs de una matriz de retardos espaciales a
la queen o a la rook de acuerdo si comparten una frontera en comn de longitud no nula,
o en su defecto emplear distancias euclideanas mediante la fijacin de centroides por
comuna. Cada procedimiento no est excento de problemas desde el punto de vista
metodolgico . Sin embargo es recomendable observar como se comporta la
dependencia espacial de acuerdo alcontraste de autocorrelacin espacial I de
Moran bajo diversas nociones de espacio y orden de contigidad.
Al analizar los graficos de Moran global de acuerdo al salario promedio comunal bajo
primer, segundo y tercer orden y sumado a ello al realizar las permutaciones
correspondientes se encuentra significancia bajo dicha prueba, por tanto se verifica loa
existencia de autocorrelacion espacial. Se decide finalmente trabaja con una matriz
queen de orden 2.

2 Pertenecen a las comunas de Tortel, San Gregorio y Torres del Paine, para efectos
prcticos no se tomarn en cuenta dichas observaciones.

Para definir el criterio de contigidad y el tratamiento del espacio en el anlisis


exploratorio se considerarn las formulaciones de acuerdo a
Mapas

Cuales son

Donde estn los de alto ingreso y de bajo ingreso

Anlisis exploratorio espacial de datos

You might also like