You are on page 1of 16

UNIVERSIDAD MAYOR DE SAN ANDRS

FACULTAD DE CIENCIAS ECONMICAS Y


FINANCIERAS

CARRERA DE ADMINISTRACIN DE EMPRESAS

TRABAJO DE INVESTIGACIN

SPSS

ANALISIS DESCRIPTIVO
ASIGNATURA: Tecnologa de la Informacin y Comunicacin
DOCENTE:

Mg.Sc.Carlos Mullisaca Choque

UNIVERSITARIO: Mendoza Cardenas Pablo Emmanuel

FECHA:

04 / 0 1 / 16

Contenido
ANALISIS DESCRIPTIVO ........................................................................................................................ 3
1. Media .......................................................................................................................................... 3
2. Mediana ...................................................................................................................................... 4
3. Moda ........................................................................................................................................... 4
Medidas de Dispersin - Varianza y Desviacin .............................................................................. 4
1. Varianza ....................................................................................................................................... 5
2. Desviacin Estndar o Tpica ....................................................................................................... 5
MEDIDAS DE DISTIBUCIN - ASIMETRA Y CURTOSIS ......................................................................... 5
1. Asimetra ..................................................................................................................................... 6
ESCALAS DE MEDIDA ........................................................................................................................... 7
1. Nominal ....................................................................................................................................... 7
2. Ordinal ......................................................................................................................................... 7
3. Intervalo ...................................................................................................................................... 7
4. Razn ........................................................................................................................................... 7
b. Anlisis Descriptivo de Acuerdo al Nivel de Medida ................................................................... 7
B.1. Variables Categricas ............................................................................................................... 7
B.2. Variables de Escala ................................................................................................................... 8
GENERANDO ANLISIS DESCRIPTIVOS CON SPSS ............................................................................... 8
1. Frecuencias.................................................................................................................................. 9
OPCIONES DEL PROCEDIMIENTO FRECUENCIAS ................................................................................. 9
GRFICOS DEL PROCEDIMIENTO FRECUENCIAS - SPSS..................................................................... 10
1. Grfico de Barras ....................................................................................................................... 10
2. Grfico de Sectores ................................................................................................................... 10
FORMATO DEL PROCEDIMIENTO FRECUENCIAS SPSS ...................................................................... 10
FRECUENCIAS PARA VARIABLES CATEGORICAS ................................................................................ 11
RESULTADOS - FRECUENCIAS CON VARIABLES CATEGRICAS ......................................................... 12
FRECUENCIAS PARA VARIABLES DE ESCALA...................................................................................... 13
RESULTADOS PROCEDIMIENTO DESCRIPTIVOS DE SPSS ................................................................... 15
BIBLIOGRAFA .................................................................................................................................... 16
Enlaces externos ............................................................................................................................ 16

ANALISIS DESCRIPTIVO
Una de las principales funciones de la estadstica consiste en la descripcin de los datos; ya sea por medio de
medidas (estimadores), grficos o tablas en las que se puedan apreciar claramente el comportamiento y
las tendencias de la informacin recopilada. SPSS cuenta con una serie de procedimientos para realizar esta
labor, cada uno de los cuales nos ofrece diversas posibilidades y su aplicacin depende de las caractersticas
de la informacin que contenga cada variable.
Antes de iniciar con el anlisis descriptivo de datos a travs de SPSS, es necesario aclarar algunos conceptos
fundamentales de la estadstica, los cuales son de vital importancia para la correcta interpretacin de los
resultados que ofrecen los diferentes procedimientos del paquete.
Debemos recordar que la estadstica es un sistema o mtodo empleado en la recoleccin,
organizacin, anlisis e interpretacin de los datos. Esta ciencia se divide en dos fases; la primera corresponde
a la Estadstica descriptiva, cuya finalidad es agrupar y representar la informacin de forma ordenada, de tal
manera que nos permita identificar rpidamente aspectos caractersticos delcomportamiento de los datos. La
segunda fase corresponde a la Estadstica de Inferencia, la cual busca dar explicacin al comportamiento o
hallar conclusiones de un amplio grupo de individuos, objetos o sucesos a travs del anlisis de una pequea
fraccin de sus componentes (Muestra).
En este captulo nos concentraremos exclusivamente en la Estadstica Descriptiva y los procedimientos que la
componen, como las medidas de tendencia central, medidas de distribucin y las medidas de dispersin.
Antes de conocer cada una de estas medidas es necesario resaltar la diferencia entre Poblacin y Muestra. Se
denomina Poblacin al total de los elementos que componen un conjunto, el cual es el objeto de inters de un
estudio.
Las poblaciones pueden ser finitas o infinitas de acuerdo si se conoce el total de los elementos que la
componen o no. Generalmente es bastante difcil realizar un estudio con el total de la poblacin, ya sea por
que es demasiado grande, requiere demasiado tiempo para su anlisis, los costos son muy elevados, se
desconoce el total de elementos, etc.
Por estas razones se suele sustraer una pequea fraccin de la poblacin para realizar los anlisis; de tal
manera que las conclusiones que se extraigan sobre la fraccin sean aplicables a la poblacin. A esta fraccin
se le denomina Muestra y cada uno de los procedimientos estadsticos presentan algunas variaciones en sus
ecuaciones de acuerdo si los datos representan muestras o poblaciones.
Medidas tendencia central: Media Mediana y Moda
Este tipo de medidas nos permiten identificar y ubicar el punto (valor) alrededor del cual se tienden ha reunir
los datos (Punto central). Estas medidas aplicadas a las caractersticas de las unidades de una muestra se les
denomina estimadores o estadgrafos; mientras queaplicadas a poblaciones se les denomina parmetros o
valores estadsticos de la poblacin. Los principales mtodos utilizados para ubicar el punto central son la
media, la mediana y la moda.

1. Media
Ecuacin 5-1
Cuando los valores representan una poblacin la ecuacin se define como:

Ecuacin 5- 2
Donde (m) representa la media, (N) representa el tamao de la poblacin y (Xi) representa cada uno de los
valores de la poblacin. Ya que en la mayora de los casos se trabajan con muestras de lapoblacin todas
las ecuaciones que se presenten a continuacin sern representativas para las muestras. La media aritmtica
para una muestra esta determinada como

Ecuacin 5-3
Donde (X) representa la Media para la muestra, (n) el tamao de la muestra y (Xi) representa cada uno de los
valores observados. Esta frmula nicamente es aplicable si los datos se encuentran desagrupados; en caso
contrario debemos calcular la media mediante la multiplicacin de los diferentes valores por la frecuencia con
que se encuentren dentro de la informacin; es decir,

Ecuacin 5-4
Donde (Yi) representa el punto medio de cada observacin, (ni) es la frecuencia o nmero de observaciones
en cada clase y (n) es el tamao de la muestra siendo igual a la suma de las frecuencias de cada clase.
Para entender mejor este concepto vamos a suponer que hemos tomado la edad de 5 personas al azar cuyos
resultados fueron (22, 33, 35, 38 y 41). Para facilitar su interpretacin se han generado tres rangos de edad los
cuales se han establecido de 21 a 30 aos, de 31 a 40 aos y de 41 a 50 aos. Si nos fijamos en estos rangos

notaremos que los puntos medios son 25, 35 y 45 respectivamente. Los resultados de la organizacin de estos
datos se representan en la tabla [5-1].

Si aplicamos la frmula para valores agrupados obtendramos que la media es igual a

Lo que nos indicara que el promedio de edad de los encuestados es de 35 aos. Si ha estos mismos resultados
le aplicamos la ecuacin para datos desagrupados (Ecuacin 5-3), tomando como referencia cada uno de los
valores individuales, obtendramos que la media es igual a

Lo que nos indicara que el promedio de edad para los datos desagrupados es de 34 aos aproximadamente.
Esta diferencia se debe a que al agrupar los datos se pierde parcialmente la exactitud de los clculos,
principalmente al aumentar el nmero de datos. Para evitar estos inconvenientes, SPSS nos
permite calcular las Medias, como si se trataran de valores desagrupados, aunque tiene algunos
procedimientos para valores agrupados.
Es importante resaltar que existe una gran variedad de medias como la Media geomtrica, la Media
ponderada, la Media cuadrtica, etc. Por el momento slo hacemos nfasis en la media aritmtica ya que es
la ms utilizada, aunque se recomienda a los lectores profundizar en estos temas.

2. Mediana
Con esta medida podemos identificar el valor que se encuentra en el centro de los datos, es decir, nos
permite conocer el valor que se encuentra exactamente en la mitad del conjunto de datos despus que las
observaciones se han ubicado en serie ordenada. Esta medida nos indica que la mitad de los datos se
encuentran por debajo de este valor y la otra mitad por encima del mismo. Para determinar la posicin de la
mediana se utiliza la frmula
Ecuacin 5-5
Para comprender este concepto vamos a suponer que tenemos la serie ordenada de valores (2, 5, 8, 10 y 13),
la posicin de la mediana sera:

Lo que nos indica que el valor de la mediana corresponde a la tercera posicin de la serie, que equivale al
nmero (8). Si por el contrario contamos con un conjunto de datos que contiene un nmero par de
observaciones, es necesario promediar los dos valores medios de la serie. Si en el ejemplo anterior le
anexamos el valor 15, tendramos la serie ordenada (2, 5, 8, 10, 13 y 15) y la posicin de la mediana sera,

Es decir, la posicin tres y medio. Dado que es imposible destacar la posicin tres y medio,
esnecesario promediar los dos valores de la posiciones tercera y cuarta para producir una mediana
equivalente, que para el caso corresponden a (8 + 10)/2 =9. Lo que nos indicara que la mitad de los valores
se encuentra por debajo del valor 9 y la otra mitad se encuentra por encima de este valor.
En conclusin la mediana nos indica el valor que separa los datos en dos fracciones iguales con el cincuenta
porciento de los datos cada una. Para las muestras que cuentan con un nmero impar de observaciones o
datos, la mediana dar como resultado una de las posiciones de la serie ordenada;mientras que para las
muestras con un nmero par de observaciones se debe promediar los valores de las dos posiciones centrales.

3. Moda
La medida modal nos indica el valor que ms veces se repite dentro de los datos; es decir, si tenemos la serie
ordenada (2, 2, 5 y 7), el valor que ms veces se repite es el nmero 2 quien seria la modade los datos. Es
posible que en algunas ocasiones se presente dos valores con la mayor frecuencia, lo cual se
denomina Bimodal o en otros casos ms de dos valores, lo que se conoce comomultimodal.
En conclusin las Medidas de tendencia central, nos permiten identificar los valores msrepresentativos de
los datos, de acuerdo a la manera como se tienden a concentrar. La Media nos indica el promedio de los datos;
es decir, nos informa el valor que obtendra cada uno de los individuos si se distribuyeran los valores en
partes iguales. La Mediana por el contrario nos informa el valor que separa los datos en dos partes iguales,
cada una de las cuales cuenta con el cincuenta porciento de los datos. Por ltimo la Moda nos indica el valor
que ms se repite dentro de los datos.

Medidas de Dispersin - Varianza y Desviacin


As como las medidas de tendencia central nos permiten identificar el punto central de los datos, las Medidas
de dispersin nos permiten reconocer que tanto se dispersan los datos alrededor del punto central; es decir,

nos indican cuanto se desvan las observaciones alrededor de su promedio aritmtico (Media). Este tipo de
medidas son parmetros informativos que nos permiten conocer como los valores de los datos se reparten a
travs de eje X, mediante un valor numrico que representa el promedio de dispersin de los datos. Las
medidas de dispersin ms importantes y las msutilizadas son la Varianza y la Desviacin estndar (o
Tpica).

1. Varianza
Esta medida nos permite identificar la diferencia promedio que hay entre cada uno de los valoresrespecto a su
punto central (Media
). Este promedio es calculado, elevando cada una de las diferencias al cuadrado (Con
el fin de eliminar los signos negativos), y calculando su promedio o media; es decir, sumado todos los
cuadrados de las diferencias de cada valor respecto a la media y dividiendo este resultado por el nmero de
observaciones que se tengan. Si la varianza es calculada a una poblacin (Total de componentes de un
conjunto), la ecuacin sera:

Ecuacin 5-6
Donde (
) representa la varianza, (Xi) representa cada uno de los valores, (
) representa la media
poblacional y (N) es el nmero de observaciones tamao de la poblacin. En el caso que estemos trabajando
con una muestra la ecuacin que se debe emplear es:

Ecuacin 5-7
Donde (S2) representa la varianza, (Xi) representa cada uno de los valores, (
) representa la media de la
muestra y (n) es el nmero de observaciones tamao de la muestra. Si nos fijamos en la ecuacin, notaremos
que se le resta uno al tamao de la muestra; esto se hace con el objetivo de aplicar una pequea medida de
correccin a la varianza, intentando hacerla ms representativa para la poblacin. Es necesario resaltar que la
varianza nos da como resultado el promedio de la desviacin, pero este valor se encuentra elevado al
cuadrado.

2. Desviacin Estndar o Tpica


Esta medida nos permite determinar el promedio aritmtico de fluctuacin de los datos respecto a su punto
central o media. La desviacin estndar nos da como resultado un valor numrico que representa el promedio
de diferencia que hay entre los datos y la media. Para calcular la desviacin estndar basta con hallar la raz
cuadrada de la varianza, por lo tanto su ecuacin sera:
Ecuacin 5-8
Para comprender el concepto de las medidas de distribucin vamos a suponer que el gerente de una empresa
de alimentos desea saber que tanto varan los pesos de los empaques (en gramos), de uno de sus productos;
por lo que opta por seleccionar al azar cinco unidades de ellos para pesarlos. Los productos tienen los
siguientes pesos (490, 500, 510, 515 y 520) gramos respectivamente.
Por lo que su media es:

La varianza sera:

Por lo tanto la desviacin estndar sera:


Con lo que concluiramos que el peso promedio de los empaques es de 507 gramos, con una tendencia a
variar por debajo o por encima de dicho peso en 12 gramos. Esta informacin le permite al gerente determinar
cuanto es el promedio de perdidas causado por el exceso de peso en los empaques y le da las bases para tomar
los correctivos necesarios en el proceso de empacado.

MEDIDAS DE DISTIBUCIN - ASIMETRA Y CURTOSIS


Las medidas de distribucin nos permiten identificar la forma en que se separan o aglomeran los valores de
acuerdo a su representacin grfica. Estas medidas describen la manera como los datos tienden a reunirse de
acuerdo con la frecuencia con que se hallen dentro de la informacin. Su utilidad radica en la posibilidad de
identificar las caractersticas de la distribucin sin necesidad de generar el grfico. Sus principales medidas
son la Asimetra y la Curtosis.

1. Asimetra
Esta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central
(Media aritmtica). La asimetra presenta tres estados diferentes [Fig.5-1], cada uno de los cuales define de
forma concisa como estn distribuidos los datos respecto al eje de asimetra. Se dice que la asimetra es
positiva cuando la mayora de los datos se encuentran por encima del valor de la media aritmtica, la curva
es Simtrica cuando se distribuyen aproximadamente la misma cantidad de valores en ambos lados de la
media y se conoce como asimetra negativa cuando la mayor cantidad de datos se aglomeran en
los valores menores que la media.

El Coeficiente de asimetra, se representa mediante la ecuacin matemtica,


Ecuacin 5-9
Donde (g1) representa el coeficiente de asimetra de Fisher, (Xi) cada
uno de los valores, ( ) la media de la muestra y (ni) la frecuencia de
cada valor. Los resultados de esta ecuacin se interpretan:
(g1 = 0): Se acepta que la distribucin es Simtrica, es decir, existe
aproximadamente la misma cantidad de valores a los dos lados de la
media. Este valor es difcil de conseguir por lo que se tiende a tomar
los valores que son cercanos ya sean positivos o negativos ( 0.5).
(g1 > 0): La curva es asimtricamente positiva por lo que los valores se
tienden a reunir ms en la parte izquierda que en la derecha de la media.
(g1 < 0): La curva es asimtricamente negativa por lo que los valores se tienden a reunir ms en la parte
derecha de la media.
Desde luego entre mayor sea el nmero (Positivo o Negativo), mayor ser la distancia que separa la
aglomeracin de los valores con respecto a la media.
2. CURTOSIS
Esta medida determina el grado de concentracin que presentan los valores en la regin central de la
distribucin. Por medio del Coeficiente de Curtosis, podemos identificar si existe una gran concentracin
de valores (Leptocrtica), una concentracin normal (Mesocrtica) una baja concentracin (Platicrtica).

Para calcular el coeficiente de Curtosis se utiliza la ecuacin:


Ecuacion 5-10
Donde (g2) representa el coeficiente de Curtosis, (Xi) cada uno de
los valores, ( ) la media de la muestra y (ni) la frecuencia de cada
valor. Los resultados de esta frmula se interpretan:
(g2 = 0) la distribucin es Mesocrtica: Al igual que en la asimetra
es bastante difcil encontrar un coeficiente de Curtosis de cero (0),
por lo que se suelen aceptar los valores cercanos ( 0.5 aprox.).
(g2 > 0) la distribucin es Leptocrtica
(g2 < 0) la distribucin es Platicrtica
Cuando la distribucin de los datos cuenta con un coeficiente de asimetra (g1 = 0.5) y un coeficiente de
Curtosis de (g2 = 0.5), se le denomina Curva Normal. Este criterio es de suma importancia ya que para la
mayora de los procedimientos de la estadstica de inferencia se requiere que los datos se distribuyan
normalmente.
La principal ventaja de la distribucin normal radica en el supuesto que el 95% de los valores se
encuentra dentro de una distancia de dos desviaciones estndar de la media aritmtica (Fig.5-3); es decir, si
tomamos la media y le sumamos dos veces la desviacin y despus le restamos a la media dos desviaciones,
el 95% de los casos se encontrara dentro del rango que compongan estos valores.
Desde luego, los conceptos vistos hasta
aqu, son slo una pequea introduccin
a las principales medidas de Estadstica
Descriptiva; es de gran importancia que
los lectores profundicen en estos temas
ya que la principal dificultad del
paquete SPSS radica en el desconocimiento de los conceptos estadsticos.
Las definiciones plasmadas en este captulo han sido extradas de los libros Estadstica para
administradores escrito por Alan Wester de la editorial McGraw-Hill y el libro Estadstica y Muestreo escrito
por Ciro Martnez editorial Ecoe editores (Octava edicin). No necesariamente tienes que guiarte por estos
libros ya que en las libreras encontraras una gran variedad de textos que pueden ser de bastante utilidad en la
introduccin a esta ciencia.

ESCALAS DE MEDIDA
Para realizar un correcto anlisis de los datos es fundamental conocer de antemano el tipo de medida de la
variable, ya que para cada una de ellas se utiliza diferentes estadsticos. La clasificacin ms convencional de
las escalas de medida las divide en cuatro grupos denominados Nominal, Ordinal, Intervaloy Razn.

1. Nominal
Son variables numricas cuyos valores representan una categora o identifican un grupo de pertenencia. Este
tipo de variables slo nos permite establecer relaciones de igualdad/desigualdad entre los elementos de la
variable. La asignacin de los valores se realiza en forma aleatoria por lo que NO cuenta con un orden lgico.
Un ejemplo de este tipo de variables es el Gnero ya que nosotros podemos asignarle un valor a los hombres y
otro diferente a las mujeres y por ms machistas o feministas que seamos no podramos establecer que uno es
mayor que el otro.

2. Ordinal
Son variables numricas cuyos valores representan una categora o identifican un grupo de pertenencia
contando con un orden lgico. Este tipo de variables nos permite establecer relaciones de
igualdad/desigualdad y a su vez, podemos identificar si una categora es mayor o menor que otra. Un ejemplo
de variable ordinal es el nivel de educacin, ya que se puede establecer que una persona con ttulo de
Postgrado tiene un nivel de educacin superior al de una persona con ttulo de bachiller. En las variables
ordinales no se puede determinar la distancia entre sus categoras, ya que no es cuantificable o medible.

3. Intervalo
Son variables numricas cuyos valores representan magnitudes y la distancia entre los nmeros de
su escala es igual. Con este tipo de variables podemos realizar comparaciones de igualdad/desigualdad,
establecer un orden dentro de sus valores y medir la distancia existente entre cada valor de la escala. Las
variables de intervalo carecen de un cero absoluto, por lo que operaciones como la multiplicacin y la
divisin no son realizables. Un ejemplo de este tipo de variables es la temperatura, ya que podemos decir que
la distancia entre 10 y 12 grados es la misma que la existente entre 15 y 17 grados. Lo que no podemos
establecer es que una temperatura de 10 grados equivale a la mitad de una temperatura de 20 grados.

4. Razn
Las variables de razn poseen las mismas caractersticas de las variables de intervalo, con la diferencia que
cuentan con un cero absoluto; es decir, el valor cero (0) representa la ausencia total de medida, por lo que se
puede
realizar
cualquier
operacin Aritmtica (Suma,
Resta,
Multiplicacin
y
Divisin)
y Lgica (Comparacin y ordenamiento). Este tipo de variables permiten el nivel ms alto de medicin. Las
variables altura, peso, distancia o el salario, son algunos ejemplos de este tipo deescala de medida.
Debido a la similitud existente entre las escalas de intervalo y de razn, SPSS las ha reunido en un nuevo tipo
de medida exclusivo del programa, al cual denomina Escala. Las variables de escala son para SPSS todas
aquellas variables cuyos valores representan magnitudes, ya sea que cuenten con un cero (0) absoluto o no.
Teniendo esto en cuenta discutiremos a continuacin los diferentes procedimientos estadsticos que se pueden
utilizar de acuerdo al tipo de medida de cada variable.

b. Anlisis Descriptivo de Acuerdo al Nivel de Medida


No todos los procedimientos estadsticos son realmente tiles para la totalidad de los niveles de medida. Cada
uno de los tipos de medida posee ciertas caractersticas, las cuales debemos tener en cuenta en el momento de
realizar un anlisis descriptivo. encontrars algunos de los procedimientos que resultan ventajosos en los
anlisis descriptivos de los diferentes niveles de medida. Es necesario aclarar que esta tabla es slo una
muestra de las medidas que se pueden emplear; en algunos textos de estadstica aparecen tablas ms amplias y
detalladas de los procedimientos.

Si nos fijamos en la tabla 5-2, notaremos que los niveles Nominal y Ordinal cuentan con los mismos
procedimientos de anlisis, por lo que se agrupan como variables categricas. A partir de este punto cuando
nos refiramos a las variables categricas debemos recordar que se alude a las variables de
tipo Nominal y Ordinal.
Es importante resaltar que para los anlisis descriptivos no hay una gran diferencia entre estos dostipos
de variables, pero si existe diferencia en los anlisis de Inferencia. Antes de conocer como se efectan estos
procedimientos en SPSS, es necesario exponer las razones por las que ciertos procedimientos no son de
utilidad en algunos de los niveles de medida.

B.1. Variables Categricas


Para las variables que representan categoras o grupos de pertenencia, los principales procedimientos
estadsticos, que se pueden utilizar en su anlisis descriptivo son las frecuencias(Recuento), el Porcentaje,
la Moda, en algunos casos la mediana y los grficos ms favorables son el de Sectores y el de Barras.

Para comprender mejor la razn de estos procedimientos vamos a realizar el anlisis de la variable Gnero, la
cual cuenta con los valores (1, 1, 1, 1, 1, 1, 1, 1, 2, 2); en donde el valor uno (1) representa al gnero
Femenino y el valor Dos (2) al gnero Masculino. Las frecuencias y sus respectivos porcentajes para esta
variable seran los expuestos en la tabla [5-3]. Ahora si hallamos las principales medidas de tendencia central,
obtenemos los resultados expuestos en la tabla [5-4].
Si nos fijamos en
los
resultados
notaremos que la
Media toma el
valor 1.2, el cual
nos indica que en promedio los encuestados cuenta con un gnero de (1.2). Este resultado no posee una
interpretacin aplicable a la informacin de la variable, por lo que esta medida no es de utilidad en el anlisis
descriptivo.
Si observamos la Mediana notaremos que toma el valor 1, que para el caso corresponde al gnero Femenino,
pero si en vez de 10 valores tuviramos nicamente dos (1 y 2), la mediana sera de (1.5), cuya interpretacin
no es aplicable a la informacin de la variable. La mediana se puede utilizar cuando estamos trabajando con
variables que contienen un elevado nmero de categoras y su interpretacin se debe manejar como un factor
informativo para el investigador y no como una medida representativa en el reporte.
Por ltimo encontramos la Moda, la cual para el caso asume el
valor 1 y nos indica que la categoracon mayor frecuencia dentro de
la variable es la correspondiente al gnero Femenino. Las medidas
de dispersin y distribucin no son aplicables a este tipo de
variables ya que sus ecuaciones nos permiten determinar como se
comportan los datos respecto a un punto central o media. Si
hallamos la desviacin estndar para los datos del ejemplo,
obtendramos un valor de 0.42164, que nos indicara que el
promedio del gnero presenta una variacin de 0.42, cuyo
resultado no sera aplicable a la interpretacin de la variable.

B.2. Variables de Escala


Este tipo de variables nos permite realizar anlisis ms profundos de los datos, aplicando una gran variedad de
medidas. Al contrario de las variables categricas en este tipo de variables las frecuencias no son de utilidad
en los anlisis descriptivos, debido a la gran cantidad de valores que suele tomar. Supongamos que realizamos
un sondeo de edad con una muestra de 500 personas, si generamos una tabla de frecuencias obtendramos
fcilmente unos 60 o 70 rangos diferentes hacindola muy extensa y poco informativa.
Para las variables de escala son ms informativas la medidas como la media, la mediana, la desviacin
estndar, la asimetra y otras ms, a las cuales se les suele denominar Medidas de Resumen.

GENERANDO ANLISIS DESCRIPTIVOS CON SPSS


SPSS nos ofrece varios procedimientos estadsticos para el anlisis descriptivo de la informacin, algunos de
los cuales, son de mayor utilidad de acuerdo al nivel de medida de cada variable (Categrica Escala).
Paraconocer estos procedimientos vamos a utilizar el archivoAnlisis.sav incluido en la carpeta Captulo5 del
CD adjunto.
Es importante resaltar que para poder ejecutar cualquier procedimiento de anlisis es necesario tener el
programa activo y contar con un archivo abierto; si no tienes el programa activo es necesario abrirlo mediante
la ruta Inicio..Programas. SPSS For WindowsSPSS 12.0 para Windows. Una vez abierto, debemos cargar
el archivo por lo que nos dirigimos al men Archivo seleccionamos la opcin Abrir... Datos, al aparecer la
ventana de navegacin ubicamos el archivo Anlisis.sav en la unidad de CD-ROM y finalmente
hacemos clic en Abrir. Debemos recordar que antes de generar un anlisis, es importante hacer una
depuracin de los datos para evitar posibles errores de captura o digitacin; en este caso el archivo se
encuentra depurado, por lo que omitiremos este procedimiento.
Todos los procedimientos estadsticos con que cuenta SPSS se encuentran ubicados en el menAnalizar. Al
hacer clic en l aparece una lista desplegable , en la cual se pueden observar los diferentes procedimientos con
que cuenta el programa, como Informes, Estadsticos descriptivos, Tablas, Comparar medias, Modelo lineal
general, Modelos mixtos, Correlacin, Regresin, Loglineal, Clasificar, Reduccin de datos, Escalas, Pruebas
no paramtricas, Series temporales, Supervivencia,Respuestas mltiples, Anlisis de valores perdidos y
Muestras complejas.
Esta ltima opcin es exclusiva para la versin 12.0 y por lo tanto no aparece en las versiones anteriores del
programa. El nmero de procedimientos que aparecen en este men variar
de acuerdo al nmero de mdulos que se hayan licenciado; es necesario
recordar que SPSS es un paquete modular y que es posible adquirir la
licencia parcial de los mdulos. Si nos fijamos, notaremos que la mayora
de los enunciados cuenta con una flecha ( ) al lado derecho, lo que nos
indica que estas opciones son Submens que contienen los estadsticos
relacionados con el tema al que hace relacin el nombre. Por el momento
nos concentraremos en el submenEstadsticos descriptivos.
Dentro del submen Estadsticos descriptivos, encontramos los
procedimientos Frecuencias,Descriptivos, Explorar, Tablas
de
contingencia y Razn. Cada uno de ellos cuenta con un propsito especfico

y su utilizacin depende del criterio del investigador y las necesidades del anlisis. A continuacin haremos
un recorrido por los procedimientos principales del submen Estadsticos descriptivos, tratando de explorar la
mayora de sus componentes.

1. Frecuencias
Este procedimiento nos permite analizar de forma descriptiva las variables Categricas o de Escala, mediante
la generacin de tablas de frecuencia, Grficos y una amplia gama de estadsticos como las medidas de
tendencia central, de Dispersin y de Distribucin. Adems nos permite organizar losresultados de forma
ascendente o descendente ya sea por sus valores o sus frecuencias.
Para emplear este procedimiento es necesario ir al men Analizar, seleccionar el submenEstadsticos
descriptivos y escoger dentro de l la opcin Frecuencias, con lo que aparecer el cuadro de dilogo
correspondiente. Este cuadro de dilogo se divide en cuatro secciones correspondientes a la lista de variables,
la casilla de seleccin, las opciones de anlisis y mostrar tablas de frecuencias. Como podemos apreciar las
dos primeras secciones son comunes para la mayora de los cuadros de dilogo de SPSS por lo que no
haremos una explicacin de ellos, en cambio nos enfocaremos en las dos secciones restantes.
Dentro de las opciones de anlisis encontraremos todos los estadsticos, los grficos y las posibilidades de
orden con que cuenta el procedimiento Frecuencias. Para escoger alguna de las opciones basta con
hacer clic sobre ella, con lo que aparecer el cuadro de dilogo correspondiente a la opcin seleccionada.
En la siguiente leccin veremos detalladamente cada una de las partes del procedimiento Frecuencias.

OPCIONES DEL PROCEDIMIENTO FRECUENCIAS


Para activar alguna de las opciones basta con hacer clicsobre ella, con lo que aparecer el cuadro de
dilogocorrespondiente a la opcin seleccionada. Por el momento escogeremos la opcin Estadsticos, por lo
que
hacemos clic en
el
botn Estadsticos de
manera
que
aparezca
el
cuadro
de
dilogo correspondiente aFrecuencia
En este cuadro encontramos las diferentes medidas
estadsticas del procedimiento, como las medidas de
tendencia central (Media, Mediana, Moda y Suma), medidas
de posicin no central (Cuartiles, puntos de corte y
percentiles), medidas de dispersin (Desviacin estndar,
Varianza, Amplitud o rango, Mnimo, Mximo y el Error
tpico de la media) y medidas de distribucin (Asimetra y
Curtosis). Adems encontramos una casilla en la cual
podemos informarle al programa que los valores representan
puntos medios de grupos; es decir, que los valores de la
variable representan el punto medio de los datos agrupados.
Dado que la mayora de los estadsticos que comprende este cuadro de dilogo han sido explicados en
los apartados anteriores, slo haremos referencia a las medidas de posicin no central. Estas medidas nos
permiten conocer el valor que se encuentra o representa una posicin especfica dentro de los datos.
Supongamos que contamos con 100 datos, cuyos valores varan entre 1 y 100; si le pedimos al paquete que
nos indique el valor de los cuartiles, el programa nos ensear los valores que se encuentren en las posiciones
equivalentes al 25%, 50% y 75% de los datos, que para el caso seran los valores (25, 50 y 75)
respectivamente.
Por el contrario, los Percentiles nos permiten conocer los valores que se encuentran en un porcentaje
especfico de los datos; es decir, nos permite saber que valor se encuentra en la posicin que nosotros
deseemos conocer, sin importar si se trata de un porcentaje entero o fraccional (Ej:18.75, 19.25, 20, etc).
Desde luego estas posiciones no deben superar la cifra de cien, ya que para su clculo se toma la totalidad de
los datos validos como el global del porcentaje; es decir, el 100%.
Por ltimo, encontramos la opcin Puntos de corte para [XX] grupos iguales, en donde podemos pedirle
al paquete que divida la informacin en un determinado nmero de grupos con igual porcentaje de casos. Esta
opcin nos ofrece como resultado los percentiles de corte (Porcentajes) de cada uno de los grupos y nos indica
a su vez el valor que se encuentra en cada punto. La nica restriccin que presenta esta opcin, corresponde a
que el nmero mximo de grupos que podemos obtener es de 100.
En conclusin las medidas de posicin no central nos permiten identificar los valores que se encuentran en las
posiciones o porcentajes que deseemos conocer, siendo las ms empleadas losCuartiles (25%, 50% y 75%).
La ltima eleccin que nos ofrece este nuevo cuadro corresponde a Los valores son puntos medios de grupos,
con la cual le podemos especificarle al paquete que los datos recolectados en la variable han sido previamente
agrupados y sus valores representan el punto medio de cada uno de los rangos agrupados. Debemos recordar
que las ecuaciones de cada una de las medidas estadsticas difieren s los valores son agrupados con
anterioridad.
Para emplear cualquiera de los estadsticos del procedimiento Frecuencias, slo basta con activarlo
haciendo clic sobre la casilla que se encuentra a la izquierda de cada medida, de manera que aparezca en ella
un visto bueno ( ). Podemos seleccionar todos los
estadsticos que deseemos, teniendo como nica
limitante el nivel de medida de cada variable. Por el
momento, continuaremos con el recorrido de los
diferentes elementos del procedimiento, por lo que
no seleccionaremos ninguno de los estadsticos y en
cambio hacemos clic en el botn Cancelar, con lo
que volvemos al cuadro de dilogo Frecuencias.

La segunda opcin del procedimiento frecuencias corresponde a Grficos. Al hacer clic sobre el botn
grficos, aparece el cuadro de dilogo correspondiente a Frecuencias: Grficos. En este cuadro encontramos
los tres diferentes tipos de grficos con que cuenta el procedimiento, como los son el grfico de barras, el
grfico de sectores y el histograma. Adems, a travs de este cuadro podemos escoger si las porciones de los
grficos representan un recuento de los casos (Frecuencias) el porcentaje al que equivale.
Por defecto el programa tiene activada la opcin Ninguno. La seccin valores del grfico slo se activa
cuando se selecciona uno de los grficos de barras o de sectores y a su vez la casilla decurva normal slo se
activa cuando se selecciona el Histograma [Fig.5-8]. Para comprender, la esencia de cada uno de estos
mtodos de representacin grfica, en la siguiente leccin vamos a realizar una pequea explicacin de sus
elementos y usos.

GRFICOS DEL PROCEDIMIENTO FRECUENCIAS - SPSS


1. Grfico de Barras
Este tipo de grfico nos permite identificar y comparar de forma visual el comportamiento de las categoras de
una variable. Por medio de las barras podemos conoceraspectos de forma sencilla de una o varias variables,
como lo pueden ser sus categoras, las frecuencias y las diferencias entre ellas.
La estructura bsica de un grfico de barras, est basado en un eje de categoras
generalmente el eje horizontal y un eje de frecuencias que en algunos casos puede ser
remplazado por el porcentaje. Adems se suelen utilizar diferentes colores para cada
una de las categoras facilitando el reconocimiento por parte del usuario.
Los grficos de barras tambin son tiles para comparar varias variables a la vez
[Fig.5-10]. Este tipo de opciones implica una serie de tcnicas como la anidacin y la
agrupacin las cuales sern expuestas en el captulo siete.

2. Grfico de Sectores
Los grficos de sectores o de torta nos permiten observar la variable de
forma global haciendo una comparacin inmediata del porcentaje o la
frecuencia del total de las categoras de una variable. Su utilidad radica en
la facilidad para interpretar la informacin contenida en una variable
mediante la representacin grafica de los resmenes (Porcentajes o
Frecuencias).
La estructura bsica de los grficos de sectores [Fig.5-11],
esta definida por un crculo en el cual se representan cada
una de las categoras por la porcin o fraccin
correspondiente al porcentaje o la frecuencia. En algunas
ocasiones suelen separarse las fracciones, con el fin de
hacer ms clara la informacin.
3. Histograma
Los histogramas nos permiten identificar diversos parmetros como la dispersin, la distribucin y la
concentracin de los datos en una variable de Escala. Este tipo de grficos generan una representacin visual
del comportamiento de los datos, permitiendo observar rasgos caractersticos como la zona o rango de mayor
concentracin, la amplitud, los valores extremos, etc.
La estructura bsica de un histograma , esta basada en rangos, los cuales suelen ser representados
por barras cuya altura es determinada por la cantidad de valores que se encuentren dentro de los lmites de
cada rango (Frecuencia). Generalmente se utiliza el Eje vertical para representar las frecuencias y el
Eje horizontal para los rangos; adicionalmente se puede sobreponer una Curva Normal con el fin de comparar
si los datos tienden a distribuirse de forma uniforme.
En resumen cuando se trabaja con variables categricas (Nominal u
Ordinal),
los grficos msindicados
y
representativos
en
su anlisis descriptivo corresponden a los grficos de Barras y los
deSectores; por el contrario si se trata de una variable de Escala el
grfico ms apropiado es elHistograma.
Dado que por el momento slo estamos haciendo un recorrido por las
opciones del procedimientoFrecuencias, no seleccionaremos ninguno de los grficos y en cambio
hacemos clic en el botnCancelar, con lo cual volvemos al cuadro de dilogo principal del procedimiento. En
la siguienteleccion conoceremos la ultima opcion del procedimiento Frecuencias denominada Formato.

FORMATO DEL PROCEDIMIENTO FRECUENCIAS SPSS


La ltima opcin que encontramos en la ventana
del Procedimiento Frecuencias de SPSS
corresponde aFormato; al hacer clic sobre el botn
aparece
el
cuadro
de
dilogo correspondiente a Frecuencias: En este
cuadro encontramos las seccionesOrdenar
por, Mltiples variables y Suprimir tablas.

10

A travs de la seccin Ordenar por, podemos organizar los resultados del procedimiento (Tablas y Grficos)
por los valores por las frecuencias, ya sea de forma ascendente o descendente. Cuando seleccionamos
la opcin Valores, los resultados se organizaran de acuerdo al nmero que se le hayaasignado a cada categora
dentro de las propiedades de variable; si por el contrario escogemos laopcin frecuencias los resultados se
ordenaran de acuerdo al nmero de apariciones de cada una de las categoras de las variables seleccionadas.
La segunda seccin del cuadro corresponde a Mltiples variables; en donde encontramos las
opciones Compara variables y Organizar resultados segn variables. Si seleccionamos la primeraopcin,
los resultados se agruparn de acuerdo con las variables; es decir, primero nos ensearan las tablas de
frecuencia de todas las variables (Una tabla por cada variable), despus organiza los estadsticos de cada
variable y por ltimo nos ensea los grficos.
En resumen esta opcin nos permite agrupar los resultados de todas las variables por cada uno de los
procedimientos (Frecuencias, Estadsticos y Grficos). Si por el contrario seleccionamos
laopcin Organizar resultados segn variables, el programa nos ensea todos los resultados de cada variable
antes de mostrar los resultados de la siguiente; es decir, nos ensea la tabla de frecuencias, los estadsticos y el
grfico de la primera variable, a continuacin nos ensea los resultados de la segunda y as sucesivamente
hasta terminar con cada una de las variables seleccionadas.
La ltima seccin que encontramos en el cuadro, pertenece a la opcin Suprimir tablas con ms de n
categoras, con la cual podemos pedirle al paquete que no realice las tablas de frecuencia a las variables qu
cuenten con cierto nmero de categoras, dndonos la oportunidad de especificar el limite de categoras que
deseamos introduciendo el valor en la casilla Nmero mximo de categoras. Para continuar con el recorrido
no seleccionaremos ninguna de las opciones y en su lugar hacemosclic en el botn Cancelar con lo que
volveremos al cuadro de dilogo principal del procedimientoFrecuencias.
Por ltimo, aparece la seccin corresponde a la opcin Mostrar tablas de frecuencias , la cual nos permite
escoger si deseamos que las tablas de frecuencia se incluyan en los resultados o por el contrario sean omitidas.
Esta opcin se desactiva cuando queremos realizar anlisis descriptivos a las variables de escala, ya que por lo
general sus tablas de frecuencia suelen contener un gran nmero de valores hacindolas extensas y poco
tiles.
Desde luego es apenas logico que una tabla que nos informa que dentro de los encuestados aparecen 20 con
18 aos de edad, 32 con 19 aos de edad y as sucesivamente hasta llegar al valor mximo, no es de gran
utilidad. Para facilitar la interpretacin de este tipo de informacin es mejor crear una nueva variable y
codificar estas edades dentro de rangos y sucesivamente
realizar la tablade frecuencias a esta nueva variable de edad
categorizada.
Para comprender todos los conceptos y elementos que
componen el procedimiento frecuencias, en las siguientes
lecciones vamos a realizar a manera de ejemplo el anlisis
de
las
variables
categricas
estado
civil
(estciv variable Nominal)
y
Nivel
de
educacin
(niveduc variable Ordinal) y posteriormente realizaremos el
anlisis de las variables de escala Edad del encuestado
(Edad) y Aos de educacin (educ).

FRECUENCIAS PARA VARIABLES CATEGORICAS


Dado que el procedimiento frecuencias genera los mismos resultados (Estadsticos, Tablas y Grficos), para la
totalidad de las variables seleccionadas, sin importar s son Categricas o de Escala y que a su vez, estos dos
tipos de medida emplean parmetros distintos en el anlisis descriptivo; es indispensable realizar
losanlisis de las variables categricas antes que el de las variables de escala, con el fin de optimizar
losresultados, seleccionando exclusivamente los elementos ms apropiados para cada tipo de medida.
Una vez seleccionado el procedimiento Frecuencias y estando activo el cuadro de dilogo principal, podemos
empezar con el anlisis descriptivo. Lo primero que debemos realizar es seleccionar las variables de inters
(para el caso ESTCIV yNIVEDUC), por lo que nos dirigimos al listado de variables, las ubicamos y
sucesivamente las llevamos hasta la casilla de seleccin , ya sea haciendo doble clic sobre ellas o a travs
delbotn flecha ( ). Despus de haber
seleccionado
las
variables
debemos
especificarle al programa los procedimientos
que deseamos realizar en el anlisis para lo
que hacemos clic en el botnEstadsticos... de
manera que aparezca el cuadro de dilogo
correspondiente , en donde seleccionamos las
medidas Mediana y Moda.
Despus de seleccionar las medidas estadsticas hacemos clic en el botn Continuar con lo que volvemos al
cuadro principal del procedimiento Frecuencias. Para continuar seleccionamos el botnGrficos con lo que
aparece el cuadro de dilogo respectivo; a travs de este cuadro
seleccionaremos la opcin Grafico de barras, teniendo en cuenta definir en la
seccin valores del grfico la opcin frecuencias y posteriormente
hacemos clic en el botn Continuar, con lo que volvemos al cuadro de dilogo
Por ltimo activamos el botn Formato con lo que aparece el cuadro de
dialogo correspondiente [Fig.5-18], en donde seleccionamos las
opciones Valores ascendentes y Comparar variables. Una vez activadas estas
opciones, hacemos clic en el botn Continuar con lo que volvemos al cuadro

11

de dilogo principal del procedimiento Frecuencias.


Hasta este momento todo lo que hemos hecho es pedirle al
programa que nos realice las tablas de frecuencia de las
variables ESTCIV y NIVEDUC, as como las medidas de
tendencia central Medianay Moda, un grfico de barras para
cada una de ellas y que organice los resultados de acuerdo a
los valores que se establecieron en las propiedades de las
variables, asi como que exponga losresultados de forma
comparativa; es decir, nos ensee las tablas de frecuencia de
las dos variables y sucesivamente los grficos. Para finalizar
y
observar
los resultados debemos
hacer clic en
el botnAceptar con lo que los efectos del procedimiento aparecen en el visor de resultados.
En la siguiente leccion detallaremos los resultados que genera SPSS al procedimiento Frecuencias con
variables Categoricas.

RESULTADOS - FRECUENCIAS CON VARIABLES CATEGRICAS


Por defecto SPSS nos ensea el nombre del
procedimiento (en este caso Frecuencias) y
losresultados del mismo, en donde encontraremos
las tablasde estadsticos, las tablas de frecuencia y por
ltimo los grficos. Dentro de las tablas de estadsticos
[Fig.5-20] se incluye un resumen de los valores validos
que se encontraron dentro de los datos de cada una de las
variables (ESTCIV y NIEVEDUC), as como los valores de cada uno de los estadsticos que se le hayan
solicitado al procedimiento, que para el caso corresponden a la Mediana y la Moda.
Despus de la tabla de estadsticos e informacin, aparecen las tablas de frecuencia. Por defecto SPSS incluye
dentro de los resultados de una tabla de frecuencia cada una de las categoras de la variable con sus
respectivos estimadores como Frecuencias, Porcentajes, Porcentajes validos(el porcentaje valido representa
el resultado de dividir la frecuencia de la categora sobre el nmero total de valores validos) y el Porcentaje
acumulado (es el resultado de la suma del porcentaje valido de las diferentes categoras de la variable).
Si nos fijamos en la tabla de frecuencias correspondiente a la variable Nivel de educacin (Niveduc),
notaremos que aparece una ligera diferencia entre los valores del Porcentaje y el Porcentaje valido, esta
variacin se ocasionada debido a que dentro de los
datos de la variable se encuentran cuatro (4) valores
que han sido declarados como perdidos en las
propiedades de la variable. En este ocasin los
valores identifican a los casos en los que no fue
posible obtener una respuesta coherente por parte de
los entrevistados (NR).
La diferencia en los valores se presenta debido a que
el porcentaje es calculado mediante la divisin de la
frecuencia sobre el nmero total de casos (para el
ejemplo n= 300), mientras que el porcentaje valido
se calcula a travs de la divisin de la frecuencia
sobre el nmero total de casos validos (para el
ejemplo n= 296). Por ejemplo, si calculamos el
porcentaje
y
el
porcentaje
valido
para
la categoraPrimaria obtenemos:

Ahora, si observamos en la parte inferior de la tabla de


frecuencias de la variable Niveduc, notaremos la
existencia de dos totales; el primero de ellos
(enmarcado en azul) corresponde a los valores validos,
mientras que el segundo (enmarcado en caf)
pertenece al colectivo de los valores encontrados
dentro de la variable. La utilidad de los totales radica
en la informacin que nos brinda acerca del nmero de
casos de la variable y el nmero de casos
con respuestas validas.
Por ltimo, aparecen en el visor de resultados los grficos de cada una de las variables. Por defecto SPSS
genera los grficos de cada una de las variables ubicando en el eje Vertical (eje Y) el recuento o frecuencia y
ubicando en el eje Horizontal (eje X) las categoras; as como el nombre de la variable a la que corresponde el
grfico. Si nos fijamos en los grficos, notaremos que las categoras ms sobre salientes
son Soltero y Secundaria respectivamente.
SPSS nos permite modificar algunos de los parmetros de cada uno de los grficos como lo puede ser la
forma de las barras, el color, la trama de relleno, la organizacin, etc. Por el momento no profundizaremos en
estos temas ya que sern explorados con mayor profundidad en l captulo 7.
En conclusin el procedimiento Frecuencias al ser utilizado en el anlisis de variables categricas(Nominal u
Ordinal), nos permite identificar los parmetros ms representativos como lo son el numero de categoras, las

12

frecuencias de cada categora y la representacin grfica de los datos, la cual puede ser expresada ya sea
mediante un grfico de barras o de sectores.
Adems es necesario aclarar que los procedimientos que se especifiquen, se realizarn con todas las variables
que se hallan seleccionado, sin importar el tipo al que corresponda, por lo que es recomendable realizar
primero los anlisis a las variables categricas y posteriormente a las deescala. En la siguiente leccion
haremos un ejemplo del procedimiento Frecuencias con Variables deEscala.

FRECUENCIAS PARA VARIABLES DE ESCALA


Al contrario del anlisis descriptivo de las variables categricas, cuando trabajamos con variables
de escalalas tablas de frecuencia o recuento no son informacin prctica debido a la gran cantidad de valores
o rangos que se pueden encontrar en las variables de este tipo. Para comprender el procedimiento que se debe
realizar con las variables de Escala, vamos a realizar el anlisisdescriptivo de las variables Edad del
encuestado (Edad) y Aos estudiados (Educao).
Si aun te encuentras en el visor de resultados, puedes volver al cuadro de dialogo de Frecuencias
haciendo clicen el botn Recuperar cuadro de dilogo y seleccionando el procedimiento frecuencias como se
muestra. De lo contrarios es necesario volver al men Analizar.. Estadsticos descriptivos.. Frecuencias.
Una vez que hemos abierto nuevamente el cuadro de dilogo
del
procedimiento Frecuencias,
hacemos clic en
el botn Restablecer con lo que todas las opciones
seleccionadas anteriormente se desactivarn. Al igual que
con las variables categricas, lo primero que debemos
efectuar es definir las variables a las que le realizaremos
el anlisis, que en nuestro caso son Edad y Educaos, por lo
que debemos ubicarlas en la lista de variables y llevarlas a la
casilla de seleccin, ya sea haciendo doble clic sobre ellas o
a travs del botn flecha (
); posteriormente debemos desactivar la opcinMostrar tablas de frecuencias,
con lo que aparecer el mensaje. Ha desactivado todos losresultados. A menos que solicite Mostrar tablas de
frecuencias, Estadsticos o Grficos, FRECUENCIAS no generar ningn resultado.
Este mensaje se debe a que por defecto el
procedimiento Frecuencias slo
realiza
las tablas de
frecuencia y a menos que se le especifique opciones como
los estadsticos o los grficos, no producir ningn
resultado.
Al
hacer clic en Aceptar se
desactivar
la opcin Mostrar tablas de frecuencia con lo que garantizamos que sean excluidas de los. Para comprobar
que han sido desactivadas las tablas de frecuencia, debemos fijarnos en la casilla de seleccin que aparece al
costado izquierdo de la opcin y notar que haya desaparecido el visto bueno (
).
Ahora que desactivamos las tablas de frecuencias, le pediremos al
procedimiento que nos genere los estadsticos correspondientes a
las medidas de dispersin, medidas de posicin central y las
medidas de distribucin, para lo cual hacemos clic en
el botn Estadsticos. Al aparecer el cuadro de dilogo
seleccionaremos los diferentes parmetros.
De las medidas de posicin no central escogemos nicamente los
Cuartiles (Porcentajes 25, 50 y 75); adicionalmente, en las medidas
de posicin central seleccionamos la Media, la Mediana y laModa;
a su vez, en las medidas de distribucin seleccionamos la Asimetra y la Curtosis y por ltimo en las medidas
de dispersin activamos la Desviacin tpica, la Varianza, la Amplitud, el Mximo, elMnimo y el error tpico
de la media.
Debemos recordar que para poder establecer si una medida ha sido activada, debe aparecer en la casilla de
seleccin ubicada al costado izquierdo de la medida un visto bueno (
). Despus
deseleccionar correctamente cada una de las opciones hacemos clic en el botn Continuar con lo que
volvemos al cuadro de dilogo principal.
Una vez especificados los estadsticos debemos definir el tipo de grfico
que deseamos obtener, para lo que hacemos clic en el botn Grficos, de
tal manera que aparece el cuadro de dilogo correspondiente a Frecuencia:
Grficos
En este cuadro seleccionaremos la opcin Histogramas y seguido
activamos la opcin Con curva normal, para que le sea sobrepuesta una
curva normal a la representacin grfica de los datos. Una vez
seleccionadas las opciones hacemos clic en Continuar con lo que
volveremos al cuadro de dilogo principal del procedimiento Frecuencias.
En la siguiente leccion continuaremos definiendo las opciones del
procedimiento y veremos losresultados del procedimiento Frecuencias en variables de Escala.
Resultados - Frecuencias con variables de Escala
Por ltimo activamos el botn Formato con lo que aparece el cuadro de dilogo correspondiente Note como
las opciones de la seccin Ordenar por no se encuentran activas, esto se debe a que estas opciones slo son
aplicables a las tablas de frecuencia. Si nos fijamos en la seccin Mltiples variables, notaremos que sus dos

13

opciones
se
encuentran
disponibles;
si
eligiramos
la opcin Organizar resultados segn
variables,
el
programa generara una tabla de estadsticos y un histograma para
cada una de las variables.
Por el momento reuniremos todos los estadsticos en una sola tabla
por lo que mantendremos laopcin por defecto del programa
(Compara
variables).
Para
proseguir
hacemos clic en Continuar,volviendo al cuadro de dilogo
principal. Despus de definir todas las propiedades del
procedimiento, hacemos clic en Aceptar con lo que se realizarn
los clculos y los efectos son expuestos en el visor de resultados de
SPSS.
Si nos fijamos en los resultados, notaremos que las tablas de
frecuencias no fueron incluidas, adems los estadsticos de las dos
variables son expuestos en la misma tabla y se realiza un
histograma por cada una de las variables e incluyen una curva de
normalidad sobre puesta.
Si nos fijamos en la tabla de estadsticos [Fig.5-29], notaremos que aparece en la parte superior de la tabla una
pequea descripcin de los valores validos y perdidos de cada una de las variables seleccionadas (Edad del
encuestado y Aos estudiados). Al observar el valor correspondiente a la variable Aos estudiados, notamos
que aparecen 296 valores validos y 4 perdidos. Despus de la informacin de las variables, aparecen todos los
estadsticos que le pedimos al procedimiento.
Para facilitar la interpretacin, hemos resaltado en la tabla las diferentes medidas tratando de agruparlas de
acuerdo a sus caractersticas. Por defecto el programa ubica a continuacin del resumen de los datos, las
medidas de tendencia central (Media, Mediana y Moda); adems, incluye el Error tpico de la media.
Si nos fijamos en las medidas de distribucin (Asimetra y Curtosis), notaremos que el programa por defecto
adiciona los Errores tpicos de estas medidas. El Error tpico es una disposicin de ajuste, la cual nos informa
que estas medidas pueden variar entre el rango de ms o menos el error tpico ((Asimetra = -.179 .141); es
decir, la asimetra va desde -.320 hasta -.038). Entre mayor sea elvalor de error, mayor ser la variacin de los
datos. De igual manera, se puede emplear el valor del error tpico con la Curtosis y la Media.
Si ahora nos fijamos en los grficos [Fig.5-30], notaremos que cada uno de ellos cuentan con las mismas
caractersticas de los grficos de barras utilizados en las variables categricas; es decir, las frecuencias se
ubican en el eje vertical (Eje Y) y los rangos en el eje horizontal (Eje X). Adems, este tipo de grficos
incluye otros datos como la Media,
la Desviacin
tpica y
el
nmero
de respuestasvalidas quien es representado
por la letra ene (N); as mismo se incluye
una curva normal para identificar la
distribucin de los datos.
Estas grficas son particularmente tiles ya
que con ellas podemos saber si los datos se
agrupan en un punto especfico o si por el
contrario su agrupacin no es constante, por lo cual se suelen presentar una elevado nmero de rangos.
Debemos recordar que los histogramas son un apoyo visual a los resultados matemticos y que su funcin
es generar una idea visual del comportamiento de los datos.
A pesar que los resultados obtenidos mediante el procedimiento Frecuencias son bastante claros y tiles,
SPSS cuenta con otro procedimiento mucho ms eficiente para el anlisis descriptivo de los datos en las
variables de escala, cuyos resultados son ms precisos. Este procedimiento es definido bajo el nombre
de Descriptivos y su aplicacin esta restringida al uso exclusivo de las variables deEscala.
Procedimiento Descriptivos de SPSS
El procedimiento Descriptivos muestra estadsticos de resumen univariados para varias variables en una
nicatabla y a su vez, clcula valores tipificados (puntuaciones z). Las variables se pueden ordenar por el
tamao de sus medias (en orden ascendente o descendente), alfabticamente o por el orden en el que se
seleccionen las variables (el valor por defecto).
Cuando se guardan las puntuaciones z, stas se aaden a los datos del Editor de datos y quedan disponibles
para los grficos, el listado de los datos y los procedimientos anlisis. Cuando las variables se registran
en unidadesdiferentes (por ejemplo, producto interior bruto per cpita y porcentaje de alfabetizacin), una
transformacin de puntuacin z pondr las variables en una escala comn para poder compararlas visualmente
con ms facilidad. Desde luego, estos parmetros (Puntuaciones z), son tiles nicamente en el anlisis de
inferencia de la informacin.
Para comprender los
alcances
del procedimiento Descriptivos, vamos a generar un
ejemplo con las variables Edad del encuestado
(Edad) y Aos estudiados (Educaos). Para activar
el procedimientodebemos ir al men Analizar..
Estadsticos
descriptivos y seleccionar la
opcin Descriptivos, al hacer clic sobre ella aparece
el cuadro de dilogo Este cuadro tiene una gran semejanza con el empleado en el procedimiento frecuencias,
con la diferencia que solo cuenta con un botn de opcin y adems nos ofrece la posibilidad de guardar los
valores tipificados como variables para lo cual crea y guarda una variable de puntuaciones-z para cada
variable seleccionada. Se crean nuevos nombres de variable anteponiendo la letra z a los primeros

14

siete caracteres del nombre original de la variable,


por el momento no profundizaremos en este tema ya
que su aplicacin esta definida para el anlisis
inferencial de los datos.
Al igual que en la mayora de los cuadros de dilogo
de los diferentes procedimientos del paquete, lo
primero que debemos hacer es ubicar las variables de
inters en el listado de variables y posteriormente llevarlas hasta la casilla de seleccin. Una vez definidas las
variables hacemos clic en el botn Opciones con lo que aparecer el cuadro de dilogo correspondiente
En este cuadro encontraremos todas las medidas del procedimiento, as como tambin las opciones de orden.
Por defecto el programa mantiene seleccionadas las opciones Media, Desviacin tpica, Mnimo y Mximo,
as como el orden de visualizacin de acuerdo a la lista de variables. Para el ejemplo utilizaremos estas
medidas pero adems le solicitaremos la varianza, la amplitud, el error tpico de la media, la Curtosis y la
asimetra, de manera que el cuadro se vea como la
Una vez seleccionadas las opciones hacemos clic en el botn Continuar con lo que volveremos al cuadro de
dilogo principal. Para finalizar hacemos clic en el botn Aceptar con lo que se realizan los clculos de las
medidas y las conclusiones son expuestas en el visor de resultados de SPSS .Por defecto, el programa genera
una sola tabla en la que incluye los resultados de todas las
variables seleccionadas. Si nos fijamos en los resultados
notaremos que la tabla se extiende en forma horizontal
debido a que ahora las variables se ubican en las filas y
los estadsticos en las columnas, lo cual nos impide
observarla en su totalidad, para poder tener una mejor
comprensin de los resultados, en la siguiente leccion
vamos a cambiar el eje en el que se encuentran cada uno
de los factores, es decir vamos a ubicar las variables en el
eje vertical y los estadsticos en el eje horizontal, con lo
que podremos mejorar la percepcin de los resultados.

RESULTADOS PROCEDIMIENTO DESCRIPTIVOS DE SPSS


Dado que los resultados de la tabla no se pueden apreciar fcilmente, vamos a emplear las propiedades
interactivas de los resultados de SPSS para modificar su forma, con el fin de aclarar su interpretacin. Para
realizarlo, debemos activar primero la tabla haciendo doble clic sobre ella, de modo que aparezca a su
alrededor un marco de lneas entrecortadas y a su vez, se presente la barra de herramientas de formato [Fig.536]. Una vez surge la barra de herramientas, hacemosclic en el botn Controles de pivote ( ), ubicado al
costado izquierdo de barra.

Si por algn motivo no aparece la barra de herramienta, SPSS nos ofrece la posibilidad de abrir los controles
de pivoteado a travs del men desplegable. Para realizarlo, basta con hacer clic derecho sobre la tabla, con lo
que surgir el men Una vez se activa el men, ubicamos en l
laopcin Paneles
de
pivoteado y
sucesivamente
hacemos clic sobre ella, de modo que emerja el cuadro de
pivoteado. Por defecto el programa ubica las variables en la
dimensin de las Filas, mientras que los Estadsticos y el Tipo de
estadstico lo ubica en la dimensin de las Columnas. El
parmetro tipo de estadstico hace referencia si se trata del
estadstico o por el contrario se trata de su correccin (Error
tpico).
Si ubicamos el puntero del ratn sobre cualquiera de los iconos, aparecer una pequea leyenda informativa
sobre el parmetro al que representa. Continuando con el ejemplo, intercambiaremos en el panel de pivotado
los parmetros que se encuentran en las Filas con los que se encuentran en las Columnas. Para lograrlo,
debemos hacer clic sobre los iconos representativos de cada parmetro (
) y mantenindolo oprimido lo
arrastramos hasta ubicarlo en el eje deseado, en donde
soltamos el clicde manera que el icono se incrusta de
forma fija en la nueva coordenada. Este proceso se debe
realizar con cada uno de los parmetros de la tabla, que
para este ejemplo corresponden en las columnas
(Estadsticos y tipo estadstico) y en fila (Variables)
Es de gran importancia mantener el orden estricto de las
variables ya que de lo contrario obtendremos un formato
de tabla distinto; para evitar este inconveniente es
necesario ubicar el parmetro Estadstico antes que el parmetro Tipo de estadstico. Estos temas sern
explorados a profundidad en el captulo 8, por lo que no haremos una explicacin ms amplia de los
elementos. Una vez realizado el cambio de coordenadas para cada uno de los parmetros, obtendremos como
resultado la tabla ordenada en forma vertical, con las variables en las Columnas y los estadsticos en las Filas.
Para finalizar el pivotado basta con hacer clic en la parte externa de la tabla.

15

Si nos fijamos en la tabla observaremos que los resultados son


muy
similares
a
los
obtenidos
con
el
procedimiento Frecuencias, con la diferencia que a travs del
procedimiento Descriptivos se incluyen de forma automtica
para todas las medidas los errores tpicos (s existen). Si
observamos las etiquetas de las columnas, notaremos que
aparece cada una de las variables (Edad del encuestado y Aos
estudiados), pero adems se anexa la columna N
vlido (segn lista), la cual identifica los valores validos para las
dos variables.
Para calcular este valor, el programa exime los valores perdidos de las dos variables, dado que en este caso los
Aos estudiados es la nica variable que cuenta con valores perdidos, el programa slo exime los cuatro
valores perdidos de esta variable. Por otro lado, si observamos las filas notaremos que cada una de las
medidas define una fila y a su vez cada medida incluye el valor del estadstico y el valor del error tpico. Por
ltimo notaremos que este procedimiento no realiza ningn tipo de grfico de forma automtica, lo que nos
implica que si deseamos obtenerlo, es necesario realizarlo mediante los procedimientos grficos con que
cuenta SPSS.
Si por algn motivo llegamos a encontrarnos con un termino estadstico dentro de los resultados que
desconozcamos o sencillamente no recordemos, SPSS nos permite obtener informacin referente a ellos
simplemente haciendo doble clic sobre la tabla de forma que se active el recuadro; una vez activo
hacemos clic derecho sobre el termino que deseamos conocer, de modo que aparezca el men desplegable y
posteriormente seleccionar dentro de el men la opcin Asesor deresultados con lo cual aparecer una nueva
ventana del Tutorial, en donde encontraremos una
leyenda que nos informa su significado Debemos
recordar que este sistema de ayuda esta basado en
ventanas mltiples lo cual nos garantiza que
obtendremos diversa informacin acerca del elemento
deseado. Para poder explorar la mayora de las ventanas
de esta ayuda, debemos emplear los botones que
aparecen al costado inferior derecho; para avanzar de
pgina debemos hacer clic en el botn Siguiente (

); si

por el contrario deseamos devolvernos una pgina, entonces debemos oprimir el botn Anterior (

). A

travs del botn ndice (

) regresaremos a la tabla de contenido del sistema de ayuda y a su vez con el

botn Buscar ( ), podemos ubicar una palabra en los diferentes contenidos de la ayuda.
En conclusin el procedimiento Descriptivos nos permite obtener los estadsticos de resumen para varias
variables de escala, agrupando los resultados en una sola tabla, con la ventaja que nos permite obtener y
guardar los valores tipificados (puntuaciones z), lo cual es de gran utilidad para los anlisis de inferencia. Su
principal desventaja radica en el reducido nmero de estadsticos que podemosseleccionar, as como en la
imposibilidad de generar un grfico con el procedimiento.

BIBLIOGRAFA
Pardo, A. y Ruiz, M. A. (2002). SPSS 11. Gua para el anlisis de datos. Madrid: McGrawHill. ISBN 9788448137502.
Enlaces externos
Pgina Principal SPSS - Pgina de soporte que incluye una base de datos de soluciones
Raynald Levesque's SPSS Tools - Biblioteca de archivos para programadores de SPSS (FAQ, command
syntax; macros; scripts; python)
Archives of SPSSX-L Discussion - SPSS Listserv activa desde 1996. Discusses programming, statistics and
analysis
UCLA ATS Resources to help you learn SPSS - Recursos para aprender SPSS
UCLA ATS Techical Reports - El Reporte 1 compara Stata, SAS y SPSS con R (R es un lenguaje y ambiente
de trabajo para clculo estadstico y graficacin).
Using SPSS For Data Analysis - Tutorial del SPSS elaborado en Harvard
SPSS Developer Central - Soporte para desarrolladores de aplicaciones usando SPSS, incluye materiales y
ejemplos de Pythonprogrammability feature
SPSS Wiki - Un wiki con estadsticos del SPSS
SPSS Log - Un blog donde se responden preguntas del SPSS
SPSS Experts - Perfil de seis expertos en el uso del SPSS en el mundo
comp.soft-sys.stat.spss - SPSS Usenet newsgroup via Google Groups
SPSS Forum - Foro de usuarios del SPSS (Ingls)
GNU PSPP - PSPP es un software libre que se puede utilizar en lugar del SPSS

16