Professional Documents
Culture Documents
TRABAJO DE INVESTIGACIN
SPSS
ANALISIS DESCRIPTIVO
ASIGNATURA: Tecnologa de la Informacin y Comunicacin
DOCENTE:
FECHA:
04 / 0 1 / 16
Contenido
ANALISIS DESCRIPTIVO ........................................................................................................................ 3
1. Media .......................................................................................................................................... 3
2. Mediana ...................................................................................................................................... 4
3. Moda ........................................................................................................................................... 4
Medidas de Dispersin - Varianza y Desviacin .............................................................................. 4
1. Varianza ....................................................................................................................................... 5
2. Desviacin Estndar o Tpica ....................................................................................................... 5
MEDIDAS DE DISTIBUCIN - ASIMETRA Y CURTOSIS ......................................................................... 5
1. Asimetra ..................................................................................................................................... 6
ESCALAS DE MEDIDA ........................................................................................................................... 7
1. Nominal ....................................................................................................................................... 7
2. Ordinal ......................................................................................................................................... 7
3. Intervalo ...................................................................................................................................... 7
4. Razn ........................................................................................................................................... 7
b. Anlisis Descriptivo de Acuerdo al Nivel de Medida ................................................................... 7
B.1. Variables Categricas ............................................................................................................... 7
B.2. Variables de Escala ................................................................................................................... 8
GENERANDO ANLISIS DESCRIPTIVOS CON SPSS ............................................................................... 8
1. Frecuencias.................................................................................................................................. 9
OPCIONES DEL PROCEDIMIENTO FRECUENCIAS ................................................................................. 9
GRFICOS DEL PROCEDIMIENTO FRECUENCIAS - SPSS..................................................................... 10
1. Grfico de Barras ....................................................................................................................... 10
2. Grfico de Sectores ................................................................................................................... 10
FORMATO DEL PROCEDIMIENTO FRECUENCIAS SPSS ...................................................................... 10
FRECUENCIAS PARA VARIABLES CATEGORICAS ................................................................................ 11
RESULTADOS - FRECUENCIAS CON VARIABLES CATEGRICAS ......................................................... 12
FRECUENCIAS PARA VARIABLES DE ESCALA...................................................................................... 13
RESULTADOS PROCEDIMIENTO DESCRIPTIVOS DE SPSS ................................................................... 15
BIBLIOGRAFA .................................................................................................................................... 16
Enlaces externos ............................................................................................................................ 16
ANALISIS DESCRIPTIVO
Una de las principales funciones de la estadstica consiste en la descripcin de los datos; ya sea por medio de
medidas (estimadores), grficos o tablas en las que se puedan apreciar claramente el comportamiento y
las tendencias de la informacin recopilada. SPSS cuenta con una serie de procedimientos para realizar esta
labor, cada uno de los cuales nos ofrece diversas posibilidades y su aplicacin depende de las caractersticas
de la informacin que contenga cada variable.
Antes de iniciar con el anlisis descriptivo de datos a travs de SPSS, es necesario aclarar algunos conceptos
fundamentales de la estadstica, los cuales son de vital importancia para la correcta interpretacin de los
resultados que ofrecen los diferentes procedimientos del paquete.
Debemos recordar que la estadstica es un sistema o mtodo empleado en la recoleccin,
organizacin, anlisis e interpretacin de los datos. Esta ciencia se divide en dos fases; la primera corresponde
a la Estadstica descriptiva, cuya finalidad es agrupar y representar la informacin de forma ordenada, de tal
manera que nos permita identificar rpidamente aspectos caractersticos delcomportamiento de los datos. La
segunda fase corresponde a la Estadstica de Inferencia, la cual busca dar explicacin al comportamiento o
hallar conclusiones de un amplio grupo de individuos, objetos o sucesos a travs del anlisis de una pequea
fraccin de sus componentes (Muestra).
En este captulo nos concentraremos exclusivamente en la Estadstica Descriptiva y los procedimientos que la
componen, como las medidas de tendencia central, medidas de distribucin y las medidas de dispersin.
Antes de conocer cada una de estas medidas es necesario resaltar la diferencia entre Poblacin y Muestra. Se
denomina Poblacin al total de los elementos que componen un conjunto, el cual es el objeto de inters de un
estudio.
Las poblaciones pueden ser finitas o infinitas de acuerdo si se conoce el total de los elementos que la
componen o no. Generalmente es bastante difcil realizar un estudio con el total de la poblacin, ya sea por
que es demasiado grande, requiere demasiado tiempo para su anlisis, los costos son muy elevados, se
desconoce el total de elementos, etc.
Por estas razones se suele sustraer una pequea fraccin de la poblacin para realizar los anlisis; de tal
manera que las conclusiones que se extraigan sobre la fraccin sean aplicables a la poblacin. A esta fraccin
se le denomina Muestra y cada uno de los procedimientos estadsticos presentan algunas variaciones en sus
ecuaciones de acuerdo si los datos representan muestras o poblaciones.
Medidas tendencia central: Media Mediana y Moda
Este tipo de medidas nos permiten identificar y ubicar el punto (valor) alrededor del cual se tienden ha reunir
los datos (Punto central). Estas medidas aplicadas a las caractersticas de las unidades de una muestra se les
denomina estimadores o estadgrafos; mientras queaplicadas a poblaciones se les denomina parmetros o
valores estadsticos de la poblacin. Los principales mtodos utilizados para ubicar el punto central son la
media, la mediana y la moda.
1. Media
Ecuacin 5-1
Cuando los valores representan una poblacin la ecuacin se define como:
Ecuacin 5- 2
Donde (m) representa la media, (N) representa el tamao de la poblacin y (Xi) representa cada uno de los
valores de la poblacin. Ya que en la mayora de los casos se trabajan con muestras de lapoblacin todas
las ecuaciones que se presenten a continuacin sern representativas para las muestras. La media aritmtica
para una muestra esta determinada como
Ecuacin 5-3
Donde (X) representa la Media para la muestra, (n) el tamao de la muestra y (Xi) representa cada uno de los
valores observados. Esta frmula nicamente es aplicable si los datos se encuentran desagrupados; en caso
contrario debemos calcular la media mediante la multiplicacin de los diferentes valores por la frecuencia con
que se encuentren dentro de la informacin; es decir,
Ecuacin 5-4
Donde (Yi) representa el punto medio de cada observacin, (ni) es la frecuencia o nmero de observaciones
en cada clase y (n) es el tamao de la muestra siendo igual a la suma de las frecuencias de cada clase.
Para entender mejor este concepto vamos a suponer que hemos tomado la edad de 5 personas al azar cuyos
resultados fueron (22, 33, 35, 38 y 41). Para facilitar su interpretacin se han generado tres rangos de edad los
cuales se han establecido de 21 a 30 aos, de 31 a 40 aos y de 41 a 50 aos. Si nos fijamos en estos rangos
notaremos que los puntos medios son 25, 35 y 45 respectivamente. Los resultados de la organizacin de estos
datos se representan en la tabla [5-1].
Lo que nos indicara que el promedio de edad de los encuestados es de 35 aos. Si ha estos mismos resultados
le aplicamos la ecuacin para datos desagrupados (Ecuacin 5-3), tomando como referencia cada uno de los
valores individuales, obtendramos que la media es igual a
Lo que nos indicara que el promedio de edad para los datos desagrupados es de 34 aos aproximadamente.
Esta diferencia se debe a que al agrupar los datos se pierde parcialmente la exactitud de los clculos,
principalmente al aumentar el nmero de datos. Para evitar estos inconvenientes, SPSS nos
permite calcular las Medias, como si se trataran de valores desagrupados, aunque tiene algunos
procedimientos para valores agrupados.
Es importante resaltar que existe una gran variedad de medias como la Media geomtrica, la Media
ponderada, la Media cuadrtica, etc. Por el momento slo hacemos nfasis en la media aritmtica ya que es
la ms utilizada, aunque se recomienda a los lectores profundizar en estos temas.
2. Mediana
Con esta medida podemos identificar el valor que se encuentra en el centro de los datos, es decir, nos
permite conocer el valor que se encuentra exactamente en la mitad del conjunto de datos despus que las
observaciones se han ubicado en serie ordenada. Esta medida nos indica que la mitad de los datos se
encuentran por debajo de este valor y la otra mitad por encima del mismo. Para determinar la posicin de la
mediana se utiliza la frmula
Ecuacin 5-5
Para comprender este concepto vamos a suponer que tenemos la serie ordenada de valores (2, 5, 8, 10 y 13),
la posicin de la mediana sera:
Lo que nos indica que el valor de la mediana corresponde a la tercera posicin de la serie, que equivale al
nmero (8). Si por el contrario contamos con un conjunto de datos que contiene un nmero par de
observaciones, es necesario promediar los dos valores medios de la serie. Si en el ejemplo anterior le
anexamos el valor 15, tendramos la serie ordenada (2, 5, 8, 10, 13 y 15) y la posicin de la mediana sera,
Es decir, la posicin tres y medio. Dado que es imposible destacar la posicin tres y medio,
esnecesario promediar los dos valores de la posiciones tercera y cuarta para producir una mediana
equivalente, que para el caso corresponden a (8 + 10)/2 =9. Lo que nos indicara que la mitad de los valores
se encuentra por debajo del valor 9 y la otra mitad se encuentra por encima de este valor.
En conclusin la mediana nos indica el valor que separa los datos en dos fracciones iguales con el cincuenta
porciento de los datos cada una. Para las muestras que cuentan con un nmero impar de observaciones o
datos, la mediana dar como resultado una de las posiciones de la serie ordenada;mientras que para las
muestras con un nmero par de observaciones se debe promediar los valores de las dos posiciones centrales.
3. Moda
La medida modal nos indica el valor que ms veces se repite dentro de los datos; es decir, si tenemos la serie
ordenada (2, 2, 5 y 7), el valor que ms veces se repite es el nmero 2 quien seria la modade los datos. Es
posible que en algunas ocasiones se presente dos valores con la mayor frecuencia, lo cual se
denomina Bimodal o en otros casos ms de dos valores, lo que se conoce comomultimodal.
En conclusin las Medidas de tendencia central, nos permiten identificar los valores msrepresentativos de
los datos, de acuerdo a la manera como se tienden a concentrar. La Media nos indica el promedio de los datos;
es decir, nos informa el valor que obtendra cada uno de los individuos si se distribuyeran los valores en
partes iguales. La Mediana por el contrario nos informa el valor que separa los datos en dos partes iguales,
cada una de las cuales cuenta con el cincuenta porciento de los datos. Por ltimo la Moda nos indica el valor
que ms se repite dentro de los datos.
nos indican cuanto se desvan las observaciones alrededor de su promedio aritmtico (Media). Este tipo de
medidas son parmetros informativos que nos permiten conocer como los valores de los datos se reparten a
travs de eje X, mediante un valor numrico que representa el promedio de dispersin de los datos. Las
medidas de dispersin ms importantes y las msutilizadas son la Varianza y la Desviacin estndar (o
Tpica).
1. Varianza
Esta medida nos permite identificar la diferencia promedio que hay entre cada uno de los valoresrespecto a su
punto central (Media
). Este promedio es calculado, elevando cada una de las diferencias al cuadrado (Con
el fin de eliminar los signos negativos), y calculando su promedio o media; es decir, sumado todos los
cuadrados de las diferencias de cada valor respecto a la media y dividiendo este resultado por el nmero de
observaciones que se tengan. Si la varianza es calculada a una poblacin (Total de componentes de un
conjunto), la ecuacin sera:
Ecuacin 5-6
Donde (
) representa la varianza, (Xi) representa cada uno de los valores, (
) representa la media
poblacional y (N) es el nmero de observaciones tamao de la poblacin. En el caso que estemos trabajando
con una muestra la ecuacin que se debe emplear es:
Ecuacin 5-7
Donde (S2) representa la varianza, (Xi) representa cada uno de los valores, (
) representa la media de la
muestra y (n) es el nmero de observaciones tamao de la muestra. Si nos fijamos en la ecuacin, notaremos
que se le resta uno al tamao de la muestra; esto se hace con el objetivo de aplicar una pequea medida de
correccin a la varianza, intentando hacerla ms representativa para la poblacin. Es necesario resaltar que la
varianza nos da como resultado el promedio de la desviacin, pero este valor se encuentra elevado al
cuadrado.
La varianza sera:
1. Asimetra
Esta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central
(Media aritmtica). La asimetra presenta tres estados diferentes [Fig.5-1], cada uno de los cuales define de
forma concisa como estn distribuidos los datos respecto al eje de asimetra. Se dice que la asimetra es
positiva cuando la mayora de los datos se encuentran por encima del valor de la media aritmtica, la curva
es Simtrica cuando se distribuyen aproximadamente la misma cantidad de valores en ambos lados de la
media y se conoce como asimetra negativa cuando la mayor cantidad de datos se aglomeran en
los valores menores que la media.
ESCALAS DE MEDIDA
Para realizar un correcto anlisis de los datos es fundamental conocer de antemano el tipo de medida de la
variable, ya que para cada una de ellas se utiliza diferentes estadsticos. La clasificacin ms convencional de
las escalas de medida las divide en cuatro grupos denominados Nominal, Ordinal, Intervaloy Razn.
1. Nominal
Son variables numricas cuyos valores representan una categora o identifican un grupo de pertenencia. Este
tipo de variables slo nos permite establecer relaciones de igualdad/desigualdad entre los elementos de la
variable. La asignacin de los valores se realiza en forma aleatoria por lo que NO cuenta con un orden lgico.
Un ejemplo de este tipo de variables es el Gnero ya que nosotros podemos asignarle un valor a los hombres y
otro diferente a las mujeres y por ms machistas o feministas que seamos no podramos establecer que uno es
mayor que el otro.
2. Ordinal
Son variables numricas cuyos valores representan una categora o identifican un grupo de pertenencia
contando con un orden lgico. Este tipo de variables nos permite establecer relaciones de
igualdad/desigualdad y a su vez, podemos identificar si una categora es mayor o menor que otra. Un ejemplo
de variable ordinal es el nivel de educacin, ya que se puede establecer que una persona con ttulo de
Postgrado tiene un nivel de educacin superior al de una persona con ttulo de bachiller. En las variables
ordinales no se puede determinar la distancia entre sus categoras, ya que no es cuantificable o medible.
3. Intervalo
Son variables numricas cuyos valores representan magnitudes y la distancia entre los nmeros de
su escala es igual. Con este tipo de variables podemos realizar comparaciones de igualdad/desigualdad,
establecer un orden dentro de sus valores y medir la distancia existente entre cada valor de la escala. Las
variables de intervalo carecen de un cero absoluto, por lo que operaciones como la multiplicacin y la
divisin no son realizables. Un ejemplo de este tipo de variables es la temperatura, ya que podemos decir que
la distancia entre 10 y 12 grados es la misma que la existente entre 15 y 17 grados. Lo que no podemos
establecer es que una temperatura de 10 grados equivale a la mitad de una temperatura de 20 grados.
4. Razn
Las variables de razn poseen las mismas caractersticas de las variables de intervalo, con la diferencia que
cuentan con un cero absoluto; es decir, el valor cero (0) representa la ausencia total de medida, por lo que se
puede
realizar
cualquier
operacin Aritmtica (Suma,
Resta,
Multiplicacin
y
Divisin)
y Lgica (Comparacin y ordenamiento). Este tipo de variables permiten el nivel ms alto de medicin. Las
variables altura, peso, distancia o el salario, son algunos ejemplos de este tipo deescala de medida.
Debido a la similitud existente entre las escalas de intervalo y de razn, SPSS las ha reunido en un nuevo tipo
de medida exclusivo del programa, al cual denomina Escala. Las variables de escala son para SPSS todas
aquellas variables cuyos valores representan magnitudes, ya sea que cuenten con un cero (0) absoluto o no.
Teniendo esto en cuenta discutiremos a continuacin los diferentes procedimientos estadsticos que se pueden
utilizar de acuerdo al tipo de medida de cada variable.
Si nos fijamos en la tabla 5-2, notaremos que los niveles Nominal y Ordinal cuentan con los mismos
procedimientos de anlisis, por lo que se agrupan como variables categricas. A partir de este punto cuando
nos refiramos a las variables categricas debemos recordar que se alude a las variables de
tipo Nominal y Ordinal.
Es importante resaltar que para los anlisis descriptivos no hay una gran diferencia entre estos dostipos
de variables, pero si existe diferencia en los anlisis de Inferencia. Antes de conocer como se efectan estos
procedimientos en SPSS, es necesario exponer las razones por las que ciertos procedimientos no son de
utilidad en algunos de los niveles de medida.
Para comprender mejor la razn de estos procedimientos vamos a realizar el anlisis de la variable Gnero, la
cual cuenta con los valores (1, 1, 1, 1, 1, 1, 1, 1, 2, 2); en donde el valor uno (1) representa al gnero
Femenino y el valor Dos (2) al gnero Masculino. Las frecuencias y sus respectivos porcentajes para esta
variable seran los expuestos en la tabla [5-3]. Ahora si hallamos las principales medidas de tendencia central,
obtenemos los resultados expuestos en la tabla [5-4].
Si nos fijamos en
los
resultados
notaremos que la
Media toma el
valor 1.2, el cual
nos indica que en promedio los encuestados cuenta con un gnero de (1.2). Este resultado no posee una
interpretacin aplicable a la informacin de la variable, por lo que esta medida no es de utilidad en el anlisis
descriptivo.
Si observamos la Mediana notaremos que toma el valor 1, que para el caso corresponde al gnero Femenino,
pero si en vez de 10 valores tuviramos nicamente dos (1 y 2), la mediana sera de (1.5), cuya interpretacin
no es aplicable a la informacin de la variable. La mediana se puede utilizar cuando estamos trabajando con
variables que contienen un elevado nmero de categoras y su interpretacin se debe manejar como un factor
informativo para el investigador y no como una medida representativa en el reporte.
Por ltimo encontramos la Moda, la cual para el caso asume el
valor 1 y nos indica que la categoracon mayor frecuencia dentro de
la variable es la correspondiente al gnero Femenino. Las medidas
de dispersin y distribucin no son aplicables a este tipo de
variables ya que sus ecuaciones nos permiten determinar como se
comportan los datos respecto a un punto central o media. Si
hallamos la desviacin estndar para los datos del ejemplo,
obtendramos un valor de 0.42164, que nos indicara que el
promedio del gnero presenta una variacin de 0.42, cuyo
resultado no sera aplicable a la interpretacin de la variable.
y su utilizacin depende del criterio del investigador y las necesidades del anlisis. A continuacin haremos
un recorrido por los procedimientos principales del submen Estadsticos descriptivos, tratando de explorar la
mayora de sus componentes.
1. Frecuencias
Este procedimiento nos permite analizar de forma descriptiva las variables Categricas o de Escala, mediante
la generacin de tablas de frecuencia, Grficos y una amplia gama de estadsticos como las medidas de
tendencia central, de Dispersin y de Distribucin. Adems nos permite organizar losresultados de forma
ascendente o descendente ya sea por sus valores o sus frecuencias.
Para emplear este procedimiento es necesario ir al men Analizar, seleccionar el submenEstadsticos
descriptivos y escoger dentro de l la opcin Frecuencias, con lo que aparecer el cuadro de dilogo
correspondiente. Este cuadro de dilogo se divide en cuatro secciones correspondientes a la lista de variables,
la casilla de seleccin, las opciones de anlisis y mostrar tablas de frecuencias. Como podemos apreciar las
dos primeras secciones son comunes para la mayora de los cuadros de dilogo de SPSS por lo que no
haremos una explicacin de ellos, en cambio nos enfocaremos en las dos secciones restantes.
Dentro de las opciones de anlisis encontraremos todos los estadsticos, los grficos y las posibilidades de
orden con que cuenta el procedimiento Frecuencias. Para escoger alguna de las opciones basta con
hacer clic sobre ella, con lo que aparecer el cuadro de dilogo correspondiente a la opcin seleccionada.
En la siguiente leccin veremos detalladamente cada una de las partes del procedimiento Frecuencias.
La segunda opcin del procedimiento frecuencias corresponde a Grficos. Al hacer clic sobre el botn
grficos, aparece el cuadro de dilogo correspondiente a Frecuencias: Grficos. En este cuadro encontramos
los tres diferentes tipos de grficos con que cuenta el procedimiento, como los son el grfico de barras, el
grfico de sectores y el histograma. Adems, a travs de este cuadro podemos escoger si las porciones de los
grficos representan un recuento de los casos (Frecuencias) el porcentaje al que equivale.
Por defecto el programa tiene activada la opcin Ninguno. La seccin valores del grfico slo se activa
cuando se selecciona uno de los grficos de barras o de sectores y a su vez la casilla decurva normal slo se
activa cuando se selecciona el Histograma [Fig.5-8]. Para comprender, la esencia de cada uno de estos
mtodos de representacin grfica, en la siguiente leccin vamos a realizar una pequea explicacin de sus
elementos y usos.
2. Grfico de Sectores
Los grficos de sectores o de torta nos permiten observar la variable de
forma global haciendo una comparacin inmediata del porcentaje o la
frecuencia del total de las categoras de una variable. Su utilidad radica en
la facilidad para interpretar la informacin contenida en una variable
mediante la representacin grafica de los resmenes (Porcentajes o
Frecuencias).
La estructura bsica de los grficos de sectores [Fig.5-11],
esta definida por un crculo en el cual se representan cada
una de las categoras por la porcin o fraccin
correspondiente al porcentaje o la frecuencia. En algunas
ocasiones suelen separarse las fracciones, con el fin de
hacer ms clara la informacin.
3. Histograma
Los histogramas nos permiten identificar diversos parmetros como la dispersin, la distribucin y la
concentracin de los datos en una variable de Escala. Este tipo de grficos generan una representacin visual
del comportamiento de los datos, permitiendo observar rasgos caractersticos como la zona o rango de mayor
concentracin, la amplitud, los valores extremos, etc.
La estructura bsica de un histograma , esta basada en rangos, los cuales suelen ser representados
por barras cuya altura es determinada por la cantidad de valores que se encuentren dentro de los lmites de
cada rango (Frecuencia). Generalmente se utiliza el Eje vertical para representar las frecuencias y el
Eje horizontal para los rangos; adicionalmente se puede sobreponer una Curva Normal con el fin de comparar
si los datos tienden a distribuirse de forma uniforme.
En resumen cuando se trabaja con variables categricas (Nominal u
Ordinal),
los grficos msindicados
y
representativos
en
su anlisis descriptivo corresponden a los grficos de Barras y los
deSectores; por el contrario si se trata de una variable de Escala el
grfico ms apropiado es elHistograma.
Dado que por el momento slo estamos haciendo un recorrido por las
opciones del procedimientoFrecuencias, no seleccionaremos ninguno de los grficos y en cambio
hacemos clic en el botnCancelar, con lo cual volvemos al cuadro de dilogo principal del procedimiento. En
la siguienteleccion conoceremos la ultima opcion del procedimiento Frecuencias denominada Formato.
10
A travs de la seccin Ordenar por, podemos organizar los resultados del procedimiento (Tablas y Grficos)
por los valores por las frecuencias, ya sea de forma ascendente o descendente. Cuando seleccionamos
la opcin Valores, los resultados se organizaran de acuerdo al nmero que se le hayaasignado a cada categora
dentro de las propiedades de variable; si por el contrario escogemos laopcin frecuencias los resultados se
ordenaran de acuerdo al nmero de apariciones de cada una de las categoras de las variables seleccionadas.
La segunda seccin del cuadro corresponde a Mltiples variables; en donde encontramos las
opciones Compara variables y Organizar resultados segn variables. Si seleccionamos la primeraopcin,
los resultados se agruparn de acuerdo con las variables; es decir, primero nos ensearan las tablas de
frecuencia de todas las variables (Una tabla por cada variable), despus organiza los estadsticos de cada
variable y por ltimo nos ensea los grficos.
En resumen esta opcin nos permite agrupar los resultados de todas las variables por cada uno de los
procedimientos (Frecuencias, Estadsticos y Grficos). Si por el contrario seleccionamos
laopcin Organizar resultados segn variables, el programa nos ensea todos los resultados de cada variable
antes de mostrar los resultados de la siguiente; es decir, nos ensea la tabla de frecuencias, los estadsticos y el
grfico de la primera variable, a continuacin nos ensea los resultados de la segunda y as sucesivamente
hasta terminar con cada una de las variables seleccionadas.
La ltima seccin que encontramos en el cuadro, pertenece a la opcin Suprimir tablas con ms de n
categoras, con la cual podemos pedirle al paquete que no realice las tablas de frecuencia a las variables qu
cuenten con cierto nmero de categoras, dndonos la oportunidad de especificar el limite de categoras que
deseamos introduciendo el valor en la casilla Nmero mximo de categoras. Para continuar con el recorrido
no seleccionaremos ninguna de las opciones y en su lugar hacemosclic en el botn Cancelar con lo que
volveremos al cuadro de dilogo principal del procedimientoFrecuencias.
Por ltimo, aparece la seccin corresponde a la opcin Mostrar tablas de frecuencias , la cual nos permite
escoger si deseamos que las tablas de frecuencia se incluyan en los resultados o por el contrario sean omitidas.
Esta opcin se desactiva cuando queremos realizar anlisis descriptivos a las variables de escala, ya que por lo
general sus tablas de frecuencia suelen contener un gran nmero de valores hacindolas extensas y poco
tiles.
Desde luego es apenas logico que una tabla que nos informa que dentro de los encuestados aparecen 20 con
18 aos de edad, 32 con 19 aos de edad y as sucesivamente hasta llegar al valor mximo, no es de gran
utilidad. Para facilitar la interpretacin de este tipo de informacin es mejor crear una nueva variable y
codificar estas edades dentro de rangos y sucesivamente
realizar la tablade frecuencias a esta nueva variable de edad
categorizada.
Para comprender todos los conceptos y elementos que
componen el procedimiento frecuencias, en las siguientes
lecciones vamos a realizar a manera de ejemplo el anlisis
de
las
variables
categricas
estado
civil
(estciv variable Nominal)
y
Nivel
de
educacin
(niveduc variable Ordinal) y posteriormente realizaremos el
anlisis de las variables de escala Edad del encuestado
(Edad) y Aos de educacin (educ).
11
12
frecuencias de cada categora y la representacin grfica de los datos, la cual puede ser expresada ya sea
mediante un grfico de barras o de sectores.
Adems es necesario aclarar que los procedimientos que se especifiquen, se realizarn con todas las variables
que se hallan seleccionado, sin importar el tipo al que corresponda, por lo que es recomendable realizar
primero los anlisis a las variables categricas y posteriormente a las deescala. En la siguiente leccion
haremos un ejemplo del procedimiento Frecuencias con Variables deEscala.
13
opciones
se
encuentran
disponibles;
si
eligiramos
la opcin Organizar resultados segn
variables,
el
programa generara una tabla de estadsticos y un histograma para
cada una de las variables.
Por el momento reuniremos todos los estadsticos en una sola tabla
por lo que mantendremos laopcin por defecto del programa
(Compara
variables).
Para
proseguir
hacemos clic en Continuar,volviendo al cuadro de dilogo
principal. Despus de definir todas las propiedades del
procedimiento, hacemos clic en Aceptar con lo que se realizarn
los clculos y los efectos son expuestos en el visor de resultados de
SPSS.
Si nos fijamos en los resultados, notaremos que las tablas de
frecuencias no fueron incluidas, adems los estadsticos de las dos
variables son expuestos en la misma tabla y se realiza un
histograma por cada una de las variables e incluyen una curva de
normalidad sobre puesta.
Si nos fijamos en la tabla de estadsticos [Fig.5-29], notaremos que aparece en la parte superior de la tabla una
pequea descripcin de los valores validos y perdidos de cada una de las variables seleccionadas (Edad del
encuestado y Aos estudiados). Al observar el valor correspondiente a la variable Aos estudiados, notamos
que aparecen 296 valores validos y 4 perdidos. Despus de la informacin de las variables, aparecen todos los
estadsticos que le pedimos al procedimiento.
Para facilitar la interpretacin, hemos resaltado en la tabla las diferentes medidas tratando de agruparlas de
acuerdo a sus caractersticas. Por defecto el programa ubica a continuacin del resumen de los datos, las
medidas de tendencia central (Media, Mediana y Moda); adems, incluye el Error tpico de la media.
Si nos fijamos en las medidas de distribucin (Asimetra y Curtosis), notaremos que el programa por defecto
adiciona los Errores tpicos de estas medidas. El Error tpico es una disposicin de ajuste, la cual nos informa
que estas medidas pueden variar entre el rango de ms o menos el error tpico ((Asimetra = -.179 .141); es
decir, la asimetra va desde -.320 hasta -.038). Entre mayor sea elvalor de error, mayor ser la variacin de los
datos. De igual manera, se puede emplear el valor del error tpico con la Curtosis y la Media.
Si ahora nos fijamos en los grficos [Fig.5-30], notaremos que cada uno de ellos cuentan con las mismas
caractersticas de los grficos de barras utilizados en las variables categricas; es decir, las frecuencias se
ubican en el eje vertical (Eje Y) y los rangos en el eje horizontal (Eje X). Adems, este tipo de grficos
incluye otros datos como la Media,
la Desviacin
tpica y
el
nmero
de respuestasvalidas quien es representado
por la letra ene (N); as mismo se incluye
una curva normal para identificar la
distribucin de los datos.
Estas grficas son particularmente tiles ya
que con ellas podemos saber si los datos se
agrupan en un punto especfico o si por el
contrario su agrupacin no es constante, por lo cual se suelen presentar una elevado nmero de rangos.
Debemos recordar que los histogramas son un apoyo visual a los resultados matemticos y que su funcin
es generar una idea visual del comportamiento de los datos.
A pesar que los resultados obtenidos mediante el procedimiento Frecuencias son bastante claros y tiles,
SPSS cuenta con otro procedimiento mucho ms eficiente para el anlisis descriptivo de los datos en las
variables de escala, cuyos resultados son ms precisos. Este procedimiento es definido bajo el nombre
de Descriptivos y su aplicacin esta restringida al uso exclusivo de las variables deEscala.
Procedimiento Descriptivos de SPSS
El procedimiento Descriptivos muestra estadsticos de resumen univariados para varias variables en una
nicatabla y a su vez, clcula valores tipificados (puntuaciones z). Las variables se pueden ordenar por el
tamao de sus medias (en orden ascendente o descendente), alfabticamente o por el orden en el que se
seleccionen las variables (el valor por defecto).
Cuando se guardan las puntuaciones z, stas se aaden a los datos del Editor de datos y quedan disponibles
para los grficos, el listado de los datos y los procedimientos anlisis. Cuando las variables se registran
en unidadesdiferentes (por ejemplo, producto interior bruto per cpita y porcentaje de alfabetizacin), una
transformacin de puntuacin z pondr las variables en una escala comn para poder compararlas visualmente
con ms facilidad. Desde luego, estos parmetros (Puntuaciones z), son tiles nicamente en el anlisis de
inferencia de la informacin.
Para comprender los
alcances
del procedimiento Descriptivos, vamos a generar un
ejemplo con las variables Edad del encuestado
(Edad) y Aos estudiados (Educaos). Para activar
el procedimientodebemos ir al men Analizar..
Estadsticos
descriptivos y seleccionar la
opcin Descriptivos, al hacer clic sobre ella aparece
el cuadro de dilogo Este cuadro tiene una gran semejanza con el empleado en el procedimiento frecuencias,
con la diferencia que solo cuenta con un botn de opcin y adems nos ofrece la posibilidad de guardar los
valores tipificados como variables para lo cual crea y guarda una variable de puntuaciones-z para cada
variable seleccionada. Se crean nuevos nombres de variable anteponiendo la letra z a los primeros
14
Si por algn motivo no aparece la barra de herramienta, SPSS nos ofrece la posibilidad de abrir los controles
de pivoteado a travs del men desplegable. Para realizarlo, basta con hacer clic derecho sobre la tabla, con lo
que surgir el men Una vez se activa el men, ubicamos en l
laopcin Paneles
de
pivoteado y
sucesivamente
hacemos clic sobre ella, de modo que emerja el cuadro de
pivoteado. Por defecto el programa ubica las variables en la
dimensin de las Filas, mientras que los Estadsticos y el Tipo de
estadstico lo ubica en la dimensin de las Columnas. El
parmetro tipo de estadstico hace referencia si se trata del
estadstico o por el contrario se trata de su correccin (Error
tpico).
Si ubicamos el puntero del ratn sobre cualquiera de los iconos, aparecer una pequea leyenda informativa
sobre el parmetro al que representa. Continuando con el ejemplo, intercambiaremos en el panel de pivotado
los parmetros que se encuentran en las Filas con los que se encuentran en las Columnas. Para lograrlo,
debemos hacer clic sobre los iconos representativos de cada parmetro (
) y mantenindolo oprimido lo
arrastramos hasta ubicarlo en el eje deseado, en donde
soltamos el clicde manera que el icono se incrusta de
forma fija en la nueva coordenada. Este proceso se debe
realizar con cada uno de los parmetros de la tabla, que
para este ejemplo corresponden en las columnas
(Estadsticos y tipo estadstico) y en fila (Variables)
Es de gran importancia mantener el orden estricto de las
variables ya que de lo contrario obtendremos un formato
de tabla distinto; para evitar este inconveniente es
necesario ubicar el parmetro Estadstico antes que el parmetro Tipo de estadstico. Estos temas sern
explorados a profundidad en el captulo 8, por lo que no haremos una explicacin ms amplia de los
elementos. Una vez realizado el cambio de coordenadas para cada uno de los parmetros, obtendremos como
resultado la tabla ordenada en forma vertical, con las variables en las Columnas y los estadsticos en las Filas.
Para finalizar el pivotado basta con hacer clic en la parte externa de la tabla.
15
); si
por el contrario deseamos devolvernos una pgina, entonces debemos oprimir el botn Anterior (
). A
botn Buscar ( ), podemos ubicar una palabra en los diferentes contenidos de la ayuda.
En conclusin el procedimiento Descriptivos nos permite obtener los estadsticos de resumen para varias
variables de escala, agrupando los resultados en una sola tabla, con la ventaja que nos permite obtener y
guardar los valores tipificados (puntuaciones z), lo cual es de gran utilidad para los anlisis de inferencia. Su
principal desventaja radica en el reducido nmero de estadsticos que podemosseleccionar, as como en la
imposibilidad de generar un grfico con el procedimiento.
BIBLIOGRAFA
Pardo, A. y Ruiz, M. A. (2002). SPSS 11. Gua para el anlisis de datos. Madrid: McGrawHill. ISBN 9788448137502.
Enlaces externos
Pgina Principal SPSS - Pgina de soporte que incluye una base de datos de soluciones
Raynald Levesque's SPSS Tools - Biblioteca de archivos para programadores de SPSS (FAQ, command
syntax; macros; scripts; python)
Archives of SPSSX-L Discussion - SPSS Listserv activa desde 1996. Discusses programming, statistics and
analysis
UCLA ATS Resources to help you learn SPSS - Recursos para aprender SPSS
UCLA ATS Techical Reports - El Reporte 1 compara Stata, SAS y SPSS con R (R es un lenguaje y ambiente
de trabajo para clculo estadstico y graficacin).
Using SPSS For Data Analysis - Tutorial del SPSS elaborado en Harvard
SPSS Developer Central - Soporte para desarrolladores de aplicaciones usando SPSS, incluye materiales y
ejemplos de Pythonprogrammability feature
SPSS Wiki - Un wiki con estadsticos del SPSS
SPSS Log - Un blog donde se responden preguntas del SPSS
SPSS Experts - Perfil de seis expertos en el uso del SPSS en el mundo
comp.soft-sys.stat.spss - SPSS Usenet newsgroup via Google Groups
SPSS Forum - Foro de usuarios del SPSS (Ingls)
GNU PSPP - PSPP es un software libre que se puede utilizar en lugar del SPSS
16