You are on page 1of 12

1. DISTRIBUCIONES UNIDIMENSIONALES: INTRODUCCIN Todo anlisis estadstico se inicia con una primera fase descriptiva de los datos.

sta tiene por objeto sintetizar la informacin mediante la elaboracin de tablas de frecuencias, representaciones grficas y el clculo de medidas estadsticas (o estadsticos). Estos procedimientos descriptivos dependen de la naturaleza de la variable o atributo que se analiza y, en este sentido, el programa SPSS los recoge en dos mens diferentes segn se empleen, bsicamente, para sintetizar datos cualitativos o datos cuantitativos. As mismo, el programa diferencia entre los procedimientos descriptivos que hacen referencia al anlisis de una sola variable (anlisis unidimensional) de los relativos a dos o ms variables conjuntamente (anlisis bidimensional o multidimensional).

DISTRIBUCIONES DE FRECUENCIAS Las distribuciones o tablas de frecuencias permiten resumir los datos en una tabla que recoge: Valores de la variable o modalidades del atributo, frecuencia absoluta o nmero de veces que aparece cada valor o modalidad en la muestra, porcentaje de veces que aparece cada valor de la variable o modalidad del atributo sobre el total de observaciones, porcentaje vlido calculado sobre el total de observaciones excluidos los valores missing, porcentaje acumulado hasta cada uno de los valores de la variable ordenados de menor a mayor. Este porcentaje tiene interpretacin slo en los casos en que la variable sea susceptible de medida por lo menos en una escala ordinal.

Para obtener la tabla de frecuencias se procede con el men: Analizar Estadsticos Descriptivos Frecuencias

En el cuadro de dilogo Frecuencias se seleccionan las variables para las que se quiere obtener sus correspondientes tablas de frecuencias unidimensional y se trasladan al cuadro Variables con el botn . Para obtener la distribucin de frecuencias debe estar activada la opcin Mostrar tablas de frecuencias. La tabla que aparece en el visor de resultados no agrupa en intervalos o clases los valores de la variable; si se desea agruparlos es necesario recodificar previamente la variable (en otra variable) definiendo los lmites de los intervalos* Adems, el cuadro de dilogo Frecuencias permite activar otras opciones con los botones: Estadsticos Grficos Formato Estas opciones pueden utilizarse teniendo o no activada la opcin Mostrar tablas de frecuencias.

ESTADSTICOS La opcin Estadsticos abre un cuadro de dilogo que permite la obtencin de las principales medidas de sntesis o estadsticos de una distribucin unidimensional de frecuencias. stos se presentan agrupados en cuatro clases: Valores percentiles, Tendencia central, Dispersin y Distribucin.

Valores percentiles son aquellos valores de la variable que dividen a la distribucin de frecuencias en partes con igual nmero de observaciones: as, los cuartiles la dividen en cuatro partes guales y se obtienen directamente activando la opcin Cuartiles. Si interesan los valores que dividen la distribucin en k partes iguales se activa la opcin Puntos de corte para (por defecto 10) grupos iguales, lo que proporciona los deciles de la distribucin. En la opcin Percentiles es necesario indicar cuales de ellos se desean, incluyndolos de uno en uno con el botn Aadir. Tendencia central permite seleccionar Media, Mediana y Moda de la distribucin, as como la Suma de todos los valores de la distribucin. Dispersin permite seleccionar las siguientes medidas: Varianza, como resultado del clculo de la expresin, y Desviacin tpica; el error tpico de la media (E.T.

media) que se define como , as como los valores Mnimo y Mximo de la variable y la Amplitud o recorrido de la variable. Por ltimo, en Distribucin pueden obtenerse las siguientes medidas relativas a la forma de la distribucin: coeficiente de Asimetra, error tpico de asimetra, coeficiente de Curtosis y error tpico de curtosis, calculadas mediantelas siguientes expresiones:

Asimetra

Error tp. de asimetra

Curtosis

Error tp.de curtosis

GRFICOS Los grficos asociados a la tabla de frecuencias que recoge del cuadro de dilogo Frecuencias son: Grficos de barras, Grficos de sectores o Histogramas. Para seleccionar el que interesa se activa la opcin Grficos que abre el siguiente cuadro de dilogo:

Si la caracterstica objeto de anlisis es un atributo los grficos adecuados son el grfico de barras o de sectores; en ambos casos pueden realizarse con frecuencias absolutas o con relativas seleccionando Frecuencias o Porcentajes, respectivamente. Si la caracterstica es cuantitativa el grfico adecuado es el histograma que, a su vez, puede obtenerse superponindole la Curva de la distribucin normal activando la opcin correspondiente.

FORMATO Para modificar el aspecto de los resultados, ya sean, tablas o estadsticos, se activa la opcin Formato que abre el cuadro de dilogo siguiente:

Con las siguientes opciones:

Ordenar por: se puede elegir entre distintos criterios de ordenacin de los valores de la variable en la tabla de frecuencias. Por defecto, los valores aparecen en orden ascendente; pero tambin es posible una ordenacin descendente o una ordenacin por frecuencias, tanto ascendente como descendente, activando las opciones correspondientes. Mltiples variables: se puede seleccionar el tipo de presentacin de los cuadros de estadsticos cuando se realiza simultneamente el anlisis unidimensional de dos o ms variables. Por defecto, est activada la opcin Comparar variables que proporciona un nico cuadro que contiene los estadsticos seleccionados correspondientes a todas las variables. Si se selecciona la opcin Organizar resultados segn variables se obtiene un cuadro de estadsticos para cada variable por separado.

El cuadro Frecuencias: Formato tambin ofrece la posibilidad de limitar la elaboracin de tablas de frecuencias slo para Aquellas variables que presentan un nmero reducido de valores o categoras. Para ello se debe indicar en el recuadro Suprimir tablas con ms de (por defecto 10) categoras el nmero de categoras a partir del cual no se desea la elaboracin de la tabla.

EJEMPLOS Ejemplo 1. Con la base de datos Enctran.sav obtener la tabla de frecuencias, el diagrama de barras y los estadsticos media, mediana, moda, desviacin tipo, varianza y las medidas de forma (asimetra y curtosis) de las variables: Como, Rapi e Inde. Vamos a realizar la descripcin de la variable Como, dejando al lector la descripcin de las variables Rapi e Inde. Con la secuencia Analizar > Estadsticos Descriptivos > Frecuencias se abre un cuadro de dilogo donde se selecciona la variable Como; con el botn Estadsticos se activan las medidas que se desean obtener y con el botn Grficos se activa la opcin Grficos de barras. Se obtienen los siguientes cuadros:

En base a estos resultados se concluye: - La base de datos no presenta para esta variable ningn valor missing, de forma que las 114 observaciones son todas vlidas.

- Las medidas de posicin (media, mediana y moda) indican el valor central de la distribucin, y en este caso aproximadamente coinciden los tres estadsticos en el valor 5. Esto significa que la distribucin es bastante simtrica y que la valoracin media de la comodidad del medio de transporte no es ni buena ni mala. - La desviacin tpica es 2,52 que sobre una media de 5,1 indica que la dispersin de los datos con respecto a la media es moderada. - El coeficiente de asimetra toma el valor 0,182 que no es significativo ya que presenta un error estndar 0,226 y, por lo tanto, puede considerarse que la distribucin es simtrica. La curtosis de esta variable es -0,126 con un error estndar de 0,449 lo que indica que la distribucin es mesocrtica. - La distribucin de la variable es unimodal, prcticamente simtrica y campaniforme como se observa en el grfico.

Ejemplo 2. Con la misma base de datos Enctran.sav obtener la tabla de frecuencias y el diagrama de barras de la variable Trans.

Entre otros resultados se observa que los porcentajes correspondientes a las tres modalidades de transporte pblico acumulan el 83,3% de los estudiantes y, nicamente, el 12,2% utiliza transporte privado. Al ser una variable cualitativa el nico estadstico representativo de la distribucin es la moda que, en este caso, es la modalidad Metro que representa un 46,5% del total.

Ejemplo 3. Con la base de datos Enctran.sav obtener la tabla de frecuencias y la representacin grfica adecuada para la variable Coste, agrupando los valores en los siguientes intervalos: [0,5000) [5000,10000) [10000,15000) [15000, 20000). Para obtener la tabla con los valores agrupados en intervalos es necesario, en primer lugar, recodificar los valores en una nueva variable. Para ello, se activa la opcin Recodificar > En distintas variables del men Transformar. En el cuadro de dilogo que aparece: Se selecciona la variable Coste.

En Variable de Resultado se indica el nombre elegido para la nueva variable, por ejemplo, 'Coste1'. Se etiqueta la nueva variable, 'Coste recodificado'. Se definen los intervalos activando Valores antiguos y nuevos. Para definir el primer intervalo se activa en Valor antiguo la opcin Rango: Del menor hasta 5000 y se le asigna como Valor nuevo 1; los siguientes intervalos se definen activando Rango lmite inferior hasta lmite superior, asignndoles los valores 2 y 3. El ltimo intervalo se define mediante Rango 15000 hasta el mayor y se le asigna Valor nuevo 4.

Se etiquetan los valores de la variable Coste1. En la ventana Vista de variable o bien con doble clic sobre la variable Coste1, introducimos las etiquetas de los valores. En Valores se indica:
Valor 1 2 3 4 Etiqueta de valor 0-5000 5000-10000 10000-15000 15000-20000

Por ltimo, con Analizar > Estadsticos Descriptivos > Frecuencias se obtiene la tabla de frecuencias y el histograma, que es el adecuado dada la naturaleza continua de la variable.

2. PREGUNTAS DE RESPUESTA MULTIPLE: DICOTOMICAS Cuando por el contrario se trata de preguntas Cerradas, antes de ingresar la informacin se debe crear una variable por cada una de las opciones de respuesta que contenga la encuesta o estudio. Por ejemplo, para la pregunta Cules de las siguientes marcas de automviles conoce o ha escuchado mencionar?, se incluyen nueve (9) posibilidades de respuesta, siendo necesario crear una variable por cada opcin; es decir, nueve (9) variables en total. Para el nombre de cada variable se recomienda incluir una frase comn para todas y distinguirlas con las iniciales de la marca o nombre a la que corresponde; por ejemplo, PGMerce, PGAudi, PGMazda, PGPeug, PGBMW, PGToyota, PGNissan, PGChevro, PGFord. Debemos recordar que los nombres de las variables no deben superar los ocho (8) caracteres (64 para la versin 12.0) y que a su vez no debe comenzar con un nmero. En este tipo de preguntas las respuestas slo toman dos estados o valores (Si o No, Verdadero o Falso, etc); para ingresar las respuestas de cada individuo se debe colocar un Valor Si en cada una de las variables (Opciones) que halla seleccionado el encuestado y un Valor No en las que halla omitido. Despus de ingresar las respuestas de los cinco (5) encuestados obtenemos los resultados de la figura [6-29].

Figura 6-29 Este tipo de preguntas suelen ser denominadas Dicotomas mltiples dado que cada una de las opciones es seleccionada o no por parte del encuestado. Las preguntas cerradas nos ofrecen menor cantidad de informacin, pero a pesar de esto son ms utilizadas debido a que los costos de recoleccin, ordenamiento y anlisis son menores comparados con los de las preguntas abiertas. Desde luego cuando el nmero de opciones es demasiado elevado, es preferible emplear las preguntas abiertas. Una vez se han ingresado todas las respuestas y se han definido todas las propiedades a cada una de las variables, estamos listos para comenzar con el anlisis. Antes de realizar cualquier tipo de clculo con los datos, es necesario definirle al programa los conjuntos de variables que conforman las respuestas de una pregunta. Para comprender el procedimiento que conllevan las variables de repuestas mltiples vamos a emplear el contenido del archivo de datos Multi.sav que se anexa en la carpeta Captulo6 del CD adjunto. Para abrirlo podemos emplear la ruta Archivo... Abrir... Datos, al activarse la ventana de navegacin, ubicamos el archivo en la unidad de CD ROM y posteriormente hacemos clic en Abrir. Despus de abrir el archivo de datos, debemos acceder al procedimiento de respuestas mltiples por lo que nos dirigimos al men Analizar y seleccionar la opcin Respuestas mltiples; al seleccionarlo aparece una sola opcin activa correspondiente a Definir conjuntos, las otras dos opciones (Frecuencias y Tablas de contingencia), se activan nicamente cuando se haya definido con antelacin por lo menos un conjunto de variables.

Al seleccionar la opcin Definir Conjuntos aparece el cuadro de dilogo correspondiente [Fig.6-30]; a travs de este cuadro se definen las propiedades del conjunto de variables que contienen las respuestas de una pregunta Abierta o Cerrada. Este cuadro se divide en cinco secciones entre las que encontramos la lista de variables, la casilla de seleccin, la definicin del tipo de pregunta, las propiedades del conjunto y la casilla de conjuntos.

Figura 6-30 Al igual que en la mayora de procedimientos del programa, en la casilla de seleccin se deben ingresar todas las variables de inters, que para el caso corresponden a las variables que contienen las respuestas de una misma pregunta. Las variables que se introduzcan en esta casilla definirn un conjunto, por lo que es de gran importancia verificar que no se agregue por error una variable que no contenga respuestas de la misma pregunta, ya que esto implicara que no cuenta con las mismas propiedades de las variables de inters (Tipo, Medida, Valores, Perdidos), lo que puede causar que se presenten problemas al momento de generar las tablas de frecuencia o de contingencia. Una vez se han ingresado las variables, es necesario definirle al programa el tipo de respuestas que contienen. En la seccin Las variables estn codificadas como, encontramos las opciones Dicotomas y Categoras. SPSS denomina Dicotomas a las respuestas de una pregunta cerrada y Categoras a las respuestas de preguntas Abiertas. Cuando se selecciona la opcin Dicotomas, se activa la casilla Valor contado, en esta casilla se debe ingresar el valor que representa a las respuestas validas (Si, existencia), el cual ser tenido en cuenta para los clculos. Cuando se selecciona la opcin Categoras se activan las casillas del rango (Desde, Hasta); en estas casillas se deben ingresar los valores (Mnimo y Mximo) de los datos. Despus de especificar la codificacin de las variables, se debe definir el nombre y la etiqueta del conjunto de datos, ingresando los caracteres en las respectivas casillas. Para el nombre del conjunto SPSS nos permite ingresar hasta un mximo de siete (7) caracteres, teniendo en cuenta no utilizar palabras clave como casenum, sysmis, jdate, date, time, length y width. Para la etiqueta del conjunto, por el contrario se puede ingresar hasta un mximo de 40 caracteres.

La ltima seccin que encontramos en el cuadro de dilogo corresponde a la casilla de conjuntos, en ella aparecern todos los conjuntos de variables que hayan sido definidos satisfactoriamente. Para facilitar su identificacin cada nombre de conjunto esta precediendo con un signo de dlar ($); es necesario recalcar que el programa no crea una nueva sper-variable en el editor de datos para guardar toda la informacin del conjunto, sino por el contrario cuando el nombre del conjunto es empleado en un procedimiento, SPSS lo sustituye por las variables que lo componen al momento de realizar los clculos de los estadsticos (Tablas de frecuencia o Tablas de contingencia). Para comprender la metodologa empleada en la definicin de los conjuntos de respuesta mltiple, en la siguiente leccion vamos a generar algunos ejemplos, empleando las variables de Marca

You might also like