You are on page 1of 30

2

06

IBM SPSS STATISTICS 22.0


Análisis Descriptivo

Capacidad:
Elabora y diseña tablas y gráficos de resultados aplicando
estadísticos descriptivos en SPSS.

Contenidos:

1. Análisis descriptivo
2. Análisis Exploratorio
3. Análisis de datos categóricos
1. Análisis Descriptivo:
En el 1er capítulo, que fue la introducción al manejo de IBM SPSS Statistics,
se dieron definición y explicación acerca de la Estadística, la cual se clasifica
en 02: Descriptiva e Inferencial. Esto dicho sea de paso, dependerá de la
naturaleza o tipo de Variable(s) que se desee analizar.

Entonces realizaremos un Análisis Descriptivo de datos, mediante 02


opciones, considerando la de mayor énfasis:

Analizar Estadísticos Descriptivos “Frecuencias”

Figura N° 01: Estadísticos Descriptivos – “Frecuencias”

Para el respectivo análisis, acorde la ventana mostrada en la figura N° 01,


sólo utilizaremos los botones: “Estadísticos” y “Gráficos”, teniendo en
cuenta lo siguiente:

***Tendremos en cuenta la base de datos:


Material de Computación III - Temas N° 04 - Hábitos y Estilos de Vida

MÓDULO DE COMPUTACIÓN III 2


a) Variables Cualitativas:
Suele llamárseles “categóricas”, son todos aquellos que tienen

presencia de atributo o cualidad a ser descrita o cuantificable

(dicotomía, multi categórica, ordinal, o respuesta abierta).

Por su naturaleza, se dividen en 02:

- Nominal: Si la categoría o atributo NO especifica orden en su

naturaleza. Ejemplo: “género, nacionalidad, idioma, color de ojos,

etc”.

- Ordinal: Cuando SI implica orden o jerarquía la categoría o

atributo. Ejemplo: “Nivel de educación, rango militar, nivel de

satisfacción, grupo etáreo, calificación de rendimiento, etc.”.

Ahora de cara a nuestra ventana de la opción “Frecuencias”, se

recomendará SÓLO USAR el botón Gráfico, y de esta forma

tendremos en la salida de la Ventana de Resultados: Tabla de

Frecuencias (véase en la figura N°01, check activado “mostrar tabla de

frecuencias”).

Y finalmente se aconseja tener el siguiente criterio:

- Variable con NO más de 03 atributos: gráfico de sector circular.

- Variable con MÁS de 03 atributos: gráfico de barras.

MÓDULO DE COMPUTACIÓN III 3


Aplicando lo explicado:

Trabajaremos las variables:

“Género” y “P3_Relac_Carr” (nominal y ordinal).

Recordemos siempre en trabajar en el campo de “Valores de Gráfico” la opción

Porcentajes, y de esta manera podremos apreciar en el gráfico de resumen el

comportamiento de la variable.

Figura N° 02: Procesamiento “Género” – Opción “Frecuencias”

De forma similar, hacemos hincapié, recordar el número de ítems por cada

variable, y de esta manera especificar el gráfico adecuado con su respectiva

asignación porcentual.

Figura N° 03: Procesamiento “P3_Relac_Carr” – Opción “Frecuencias”

MÓDULO DE COMPUTACIÓN III 4


Figura N° 04: Resultados “Género” – Opción “Frecuencias”

Figura N° 05: Resultados “P3_Relac_Carr” – Opción “Frecuencias”

MÓDULO DE COMPUTACIÓN III 5


b) Variables Cuantitativas:
Este tipo de variables es cuando el resultado de la observación o

medición es un número, es decir son de naturaleza medible (podemos

calcular medidas que representen alguna característica en particular).

A su vez estas se clasifican en:

- Discreta: Es cuando la variable en estudio sus datos numéricos

son ENTEROS. Ejemplo: “número de visitas al cine, número hijos,

edad, número de figuritas de un álbum, etc”.

- Ordinal: Es cuando la variable en estudio sus datos numéricos

implican DECIMALES Ejemplo: “talla, peso, sueldo neto, etc”.

A comparación del trato y uso de botones dentro de la opción

“Frecuencias”, para el procesamiento de este tipo de variables

emplearemos ambos botones,

Para el botón “Gráficos”, activamos la opción Histograma

conjuntamente con Mostrar Curva Normal, ya que por concepto y

definiciones de estadística descriptiva es necesario visualizar el

comportamiento de datos mediante este gráfico cuantitativo.

Figura N° 06: Botón “Gráficos” – V. Cuantitativa – Opción “Frecuencias”

MÓDULO DE COMPUTACIÓN III 6


De otro lado, detallaremos el contenido del botón “Estadísticos”,
como se mencionó y explicó la naturaleza de este tipo de variables, es
adecuado presentar medidas que expliquen el comportamiento de
cierta cantidad de datos cuantitativos, y para ello hay que conocer las
“Medidas Estadísticas Descriptivas”.

Figura N° 07: Botón “Estadísticos” – V. Cuantitativa – Opción “Frecuencias”

b.1) Medidas de Tendencia Central: Se utilizan para describir cómo


se puede resumir la localización de los datos. Ubican e identifican el
punto alrededor del cual se centran los datos. Las medidas de
tendencia central nos indican hacia donde se inclinan o se agrupan
más los datos. Las más utilizadas son: la media, la mediana y la moda.

MÓDULO DE COMPUTACIÓN III 7


- Media: Conocida también como promedio o media aritmética,

matemáticamente se obtiene sumando todos los valores de los

datos y divide el resultado entre la cantidad de datos.

Si los datos proceden de una “muestra”, la media se representa con

una x testada (𝑋̅) y si provienen de la “población”, se representan

con la letra griega miu (µ).

∑ 𝑋𝑖
𝑋̅ =
𝑛
***Ejemplo de Interpretación:

“La edad promedio de los estudiantes USS es de 23 años”.

- Mediana: Se le llama media posicional, porque queda exactamente

en la mitad de un grupo de datos, luego de que los datos se han

colocado de forma ordenada. En este caso la mitad (50%) de los

datos estará por encima de la mediana y la otra mitad (50%) estará

por debajo de ella. La mediana es el valor intermedio cuando los

valores de los datos se han ordenado (Me).

***Ejemplo de Interpretación:

“El 50% de las edades se encuentran por alrededor de 23 años y

el otro 50% se encuentran por debajo de 23 años”.

MÓDULO DE COMPUTACIÓN III 8


- Moda: Es el dato que más se repite o el dato que ocurre con mayor

frecuencia. Un grupo de datos puede no tener moda, tener una

moda (unimodal), dos modas (bimodal) o más de dos modas

(multimodal).

***Ejemplo de Interpretación:

“La edad más frecuente entre los estudiantes es de 23 años”.

b.2) Medidas de Tendencia No Central: Conocidas también como

“Medidas de Posición”, son valores de la distribución que la dividen en

partes iguales, es decir, en intervalos, que comprenden el mismo

número de valores. Los más usados son los cuartiles, los deciles y los

percentiles.

- Percentiles: son 99 valores que dividen en cien partes iguales el

conjunto de datos ordenados. Ejemplo, el percentil de orden 15 deja

por debajo al 15% de las observaciones, y por encima queda el 85%.

- Cuartiles: son los tres valores que dividen al conjunto de datos

ordenados en cuatro partes iguales, son un caso particular de los

percentiles:

* El primer cuartil Q1 es el menor valor que es mayor que una cuarta

parte de los datos.

* El segundo cuartil Q2 (la mediana), es el menor valor que es mayor

que la mitad de los datos.

* El tercer cuartil Q3 es el menor valor que es mayor que tres cuartas

partes de los datos.

MÓDULO DE COMPUTACIÓN III 9


- Deciles: son los nueve valores que dividen al conjunto de datos

ordenados en diez partes iguales, son también un caso particular

de los percentiles.

b.3) Medidas de Dispersión: Una vez localizado el centro de la

distribución de un conjunto de datos, lo que procede es buscar una

medida de dispersión de los datos.

La dispersión o variación es una característica importante de un

conjunto de datos porque intenta dar una idea de cuán esparcidos se

encuentran éstos.

Existen diversas medidas de dispersión, algunas de ellas son:

- Rango: O también llamado “Recorrido”, es la diferencia entre el

valor más grande y el más pequeño del conjunto de datos.

- Varianza: Su objetivo detectar las variaciones de cada valor

respecto al promedio. Podemos definirla como el promedio del

cuadrado de las diferencias de todas las puntuaciones respecto al

promedio (σ2 expresión a nivel población, S2 a nivel muestra).

MÓDULO DE COMPUTACIÓN III 10


Una varianza jamás puede ser negativa, y siempre

tendrá un valor positivo ó igual a 0.

2
∑(𝑋𝑖 − 𝑋̅)2
𝑆 =
𝑛

- Desviación Estándar: Es la raíz cuadrada positiva de la varianza.

Mide la variabilidad de los datos en las unidades en que se midieron

originalmente (σ expresión a nivel población, S a nivel muestra). La

desviación típica es el índice de dispersión más importante.

∑(𝑋𝑖 − 𝑋̅)2
𝑆=√
𝑛

Ejemplo ilustrativo:

Calcular la varianza y desviación típica de las siguientes estaturas de

estas 05 personas.

Entonces, la talla PROMEDIO sería: 1.67 m. --------------

MÓDULO DE COMPUTACIÓN III 11


Varianza (S2): 0.04
La variabilidad de las estaturas respecto a la estatura promedio, no son
tan extremos (nótese en la imagen).

Desviación Estándar (S): 0,09695


La dispersión de las estaturas respecto a la estatura promedio, difieren en
0.09695 m.

b.3) Medidas de Forma: Es la apariencia externa de la distribución de

frecuencias o de una colección de datos cuantitativos y vienen dada

representada por el aspecto gráfico. Dentro de la forma se incluye

simetría o asimetría de la curva, y el grado de apuntamiento o

achatamiento de la curva (curtosis).

- Asimetría: O llamada también sesgo, Evalúa el grado de distorsión o

inclinación que adopta la distribución de los datos respecto a su valor

promedio tomado como centro de gravedad.

MÓDULO DE COMPUTACIÓN III 12


El coeficiente de asimetría de Pearson es:

3 ( 𝑋̅ − 𝑀𝑒)
𝐴𝐾 =
𝑆

Tabla N° 1: Valores de la asimetría

Grado de Asimetría Valor del Sesgo

Simetría Perfecta 0 : El promedio es igual a la mediana


Asimetría Positiva + : Promedio mayor que la mediana
Asimetría Negativa - : Promedio menor que la mediana

Figura N° 08: Aspecto Gráfico - Asimetría

- Curtosis: Estas medidas indican el grado de apuntamiento o


achatamiento del gráfico correspondiente a una distribución de
frecuencias. Su referente siempre será la curva normal del gráfico
(es decir una curva unimodal simétrica en forma de campana).

( 𝑋̅ − 𝑀𝑜)
𝐾 =
𝑆

MÓDULO DE COMPUTACIÓN III 13


Tabla N° 2: Valores de la curtosis

Grado de Apuntamiento Valor de Curtosis


Mesocúrtica (Distribución Normal) 0.263 (referencial)
Leptocúrtica (elevada) Mayor a 0.263 o se aproxima a 0.5
Platicúrtica (aplanada) Menor a 0.263 o se aproxima a 0

Figura N° 09: Aspecto Gráfico - Curtosis

MÓDULO DE COMPUTACIÓN III 14


Aplicando lo explicado:

En esta ocasión trabajaremos con la variable: Edad.

Teniendo como referencia las Figuras N° 06 y N° 07, obtendremos lo siguiente:

Figura N° 10: Resultados “Edad” – Opción “Frecuencias

MÓDULO DE COMPUTACIÓN III 15


c) Opción Descriptivos:
Complementaria a la opción “Frecuencias”, dentro del análisis
descriptivo, podemos utilizar la opción “Descriptivos”.
Pero a diferencia de la 1era, esta opción SOLO devolverá algunas
medidas Descriptivas (Promedio, máximo, mínimo, varianza,
desviación estándar, rango, asimetría y curtosis).

Recalcando que esta opción sería ÚNICAMENTE para variables


cuantitativas, y también de NO poder mostrar opciones gráficas.

Analizar Estadísticos Descriptivos “Descriptivos”

Figura N° 11: Opción “Descriptivos”

Figura N° 12: Resultados “Edad” - Opción “Descriptivos”

MÓDULO DE COMPUTACIÓN III 16


2. Análisis Exploratorio:
Esta opción alternativa dentro de “Estadísticos Descriptivos”, permite

generar estadísticos de resumen y representaciones gráficas, bien para

todos los casos o bien de forma separada para grupos de casos (basado en

condiciones cualitativas: género, estado civil, religión, etc., llamado también

Factores).

Existen numerosas razones para emplear esta opción “Explorar”:

- Inspeccionar los datos, y de esta manera evaluar su

comportamiento y tendencia del mismo.

- Identificar valores atípicos, es decir si existen valores extremos que

condicionen la evaluación de supuestos.

- Obtener descripciones, y así dar veredictos cercanos a la realidad.

- Comprobar supuestos, para así respaldar la inferencia planteada.

- Caracterizar diferencias entre subpoblaciones (grupos de casos).

Analizar Estadísticos Descriptivos “Explorar”

Figura N° 13: Opción “Explorar“

MÓDULO DE COMPUTACIÓN III 17


a) Estadísticos: Este campo permitirá acceder a información de

“Medidas Descriptivas Estadísticas”, antes ya explicadas en el

apartado de “Análisis Descriptivo”, y de esta manera tener detalle

inmediato de la o las variables cuantitativas a estudiar.

Figura N° 14: Opción Estadísticos - “Explorar“

b) Gráficos:

- Diagrama Cajas:

Muestra la distribución de datos en cuartiles, resaltando el promedio y

los valores atípicos. Estas podrán tener líneas que se extienden

verticalmente llamadas “bigotes”, e indican la variabilidad fuera de los

cuartiles superior e inferior, y cualquier punto fuera se considera un

valor atípico.

Figura N° 16: Opción Gráficos - “Explorar“

MÓDULO DE COMPUTACIÓN III 18


A su vez, dentro de este campo podemos elegir la presentación del

gráfico: “Niveles de los factores juntos”, es decir si se tiene factores (en

este caso “cualitativos”) estos pueden mostrarse en dentro del mismo

gráfico (ejm. “distribución de edades según su género); “Dependientes

juntas”, podemos trabajar más de 02 variables cuantitativas a mostrar

gráficamente; “Ninguna” lógicamente cuando no deseamos mostrar

gráfico alguno.

Figura N° 16: Lectura Gráfica - “Gráfico Cajas”

- Descriptivos: Los gráficos a mostrar en esta opción son:

“Histograma” algo ya explicado detalladamente en el aparto de

gráficos en la opción “Frecuencias”; y el otro gráfico que podemos

plasmar es “Tallo y Hojas”, permite obtener simultáneamente una

distribución de frecuencias de la variable y su representación gráfica.,

para construirlo basta separar en cada dato el último dígito de la

derecha (que constituye la hoja) del bloque de cifras restantes (que

formará el tallo).
MÓDULO DE COMPUTACIÓN III 19
Ejemplo:

Edades: 39 23 36 32 40 32 40 30 29 34

n = 10

Tallos Hojas
2 3 9
3 0 2 2 4 6 9
4 0 0

- Gráficos Pruebas de Normalidad: Usualmente IBM SPSS Statistics

muestra gráfica de normalidad “Cuantil Cuantil (Q-Q Plots), los

cuales permite observar cuan cerca está la distribución de un conjunto

de datos a alguna distribución ideal o comparar la distribución de dos

conjuntos de datos.

*** Para realizar “Inferencia Estadística”, es necesario evaluar

SUPUESTOS, dentro de ellos conocer la distribución de la muestra, y

la idónea es Distribución Normal.

Complementariamente dentro de las salidas de “Pruebas de

Normalidad” el software mostrará pruebas complementarias:

“Kolmogorov-Smirnov” y “Shapiro-Wilk”, siendo el valor de

significancia el que determina la normalidad: Si es MAYOR a 0.05

podemos afirmar que NO SIGUEN DISTRIBUCIÓN NORMAL.

MÓDULO DE COMPUTACIÓN III 20


Aplicando lo explicado:

Nuevamente trabajaremos con la base de datos:

Hábitos y Estilos de Vida, considerando “Edad” y “Género”

MÓDULO DE COMPUTACIÓN III 21


MÓDULO DE COMPUTACIÓN III 22
Estadísticos descriptivos de “EDAD” según su “GÉNERO”

MÓDULO DE COMPUTACIÓN III 23


3. Análisis de Datos Categóricos:
Dentro del análisis de variables cualitativas, estas pueden realizarse a nivel

individual y a nivel comparativo.

Es así que dentro de este punto, explicaremos el uso de la opción:

a) Tablas de Contingencia

Es una de las formas más comunes de resumir datos categóricos.

La tabla bidimensional recibe el nombre de tabla de contingencia cuando

las características en estudio no son cuantitativas.

Es una tabla que cuenta las observaciones por múltiples variables

categóricas. Las filas y columnas de las tablas corresponden a estas

variables categóricas.

La ruta de acceso a esta opción:

Analizar Estadísticos Descriptivos “Tablas Cruzadas”

Figura N° 17: Tablas Cruzadas

MÓDULO DE COMPUTACIÓN III 24


Como se aprecia en la figura N° 17, se encuentra la distribución de “Filas”

y “Columnas”, en donde por criterio de naturaleza de variables, estas

deben ser Cualitativas.

Por ejemplo, este tipo de organización de datos puede ser de gran utilidad

para este tipo de casos:

“Después de una elección reciente entre dos candidatos, una encuesta de

opinión pública registró información de “Género” y la “Elección de

Candidato” de 100 electores seleccionados de manera aleatoria y los

datos se tabularon de la siguiente manera:

Candidato Candidato
Género Total
"A" "B"
Hombre 28 20 48
Mujer 39 13 52
Total 67 33 100

Ahora, dentro de los botones que contiene la opción “Tablas Cruzadas”,

trabajaremos con:

- Estadísticos: Dentro, podremos elegir “Pruebas de Asociación”,

las que determinan si hay dependencia entre variables categóricas.

Dentro de estas, emplearemos la prueba estadística:

MÓDULO DE COMPUTACIÓN III 25


Figura N° 18: Chi-cuadrado - Estadísticos

Prueba de Independencia Chi-cuadrado: Medida resumen que

compara los valores (nij) observados en la tabla, con los que teóricamente

se obtendría (tij), en el supuesto de que las variables X e Y fuesen

independientes.

Los valores teóricos tij se obtienen mediante:

Siendo ni* y n*j las frecuencias marginales.

MÓDULO DE COMPUTACIÓN III 26


Siempre basándonos en hipótesis, como por ejemplo:

H0: “El uso de cinturón de seguridad es independiente del nivel

socioeconómico”.

H1: “El uso de cinturón de seguridad depende del nivel socioeconómico”.

Dentro de los resultados mostrados por IBM SPSS Statistics, tendremos

en cuenta el valor “Sig. Asintótica (2 caras)” = p, la cual tiene la

siguiente indicación:

Si p < 0,05 el resultado es significativo, es decir, rechazamos la hipótesis

nula de independencia y por lo tanto concluimos que ambas variables

estudiadas son dependientes, existe una relación entre ellas.

Si p > 0,05 el resultado no es significativo, es decir, aceptamos la hipótesis

nula de independencia y por lo tanto concluimos que ambas variables

estudiadas son independientes, no existe una relación entre ellas.

El valor de 0,05 es un valor establecido de acuerdo al nivel de confianza

del 95%.

MÓDULO DE COMPUTACIÓN III 27


Aplicando lo explicado:

Nuevamente trabajaremos con la base de datos:

Hábitos y Estilos de Vida, considerando “Género” y “P4_Aspec_Vital”

Plantearemos las siguientes hipótesis:

H0: “Los aspectos para aceptar un empleo son independientes del

género”.

H1: “Los aspectos para aceptar un empleo dependen del género”.

MÓDULO DE COMPUTACIÓN III 28


MÓDULO DE COMPUTACIÓN III 29
Referencias Bibliográficas:

 Rodríguez Franco, J., Pierdant Rodríguez, A., & Rodríguez Jiménez, E.


C. (2016). Estadística para la Administración. México: Grupo Editorial
Patria.
 Tomás Sábado, J. (2009). Fundamentos de Bioestadística y análisis de
datos para enfermería. Barcelona: Servei de Publicacions.
 Fernandez Fernandez, S., Cordoba Largo, A., & Cordero Sánchez, J. M.
(2002). Estadística Descriptiva.
 Salafranca Cosialls, L., Nuñez Peña, M. I., & Serra Delgado, G. (2001).
Estadística Aplicada con SPSS y StatGraphics. Barcelona: Universidad
de Barcelona.

Enlace Web
 Statistics, I. S. (2017). Documentación técnica del producto de IBM.
Obtenido de https://www.ibm.com/support/knowledgecenter/es/
 APA, N. (2017). Normas APA. Obtenido de Normas APA:
http://normasapa.com/insercion-de-tablas-y-figuras/

MÓDULO DE COMPUTACIÓN III 30

You might also like