Professional Documents
Culture Documents
Tema N 04:
Anlisis Descriptivo
Frecuencia
Descriptivo
Edicin de Grficos
Explorar Tallos y Hojas
Conocimientos Previos
Define variables en SPSS y realiza la manipulacin de los datos.
GRFICOS
Genera algunos diagramas bsicos (Barras, sectores e histogramas).
Los grficos de barras y de sectores son apropiados para las variables
categricas (variables con un nmero limitado de categoras diferentes). Los
valores cuya frecuencia sea cero no aparecern en el grfico.
Histogramas: Son similares a los grficos de barras pero con las barras juntas,
dando as la impresin de continuidad. Slo pueden obtenerse para variables
con formato numrico. Para construir el histograma, SPSS agrupa a las variables
en 21 intervalos (o menos si la amplitud de la variable es menor de 21) Los
histogramas son adecuados para variables cuantitativas continuas (por ejemplo
salario o edad). Al seleccionar Con curva normal, se superpone en el
histograma una curva normal (generada a partir de la media y la desviacin
tpica de la variable representada).
ESTADSTICOS
Obtener el clculo de algunos valores de estadsticos descriptivos ms
utilizados(Valores percentiles, Tendencia Central, Dispersin y Distribucin),
estas opciones depende en gran medida del hecho a qu tipo de variable es la
estudiada.
Valores percentiles:
Cuartiles: Calcula los percentiles 25, 50 y 75, es decir, los valores
por debajo de los cuales se encuentra el 25%, el 50% y el 75% de
los casos, respectivamente.
Puntos de corte para k grupos iguales: Calcula los k -1 valores
que dividen la muestra en K grupos del mismo tamao. El valor por
defecto de K es 10, pero puede escribirse cualquier otro valor entre
2 y 100.
Tendencia Central:
Media(Media aritmtica): Suma de todas las puntuaciones
dividida por el nmero de puntuaciones.
Mediana. Valor por debajo del cual se encuentra el 50% de los
casos (equivale al percentil 50). Si el nmero de casos es par; la
mediana se calcula como el promedio de los dos casos centrales
cuando estos se encuentren ordenados. Si el nmero es impar, la
mediana es el valor del caso central.
Moda: Valor que ms se repite. Si existen dos o ms valores
empatados en el nmero de repeticiones, solo se muestra el ms
pequeo de ellos.
Dispersin:
Desviacin tpica: Raz cuadrada de la varianza. Mide el grado en
que las puntuaciones de la varianza se alejan de su media.
Varianza: Medida de dispersin en torno a la media, igual a la
suma de los cuadrados de las desviaciones respecto a la media
dividida por el nmero de casos menos 1. La varianza se mide en
unas unidades que son el cuadrado de las de la propia variable.
Amplitud: Diferencia entre los valores mayor y menor de una
variable numrica; el mximo menos el mnimo. Tambin se
denomina recorrido o rango de la variable.
Mnimo: Valor ms pequeo.
Mximo: valor ms grande.
FORMATO
En esta ventana se determina como se mostrar en el visor de resultados las tablas de
frecuencia y los estadsticos seleccionados.
Mltiples variables. Al solicitar grficos o estadsticos para ms de una variable permite:
Comparar variables: muestra todas las variables en una sola tabla.
- Organizar resultados segn variables: muestra una tabla de estadsticos
separada por cada variable.
Suprimir tablas con ms de n categoras. Esta opcin elimina de la salida las
distribuciones de ms de n valores o categoras. Por defecto es diez pero puede elegirse
cualquier nmero distinto de uno. Es recomendable utilizarla con variable cuantitativas.
Sabiendo que los valores asumidos en la variable de estudio NIVEL para las grficas
anteriores son:
Ejemplo 1: Haciendo un anlisis de frecuencia sin estadsticos y sin grficos para una variable cualitativa S
Habiendo especificado la seleccin de algunas opciones, el Visor de Resultado ofrece dos tablas: una de
Estadsti
co
NRO_CONSULTAS
N
Vlidos
10
Perdidos
Medi
a
Moda
2,40
1a
1
Mni
mo
Mxi
5
mo
a. Existen varias modas. Se
mostrar el menor de los
NRO_CONSULTAS
Vlido
s
Frecuenci
a
1
Porcentaj
e
10,0
Porcentaje
Porcentaje
vlido
acumulado
10,0
10,0
10,0
10,0
20,0
20,0
20,0
40,0
30,0
30,0
70,0
30,0
30,0
100,0
10
100,0
100,0
Total
Vlidos
Perdidos
10
0
NIVEL
Vlidos
Frecuenci
a
Porcentaj
e
Porcentaje
TCNICO
20,0
20,0
acumula
20,0
BACHILLER
30,0
30,0
50,0
TITULADO
10,0
10,0
60,0
MAGISTER
20,0
20,0
80,0
DOCTOR
20,0
20,0
100,0
10
100,0
100,0
To
tal
vlido
Porcent
aje
Vlidos
Frecuenci
a
Porcentaj
e
Porcentaje
Porcentaje
vlido
acumulado
TITULADO
10,0
10,0
10,0
TCNICO
20,0
20,0
30,0
MAGISTER
20,0
20,0
50,0
DOCTOR
20,0
20,0
70,0
BACHILLER
30,0
30,0
100,0
10
100,0
100,0
To
tal
21.3.- DESCRIPTIVOS
El procedimiento Descriptivos est diseado para variables cuantitativas continuas a
diferencia del procedimiento Frecuencias que contiene opciones para todo tipo de variables.
Contiene algunos estadsticos descriptivos que tambin incluye el procedimiento
Frecuencias, pero aade una opcin especialmente importante: la posibilidad de obtener
puntuaciones tpicas.
Para acceder a este procedimiento, y obtener el cuadro de dilogo de la figura 5 se sigue la
ruta:
Analizar
Estadsticos descriptivos
Descriptivos
Estadsticos descriptivos
N
INGRESO
10
N vlido (segn
lista)
10
Mnim
o
850,
00
Mxim
o
3500,
00
Suma
Media
19900,
00
1990,00
00
Desv.
tp.
910,067
15
Varianza
828222,2
22
65,50
72,00
68,00
59,00
60,00
75,60
62,50
64,
00
6
6
7
2
7
6
8
5
9
6
6
4
En el visor de resultados se logra mostrar la siguiente tabla con los grficos de prueba de
normalidad:
width:
leaf:
St
em
&
Le
af
.
5
89
6
. 02
6
. 34
68
7
. 2
7 10,00
. 6
1 case(s)
Ejemplo:
N/2
Li-1
es el lmite inferior de la
clase donde se encuentra
la mediana.
Ni-1
es la frecuencia
acumulada anterior a la
clase mediana.
ni
Ci
Ejemplo:
[60,
63)
[63,
fi
1
66)
8
4 la mediana
<=[66,
Aqu se encuentra
69)
2
[69,
2
72)
7
[72,
8
L
75)
i-
1 [66, 69)
0
=66
23
ni
42
Mediana
5
23
65
92
100
Li-1
es el lmite inferior de
la clase donde se
encuentra la moda.
Ejemplo:
ni
+1
ni
- 1 la
Ci
[60,
63)
[63,
66)
<= Aqu se encuentra la[66,
moda
69)
[69,
72)
[72,
clase.
fi
1
8
4
23
2
2
7
8
92
65
100
Li 75)
n i-1
[66, 69)
1
0
18
n i+1
27
Ci
Moda
=
6
la frecuencia del
intervalo posterior.
frecuencia del
intervalo anterior.
es la amplitud de la
Ejemplo 1:
A continuacin se realiza un ejercicio sencillo relacionado con las medidas de posicin no
centrales. El enunciado dice que se presentan los tiempos (en minutos) logrados por 20
estudiantes, en una prueba de 200 metros planos. Nos piden hallar los valores
correspondientes al cuartil 1, 2 y 3. A parte de ello nos piden responder para la serie de datos
dada tiene sentido buscar percentiles?Cmo procedemos a obtener los cuartiles en SPSS?
2
1
1,
1,
1,
2
1,
2,
2,
1,
1,9
2,4
2,2
2,6
1,5
2
1
2,
2,
2,
1
1,
1,
,
1
1,
1,
,7+1,7
) = 1,7
1,
1,
,
1
2,
2+2
2
)=2
2
2
2,
,
2
2,
2,
2,4 + 2,5
2
) = 2,45
2,
2,
2,
2,
Dividimos en otras cuatro partes. En esas fracciones es donde se establecen las
medianas que correspondern a los cuartiles 1, 2 y 3. El anlisis de los cuartiles
indica los valores que contienen el 25%, 50% y 75% de la informacin.
El anlisis de estos cuartiles indica:
El primer 25% de los datos reportan valores inferiores a 1.7 minutos, la mitad logr
valores por debajo o iguales a los 2 minutos, y el 75% logr tiempos hasta
Vlido
sPerdid
20
0
os
Percentile s
25
1,7000
50
2,0000
75
2,4500
La Varianza
Ejemplo
Calcular la varianza y desviacin tpica de las siguientes cantidades medidas en
metros de un conjunto de personas.
Las alturas hasta la cabeza son:
1.76
1.72
1.52
1.68
1,65
0,11
0,05
0,01
-0,02
-0,15
0,1
12
+ (0,15)2
+
0,012
(-0,02)2
0,0376
0,0094 =
4
Elementos - 1
La varianza es 0,0094
Y la desviacin estndar es la raz de la varianza:
Desviacin estndar es =0,0094 = 0,09695
La desviacin estndar es til, pues vemos que las alturas estn a distancia menos
0,11
0,05
=0,09695
=0,09695
-0,15
0,01
-0,02
Vlido
s
Perdido
s
Desv. tp.
Varianza
5
0
,09695
,009
los
Eje de simetra
(media)
Simtrica
Eje de simetra
(media)
Asimetra negativa
Eje de simetra
(media)
Coeficiente de Fisher:
Donde
Xi
ni
=
=
=
Donde
M
d
s
=
=
=
media aritmtica.
Mediana.
desviacin tpica o
estndar.
A. CURTOSIS
La curtosis mide el grado de agudeza o achatamiento de una distribucin con relacin a la
regin central de la distribucin.
La curtosis presenta las siguientes formas:
Leptocrtica
Mesocrtica
Platicrtica
Donde
Xi
=
=
ni
AutoEvaluacin:
1) Existen dos procedimientos bsicos que permiten describir las propiedades de
las distribuciones. Segn lo aprendido: Cules son estos dos procedimientos?
a)
b)
2)
3)
4)
5)
a) Obtenga un diagrama de tallos y hojas de las notas solo del sexo masculino.
3. Del ejemplo 1 de este tema, con respecto al tiempo obtenido por cada uno de
los participantes:
2
1
1,
1,
1,
2
1,
2,
2,
1,
1,9
2,4
2,2
2,6
1,5
2
1
2,
2,
2,
a)
Determine los cuartiles de las notas solo del sexo masculino. Interpreta el
resultado.