You are on page 1of 35

SOFTWARE ESTADSTICO SPSS

Tema N 04:

Anlisis Descriptivo
Frecuencia
Descriptivo
Edicin de Grficos
Explorar Tallos y Hojas

Medidas de Tendencia central.


Medidas de tendencia no central
Medidas de Dispersin

Capacidad del Tema


1.Elabora y Disea tablas de resultados

aplicando estadsticos descripti

Conocimientos Previos
Define variables en SPSS y realiza la manipulacin de los datos.

El Estudiante reconoce la importancia de saber determinar un anlisis descriptivo en SPSS me


Los Estudiantes identifican los diferentes estadsticos que se pueden obtener de un conjunto

ANLISIS DESCRIPTIVO CON SPSS


21.1.- INTRODUCCIN

Existen dos procedimientos bsicos que permiten describir las


propiedades de las distribuciones, estos dos procedimientos son Frecuencias y
Descriptivos.
Los procedimientos dependen del tipo de variables. Con variables categricas,
las medidas de tendencia central y de dispersin carecen de sentido, por el
contrario, con variables continuas, una tabla de frecuencias pierde importancia.
Por otro lado los grficos que informan sobre la forma de una distribucin son
diferentes dependiendo de que la variable estudiada sea categrica o continua.
21.2.- FRECUENCIAS
Una distribucin de frecuencias informa sobre los valores concretos que adopta
una variable y sobre el nmero (y porcentaje) de veces que se repite cada uno
de estos valores.
Se accede mediante:
Analizar
Estadsticos Descriptivos
Frecuencias

Mostrando la ventana de frecuencias:

GRFICOS
Genera algunos diagramas bsicos (Barras, sectores e histogramas).
Los grficos de barras y de sectores son apropiados para las variables
categricas (variables con un nmero limitado de categoras diferentes). Los
valores cuya frecuencia sea cero no aparecern en el grfico.

Histogramas: Son similares a los grficos de barras pero con las barras juntas,
dando as la impresin de continuidad. Slo pueden obtenerse para variables
con formato numrico. Para construir el histograma, SPSS agrupa a las variables
en 21 intervalos (o menos si la amplitud de la variable es menor de 21) Los
histogramas son adecuados para variables cuantitativas continuas (por ejemplo
salario o edad). Al seleccionar Con curva normal, se superpone en el
histograma una curva normal (generada a partir de la media y la desviacin
tpica de la variable representada).

ESTADSTICOS
Obtener el clculo de algunos valores de estadsticos descriptivos ms
utilizados(Valores percentiles, Tendencia Central, Dispersin y Distribucin),
estas opciones depende en gran medida del hecho a qu tipo de variable es la
estudiada.

Valores percentiles:
Cuartiles: Calcula los percentiles 25, 50 y 75, es decir, los valores
por debajo de los cuales se encuentra el 25%, el 50% y el 75% de
los casos, respectivamente.
Puntos de corte para k grupos iguales: Calcula los k -1 valores
que dividen la muestra en K grupos del mismo tamao. El valor por
defecto de K es 10, pero puede escribirse cualquier otro valor entre
2 y 100.
Tendencia Central:
Media(Media aritmtica): Suma de todas las puntuaciones
dividida por el nmero de puntuaciones.
Mediana. Valor por debajo del cual se encuentra el 50% de los
casos (equivale al percentil 50). Si el nmero de casos es par; la
mediana se calcula como el promedio de los dos casos centrales
cuando estos se encuentren ordenados. Si el nmero es impar, la
mediana es el valor del caso central.
Moda: Valor que ms se repite. Si existen dos o ms valores
empatados en el nmero de repeticiones, solo se muestra el ms
pequeo de ellos.
Dispersin:
Desviacin tpica: Raz cuadrada de la varianza. Mide el grado en
que las puntuaciones de la varianza se alejan de su media.
Varianza: Medida de dispersin en torno a la media, igual a la
suma de los cuadrados de las desviaciones respecto a la media
dividida por el nmero de casos menos 1. La varianza se mide en
unas unidades que son el cuadrado de las de la propia variable.
Amplitud: Diferencia entre los valores mayor y menor de una
variable numrica; el mximo menos el mnimo. Tambin se
denomina recorrido o rango de la variable.
Mnimo: Valor ms pequeo.
Mximo: valor ms grande.

E.T. media: Error tpico de la media, o sea la desviacin tpica de


la distribucin muestral de la media. Se obtiene dividiendo la
desviacin tpica por la raz cuadrada del nmero de casos. Es una
medida de cunto puede variar el valor de la media de una
muestra a otra, extradas stas de la misma distribucin

FORMATO
En esta ventana se determina como se mostrar en el visor de resultados las tablas de
frecuencia y los estadsticos seleccionados.
Mltiples variables. Al solicitar grficos o estadsticos para ms de una variable permite:
Comparar variables: muestra todas las variables en una sola tabla.
- Organizar resultados segn variables: muestra una tabla de estadsticos
separada por cada variable.
Suprimir tablas con ms de n categoras. Esta opcin elimina de la salida las
distribuciones de ms de n valores o categoras. Por defecto es diez pero puede elegirse
cualquier nmero distinto de uno. Es recomendable utilizarla con variable cuantitativas.

Grfico de frecuencia ordenada


por valores ascendentemente

Grfico de frecuencia ordenada


por recuentos ascendentemente

Sabiendo que los valores asumidos en la variable de estudio NIVEL para las grficas
anteriores son:

Cmo se muestran los estadsticos en el Visor de Resultados?

Haciendo uso de las siguientes variables con los datos de la figura:

Realizamos los siguientes ejemplos de anlisis descriptivo de frecuencias:

Ejemplo 1: Haciendo un anlisis de frecuencia sin estadsticos y sin grficos para una variable cualitativa S

Habiendo especificado la seleccin de algunas opciones, el Visor de Resultado ofrece dos tablas: una de

Ejemplo 2: Haciendo un anlisis de frecuencia con grficos de barras


ordenada por recuentos ascendentemente con clculo de algunos
estadsticos para una variable cuantitativa discreta NUMERO_CONSULTAS
de la tabla de 10 casos, se obtuvo lo siguiente:

Estadsti
co
NRO_CONSULTAS
N

Vlidos

10

Perdidos

Medi
a
Moda

2,40
1a
1

Mni
mo
Mxi
5
mo
a. Existen varias modas. Se
mostrar el menor de los

NRO_CONSULTAS

Vlido
s

Frecuenci
a
1

Porcentaj
e
10,0

Porcentaje

Porcentaje

vlido

acumulado

10,0

10,0

10,0

10,0

20,0

20,0

20,0

40,0

30,0

30,0

70,0

30,0

30,0

100,0

10

100,0

100,0

Total

Ejemplo 3: Determinar el porcentaje acumulado de casos que no tienen


el grado de doctor.
Teniendo en cuenta el tema, para dar respuesta a este enunciado se
tiene que efectuar un anlisis de frecuencia ordenado por valores
ascendentemente:

Obteniendo el siguiente resultado:


Estadsticos
NIVEL
N

Vlidos
Perdidos

10
0
NIVEL

Vlidos

Frecuenci
a

Porcentaj
e

Porcentaje

TCNICO

20,0

20,0

acumula
20,0

BACHILLER

30,0

30,0

50,0

TITULADO

10,0

10,0

60,0

MAGISTER

20,0

20,0

80,0

DOCTOR

20,0

20,0

100,0

10

100,0

100,0

To
tal

vlido

Porcent
aje

Respuesta: El 80 % acumulado de valores vlidos no tienen el grado de doctor.


Nota.- Tener cuidado que el anlisis de frecuencia no este ordenado por recuento
ascendentemente, porque su resultado sera el siguiente, el cul es errneo.
NIVEL

Vlidos

Frecuenci
a

Porcentaj
e

Porcentaje

Porcentaje

vlido

acumulado

TITULADO

10,0

10,0

10,0

TCNICO

20,0

20,0

30,0

MAGISTER

20,0

20,0

50,0

DOCTOR

20,0

20,0

70,0

BACHILLER

30,0

30,0

100,0

10

100,0

100,0

To
tal

21.3.- DESCRIPTIVOS
El procedimiento Descriptivos est diseado para variables cuantitativas continuas a
diferencia del procedimiento Frecuencias que contiene opciones para todo tipo de variables.
Contiene algunos estadsticos descriptivos que tambin incluye el procedimiento
Frecuencias, pero aade una opcin especialmente importante: la posibilidad de obtener
puntuaciones tpicas.
Para acceder a este procedimiento, y obtener el cuadro de dilogo de la figura 5 se sigue la
ruta:
Analizar
Estadsticos descriptivos
Descriptivos

Las opciones que se presente para este tipo de anlisis son:

Asumiendo en la tabla anteriormente descrita, algunas opciones descriptivas para una


variable cuantitativa continua, se lograr observar en el Visor de Resultados lo siguiente:

Estadsticos descriptivos
N
INGRESO

10

N vlido (segn
lista)

10

Mnim
o
850,
00

Mxim
o
3500,
00

Suma

Media

19900,
00

1990,00
00

Desv.
tp.
910,067
15

Varianza
828222,2
22

21.4.-DIAGRAMAS DE TALLOS Y HOJAS. (STEM AND LEAF)


Estos diagramas son procedimientos semi-grficos cuyo objetivo es presentar los datos
cuantitativos de una forma sinttica, siempre y cuando, stos no sean muy numerosos.
Para su construccin seguiremos los siguientes pasos.
a)

Se redondean los datos expresndolos en unidades convenientes


b) Se disponen en una tabla. A la izquierda se escribe, para datos con dos cifras, el primer
nmero, que ser el tallo, y a la derecha, las unidades que formarn las hojas. Si el nmero es
el 54 se escribe 5/4
c) Cada tallo definir una clase y slo se escribe una vez. El nmero de hojas representa la
frecuencia de dicha clase.

A continuacin vamos a representar un diagrama de tallos y hojas, utilizando como variable


las medidas en centmetros de una pieza de metal que se han obtenido a partir de una muestra
de todas las piezas fabricadas por una unidad de fabricacin:
58,00
62,20

65,50
72,00

68,00
59,00

60,00

75,60

62,50

64,
00

Redondeamos los datos a milmetros


58
62
60

6
6
7
2
7

6
8
5
9
6

6
4

Representamos el diagrama de tallos y hojas


5

Cmo lo implementamos en SPSS?


Redondeamos el peso generando una nueva variable.

Desde el software SPSS logramos obtener el recuadro a travs de siguiente ventana de


GRFICOS, que se encuentra como opcin en la ventana de EXPLORAR.

En el visor de resultados se logra mostrar la siguiente tabla con los grficos de prueba de
normalidad:

PESOREDONDEADO Stem-and-Leaf Plot Frequency


2,00
4,00
2,00
1,00
1,00
Stem
Each

width:
leaf:

St
em

&

Le
af

.
5
89
6
. 02
6
. 34
68
7
. 2
7 10,00
. 6
1 case(s)

22.1. MEDIDAS DE POSICION


Medidas de posicin central
Las medidas de posicin central ms comunes son: la media, la mediana, y la moda. La
media, a su vez, puede ser definida como media aritmtica, geomtrica y armnica. Cada una
de ellas presenta sus ventajas e inconvenientes y su eleccin depende tanto de la naturaleza
de la estadstica como del propsito para el que se utiliza.

a) La media aritmtica. Es la suma de todos los valores de la variable dividida por


el nmero total de los datos.

Ejemplo:

Las ventajas de utilizar la media aritmtica son:

En el clculo intervienen todos los valores de la variable


Es nica
Es calculable
Es el centro de gravedad de la distribucin.
Sin embargo est muy afectada por los valores extremos que presenten los datos, lo
que puede originar que a veces las conclusiones no sean muy atinadas.

b) La media geomtrica. Es la raz N-sima del producto de los valores de la


variable elevados por sus respectivas frecuencias.

La propiedad fundamental de esta media es que el logaritmo de la media geomtrica es igual


a la media aritmtica de los logaritmos de los valores de la variable.
La principal ventaja que ofrece esta media respecto a la media aritmtica es su menor
sensibilidad respecto a los valores extremos de la variable. La desventaja es que no est
determinada si alguno de los valores de la variable es negativo. Tambin tiene un significado
menos intuitivo que la media aritmtica.
Su utilizacin ms frecuente es promediar porcentajes, y tambin se aconseja su uso cuando
se presupone que la variable analizada se ha formado a partir de variaciones acumulativas.

c) La media armnica. La media armnica es la media aritmtica de los inversos


de los valores de la variable.

En ciertos casos la media armnica es ms representativa que la media


aritmtica.
Tiene como inconvenientes que est muy influenciada por los valores
pequeos y no est determinada cuando algn valor de la variable es
igual a cero.

d) La mediana. La mediana se encuentra en el lugar posicin central de conjunto


ordenado de datos, si el nmero de datos es impar. Cuando el nmero de
valores es par se toma la media aritmtica de los dos valores centrales.
La propiedad fundamental de la mediana es que la suma de todas las desviaciones
en valor absoluto de la variable respecto de la mediana es mnima. La mediana
adquiere mayor importancia cuando las variables son ordinales, o susceptibles de
ser ordenadas, en cuyo caso la mediana es la medida de tendencia central ms
representativa.

El Clculo de la mediana para datos agrupados


La mediana se encuentra en el intervalo donde la
frecuencia acumulada llega hasta la mitad de la suma de
las frecuencias absolutas.

N/2

es la mitad de la suma de las


frecuencias absolutas.

Li-1

es el lmite inferior de la
clase donde se encuentra
la mediana.

Ni-1

es la frecuencia
acumulada anterior a la
clase mediana.

ni
Ci

Ejemplo:

[60,
63)
[63,

fi

1
66)
8
4 la mediana
<=[66,
Aqu se encuentra
69)
2
[69,
2
72)
7
[72,
8
L

75)

i-

1 [66, 69)
0
=66
23

ni

42

Mediana

5
23
65
92
100

la frecuencia del intervalo.


es la amplitud de la clase.

d) La moda. Es el valor de la variable que ms veces se repite. Si existen dos o ms valores


empatados en el nmero de repeticiones, solo se muestra el ms pequeo de ellos.

El Clculo de la moda para datos agrupados


Para distribuciones agrupadas en intervalos se utiliza la
siguiente frmula.

Li-1

es el lmite inferior de
la clase donde se
encuentra la moda.

Ejemplo:

ni

+1

ni

- 1 la

Ci

[60,
63)
[63,
66)
<= Aqu se encuentra la[66,
moda
69)
[69,
72)
[72,

clase.

fi

1
8
4

23

2
2
7
8

92

65
100

Li 75)

n i-1

[66, 69)
1
0
18

n i+1

27

Ci

Moda

=
6

la frecuencia del
intervalo posterior.
frecuencia del
intervalo anterior.
es la amplitud de la

Medidas de posicin no central


Son medidas de posicin no central los cuartiles, deciles y percentiles. Las medidas de
posicin no centrales dividen la distribucin en partes iguales. Los cuartiles son tres valores y
dividen la distribucin en cuatro partes iguales. Los deciles son nueve y dividen la
distribucin en diez partes. Los percentiles son 99 y dividen la distribucin en cien partes.
Para distribuciones agrupadas en intervalos utilizamos la siguiente frmula:

Ejemplo 1:
A continuacin se realiza un ejercicio sencillo relacionado con las medidas de posicin no
centrales. El enunciado dice que se presentan los tiempos (en minutos) logrados por 20
estudiantes, en una prueba de 200 metros planos. Nos piden hallar los valores
correspondientes al cuartil 1, 2 y 3. A parte de ello nos piden responder para la serie de datos
dada tiene sentido buscar percentiles?Cmo procedemos a obtener los cuartiles en SPSS?

Teniendo en cuenta la lista de valores:

2
1
1,
1,
1,

2
1,
2,
2,
1,

1,9
2,4
2,2
2,6
1,5

2
1
2,
2,
2,

Distribuimos los valores de manera ordenada en una columna. En este ejemplo se


debe tener en cuenta que como el nmero de datos es par, es necesario entonces
utilizar dos valores intermedios para as promediarlos.

1
1,
1,
,
1
1,
1,

,7+1,7

) = 1,7

1,
1,
,
1
2,

2+2
2

)=2

2
2
2,
,
2
2,
2,

2,4 + 2,5
2

) = 2,45

2,
2,
2,
2,
Dividimos en otras cuatro partes. En esas fracciones es donde se establecen las
medianas que correspondern a los cuartiles 1, 2 y 3. El anlisis de los cuartiles
indica los valores que contienen el 25%, 50% y 75% de la informacin.
El anlisis de estos cuartiles indica:
El primer 25% de los datos reportan valores inferiores a 1.7 minutos, la mitad logr
valores por debajo o iguales a los 2 minutos, y el 75% logr tiempos hasta

2.4 minutos aproximadamente.


Tiene sentido buscar percentiles?
No, porque tenemos una muestra inferior en nmero a 100, por lo que no habra
datos suficientes para cubrir esta informacin.

Cmo obtenemos los cuartiles en SPSS?


Seguimos los pasos:
1. Analizar
Estadsticos Descriptivos
Frecuencias

2. En Estadsticos, activamos Cuartiles.

3.- Luego observamos el Visor de Resultados


Estadsticos
numero
N

Vlido
sPerdid

20
0

os
Percentile s

25

1,7000

50

2,0000

75

2,4500

2.3. MEDIDAS DE DISPERSION

Medidas de dispersin absoluta


Las medidas de dispersin o de variabilidad miden la representatividad de las medidas de
tendencia central, obtenindose como desviacin de los valores de la distribucin respecto a
estas medidas.
Las medidas de dispersin o de variabilidad son: el recorrido, el recorrido intercuartlico, la
desviacin absoluta media respecto a la media aritmtica, la desviacin absoluta media
respecto a la mediana, la varianza y la desviacin tpica o estndar.
Tomaremos en cuenta las siguientes medidas:

La Varianza

La Desviacin tpica o estndar

Las propiedades de la desviacin tpica son:

Es siempre mayor o igual que cero

Es una medida de dispersin ptima

Est acotada superior e inferiormente

No est afectada por cambios de origen

Si que est afectada por cambios de escala (queda multiplicada por el


factor de escala)

Ejemplo
Calcular la varianza y desviacin tpica de las siguientes cantidades medidas en
metros de un conjunto de personas.
Las alturas hasta la cabeza son:

1.76

1.72

1.52

1.68

1,65

As que la altura media es 1,67 metros. En el imagen inferior lo especificamos


mediante una lnea roja.

0,11
0,05

0,01
-0,02

-0,15

Ahora calculemos la diferencia de cada altura con la media:

0,1
12

+ (0,15)2

+
0,012

(-0,02)2

0,0376
0,0094 =
4

Elementos - 1

La varianza es 0,0094
Y la desviacin estndar es la raz de la varianza:
Desviacin estndar es =0,0094 = 0,09695
La desviacin estndar es til, pues vemos que las alturas estn a distancia menos

0,11
0,05

=0,09695

=0,09695
-0,15

de la desviacin estndar (0,09695 m) de la media:

0,01
-0,02

As que usando la desviacin estndar tenemos una manera "estndar" de saber


qu es normal, o extra grande o extra pequeo.

Cmo obtenemos la Desviacin Tpica y Varianza en SPSS?


Seguimos los pasos:
1. Analizar
Estadsticos Descriptivos
Frecuencias

2. En Estadsticos, activamos Desviacin tpica y Varianza.

3.- En el Visor de Resultados se obtiene lo siguiente:


Estadsticos
tamano
N

Vlido
s
Perdido

s
Desv. tp.
Varianza

5
0
,09695
,009

2.4. MEDIDAS DE FORMA

Medidas de Distibucin - Asimetra y Curtosis


Las medidas de distribucin nos permiten determinar la caracterstica de cmo los valores se
muestran: agrupados o separados.

Sus principales medidas son la Asimetra y la Curtosis.


A. ASIMETRA
Esta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor
del punto central (Media aritmtica).
La asimetra presenta las siguientes formas:
Asimetra positiva, cuando la distribucin de los datos tiende a la izquierda de la media
aritmtica.
Simtrica, cuando se distribuyen aproximadamente la misma cantidad de
datos a ambos lados de la media aritmtica.

los

Asimetra negativa, cuando la distribucin de los datos tiende a la derecha de la


media aritmtica.
Asimetra positiva

Eje de simetra
(media)

Simtrica

Eje de simetra
(media)

Asimetra negativa

Eje de simetra
(media)

La medida del Coeficiente de asimetra, se puede obtener mediante dos


formas de ecuaciones:

Coeficiente de Fisher:

Donde

Xi
ni

=
=
=

cada uno de los valores.


la media de la muestra.
la frecuencia de cada
valor

Coeficiente de Karl Pearson

Donde
M
d
s

=
=
=

media aritmtica.
Mediana.
desviacin tpica o
estndar.

Los resultados de esta ecuacin se interpretan:


Si la distribucin es simtrica, ambos ndices son iguales a 0; si es asimtrica a la derecha,
ambos son positivos; y si es asimtrica a la izquierda, ambos ndices son negativos.

A. CURTOSIS
La curtosis mide el grado de agudeza o achatamiento de una distribucin con relacin a la
regin central de la distribucin.
La curtosis presenta las siguientes formas:

Leptocrtica, cuando existe una gran concentracin.


Mesocrtica, cuando existe una concentracin normal.
Platicrtica, cuando existe una baja concentracin.

Leptocrtica

Mesocrtica

Platicrtica

La medida del Coeficiente de asimetra, se obtiene mediante la siguiente


ecuacin:

Donde
Xi

=
=

ni

cada uno de los valores.


la media de la muestra.
la frecuencia de cada valor.

Los resultados de esta frmula se interpretan:


Si este obtenido coeficiente es nulo, la distribucin recibe el nombre de
mesocrtica; Si el coeficiente es positivo, la distribucin se llama leptocrtica( ms
puntiaguda que la anterior); si el coeficiente es negativo, la distribucin se llama
platicrtica (ms achatada que la primera).
Cuando la distribucin de los datos cuenta con un coeficiente de asimetra (g1 =
0.5) y un coeficiente de Curtosis de (g2 = 0.5), se le denomina Curva Normal.
Este criterio es de suma importancia ya que para la mayora de los procedimientos
de la estadstica de inferencia se requiere que los datos se distribuyan normalmente.

Cmo obtenemos la Desviacin Tpica y Varianza en SPSS?


Seguimos los pasos:
1. Analizar
Estadsticos Descriptivos
Frecuencias

2. En Estadsticos, activamos Desviacin tpica y Varianza.

AutoEvaluacin:
1) Existen dos procedimientos bsicos que permiten describir las propiedades de
las distribuciones. Segn lo aprendido: Cules son estos dos procedimientos?
a)
b)

2)

Teniendo en cuenta el tema desarrollado De qu depende el tipo de anlisis


descriptivo que se hace a los datos registrados?

3)

Qu tipo de grficos permite obtener un anlisis de frecuencia en SPSS?

4)

Describe el tipo de medidas en las variables aceptables para cada tipo de


anlisis:
Frecuencia:
Descriptiva:

5)

Describe los pasos y/o requerimientos para determinar un diagrama de tallos y


hojas en SPSS:

Prctica del Tema


1. De una consulta obtenida de 10 encuestados sobre el grado de eficiencia de un
administrador se obtuvo lo siguiente:
Bueno
Regular
Psimo
Malo
Malo
Malo
Bueno
Bueno
Muy Bueno
Malo

a) Obtenga un grfico de barras de frecuencias por el grado de eficiencia


ordenado por recuento ascendentemente.
b) Determina el porcentaje acumulado de casos que precisan que el trabajo del
administrador es menos que regular?

2. De los siguientes datos:

a) Obtenga un diagrama de tallos y hojas de las notas solo del sexo masculino.

3. Del ejemplo 1 de este tema, con respecto al tiempo obtenido por cada uno de
los participantes:

2
1
1,
1,
1,

2
1,
2,
2,
1,

1,9
2,4
2,2
2,6
1,5

2
1
2,
2,
2,

a) Determina la desviacin estndar e interpreta su resultado obtenido.


b) Determina su asimetra y curtosis que le corresponde.

4. De los siguientes datos:

a)

Determine los cuartiles de las notas solo del sexo masculino. Interpreta el
resultado.

Referencias de inters sobre el Tema

Desviacin Estndar como interpretar su significado


http://www.youtube.com/watch?v=CdrhTnzGk9o

Diagrama de tallos y hojas


http://www.youtube.com/watch?v=I-FEVPbgv70

You might also like