Professional Documents
Culture Documents
Organizacin de datos
NDICE
1. Bases de datos.
1.1. Valores atpicos.
1.2. Valores faltantes.
2. Distribucin de frecuencias.
3. Grficas.
4.1. Variables cualitativas.
4.2. Variables cuantitativas.
1.1 Deteccin de errores y valores atpicos
2 Distribucin de frecuencias.
SPSS: Analizar > Estadsticos descriptivos > Frecuencias
3 Grficos de caja.
SPSS: Analizar > Estadsticos descriptivos > Explorar > Grficos
Soluciones:
a) Supresin de datos (las ms usual): Slo analizar los sujetos que
tengan los datos completos en las variables necesarias para un
anlisis. Si falta un valor en una variable que no est siendo utilizada
en un clculo, el sujeto s que es tenido en cuenta en el anlisis.
Son tablas resumen de los n datos recogidos. Se organizan por filas y columnas:
Filas Categoras de la variable que tienen que ser:
- Mutuamente excluyentes
- Exhaustivas.
Todos los elementos de la muestra han de estar recogidos en la
distribucin (exhaustiva) en una sola ocasin (excluyente).
Columnas Las ms habituales son las siguientes:
o Frecuencia absoluta (ni)
o Frecuencia absoluta acumulada (nai)
o Frecuencia relativa o proporcin (pi)
o Frecuencia relativa acumulada o Proporcin acumulada (pai)
o Porcentaje (Pi)
o Porcentaje acumulado (Pai)
Frecuencia absoluta (ni): Nmero de elementos de una muestra que tienen un
determinado valor de una variable. La suma de todas las frecuencias absolutas ha de
ser igual al n de la muestra.
Frecuencia absoluta acumulada (nai): Suma de las frecuencias absolutas de
una variable hasta la ltima categora. Nos indica la cantidad de elementos muestrales
con valores inferiores o iguales a una categora determinada.
ni pi Pi
1 Mujer 76 0.55 55
2 Hombre 61 0.45 45
137 1.00 100
Como se interpreta? El 55 % de la muestra es mujer
SPSS
Distribucin de frecuencias para variables semicuantitativas:
Se pueden acumular datos
54 0.999 99.9
45%
55%
Mujer
Hombre
Grficos de barras
Representacin grfica de los datos recogidos, mediante barras o
rectngulos. En el eje de abscisas (horizontal) se representan los niveles o
categoras de la variable, y en el eje de ordenadas (vertical) se representa la
frecuencia absoluta o relativa (proporcin) o el porcentaje.
Utilizado con variables cualitativas, semicuantitativas y cuantitativas
discretas.
En el caso de variables semicuantitativas o cuantitativas discretas se puede
hacer con los datos acumulados.
SPSS: Analizar > Estadsticos descriptivos > Frecuencias > Grficos > Grficos de barras +
porcentajes
G 100
80
n 60
e 40 Homes
r 20
Dones
e 0
Psicologia Arquitectura Fsica Filologia
Grau o Llicenciatura
Histogramas
Representacin grfica para variables cuantitativas continuas.
Esta representacin se puede hacer tambin con los datos acumulados.
A diferencia del diagrama de barras, los rectngulos estn juntos para
indicar continuidad.
SPSS: Analizar > Estadsticos descriptivos > Frecuencias > Grficos > Histogramas +
porcentajes
Grfico de tallo y hojas
SPSS: Analizar > Estadsticos descriptivos > Explorar > Grficos
Datos: 5.3 ; 5.4 ; 5.6 ; 5.9 ; 6.0 ; 6.0 ; 6.1 ; 6.2 ; 6.3 ; 6.3 ; 6.4 ; 6.4 ; 6.5 ; 6.5 ; 6.5 ; 6.6 ;
6.6 ; 6.6 ; 6.7 ; 6.7 ; 6.7 ; 6.7 ; 6.8 ; 6.8 ; 6.8 ; 6.9 ; 6.9 ; 7.0 ; 7.0 ; 7.1 ; 7.1 ; 7.1 ; 7.2 ; 7.2 ;
7.3 ; 7.4 ; 7.4 ; 7.6 ; 7.7 ; 7.8 ; 7.9 ; 8.2 ; 8.4 ; 8.5 ; 8.6
Cmo se construye o dibuja?
1) Separamos cada OBSERVACIN (dato) en TALLO
(primera parte del dato) y la HOJA (segunda parte del dato).
5 34
5* 69
6 00123344
6* 555666777788899
7 0011122344
7* 6789
8 24
8* 56
SPSS
2,00 5 . 34
2,00 5 . 69
8,00 6 . 00123344
15,00 6 . 555666777788899
10,00 7 . 0011122344
4,00 7 . 6789
2,00 8 . 24
2,00 Extremes (>=8,5)