Professional Documents
Culture Documents
MEDIDAS DE RESUMEN
ETAPA DE ANALISIS E
INTERPRETACIN
recc
recc
Fuentes de informacin
Cuando se recoge informacin es posible que los datos ya
hayan sido obtenidos de las unidades de observacin y
publicados o registrados por otros, o que los datos se tengan
que obtener directamente de las unidades de observacin en
forma personal. Las fuentes de informacin son de dos
clases.
Fuente primaria: Si la informacin se obtiene directamente de
la misma persona o entidad, utilizando ciertas tcnicas
(entrevista, cuestionario, etc.).
Ej..:
- Aplicar un test a un grupo de estudiantes para determinar el
nivel intelectual.
recc
FUENTES:
Llevar a cabo una encuesta para conocer la situacin socioeconmica de los pobladores de la comunidad x.
- Observar la reaccin de un grupo de personas con
determinada adiccin.
- Fuente secundaria:
Si la informacin a obtener, ya ha sido recopilada por otras
personas o instituciones.
Este tipo de informacin la encontramos en los informes
estadsticos de las instituciones pblicas o privadas. Ej.. INEC
-
recc
Sistemas de recoleccin:
Los datos pueden ser recogidos a travs de:
Registros:
Mediante los registros se anotan los datos en forma regular,
permanente y obligatoria, obteniendo la informacin total y
sistemtica de los hechos ocurridos:
Ej.:
Registro de contribuyentes.
Registro electoral
Registro civil, etc.
recc
Sistemas de recoleccin:
Encuestas:
Es la recoleccin de datos en forma temporal y pueden ser:
Censal: Cuando abarca a toda la poblacin en estudio.
Ej..
Censo de poblacin y vivienda de una ciudad o pas.
Muestral: Cuando abarca una parte de la poblacin en
estudio.
Ej.:
Encuesta de nutricin.
Encuesta de preferencia de consumo, etc.
recc
Tcnicas de recoleccin:
Existen muchos mtodos para recoger la informacin, entre los
cuales el investigador debe elegir los que se adapten a las
circunstancias o al tipo de investigacin, Entre las tcnicas ms
usadas tenemos:
Cuestionario.
Observacin.
Entrevista
Test.
Anlisis de contenido, etc.
recc
10
recc
11
recc
12
recc
13
Variables Aleatorias
A los diferentes fenmenos o
caractersticas que se miden en un
estudio estadstico se les denomina
variables aleatorias.
La diferencia entre variables aleatorias
y variables algebraicas es que nos
interesa saber la probabilidad de
ocurrencia de sus posibles valores
antes de que estos valores sean
observados.
recc
14
Tipos de Datos
Cualitativos:
Cuantitativos:
15
Discretos:
Si el nmero de posibles valores que puede tomar es
contable (nmero naturales).
Generalmente resultan de un proceso de conteo.
Ej.
Nmero de facturas
Nmero de estudiantes.
Nmero de nios nacidos vivos.
Nmero de ahorristas, etc.
recc
16
Continuos:
Si sus posibles valores son susceptibles de ser
medidos, pueden asumir valores decimales.
Generalmente resultan de un proceso de medicin.
Ej.
Peso
Temperatura
Edad en aos, meses y das, etc.
recc
17
Escalas de Medicin
recc
18
Escalas de Medicin
a) Medidas por Escala Nominal:
recc
19
Escalas de Medicin
b) Medidas por Escala Ordinal:
recc
20
Escalas de Medicin
c) Medidas por Escala de Intervalo:
21
Escalas de Medicin
d) Medidas por Escala de Razn o proporcin:
Datos que cumplen con las caractersticas necesarias para medirse con
una escala de intervalo, y que adems posee un cero natural.
Tener un cero natural implica que el punto cero no es arbitrario y
corresponde a una total ausencia del atributo en estudio. Ej.
Edad: Un estudiante puede tener 28 aos de edad, pero para llegar a
esa edad necesariamente ha tenido que partir de cero aos.
Estatura.
Peso.
Tiempo de reaccin mental.
Los datos que segn su naturaleza son cualitativos, por su medicin
pertenecen a la escala nominal y las ordinales a escala ordinal. Los
datos que por su naturaleza son cuantitativos, pertenecen a la escala
de intervalo o razn.
recc
22
TABLAS DE FRECUENCIA
Tablas de Frecuencia
24
Tablas de Frecuencia
Datos Cualitativos
Estado Civil
(clase)
Nmero de
ocurrencias
(frecuencia)
Porcentaje
(frecuencia
relativa)
Soltero
22
22 %
Casado
45
45 %
Divorciado
20
20 %
Viudo
8%
Otro
5%
Total
100 personas
100 %
recc
25
Tablas de Frecuencia
Datos Cualitativos
fi
fri
n
recc
26
Tablas de Frecuencia
Datos Cuantitativos
Se construyen intervalos de clase:
recc
27
Tablas de Frecuencia
Datos Cuantitativos
Nmero de Intervalos:
recc
28
Tablas de Frecuencia
Datos Cuantitativos
Amplitud de Intervalos:
rango unidad
c
num.intervalos
recc
29
Tablas de Frecuencia
Datos Cuantitativos
LI i LI i 1 c
LS1 LI 2 unidad
30
Tablas de Frecuencia
Datos Cuantitativos
LIi LSi
Xi
2
recc
31
Tablas de Frecuencia
Datos Cualitativos y Cuantitativos
fa i f j
j1
recc
32
Tablas de Frecuencia
Datos Cualitativos y Cuantitativos
fa i
fra i
n
recc
33
Herramientas
Complementos
Palomeo Herramientas para Anlisis
recc
34
Herramientas
Anlisis de Datos
Histograma:
recc
35
Ejemplo
Un
19
25
19
26
16
19
27
27
25
23
22
17
12
20
15
21
23
26
14
18
25
23
24
21
recc
36
Se
pide:
a) ordenar la informacin en una tabla de
distribucin de frecuencias.
b) interpretar algunos valores de
frecuencias halladas.
Solucin:
a)
recc
37
Clculo
del Rango:
R X mx X mn
R 27 10 17
Nmero de clases:
K 1 3.33LogN
K 1 3.33Log 25
K 1 3.33 (1.40)
K 1 4.62 5.62
Necesariamente se debe redondear al
entero
K=6
recc
38
R 17
2.83
K 6
Ii
fi
Fi
hi
Hi
hi(%)
Hi(%)
10-12
0.08
0.08
08
08
13-15
0.08
0.16
08
16
16-18
0.12
0.28
12
28
19-21
13
0.24
0.52
24
52
22-24
18
0.20
0.72
20
72
25-27
25
0.28
1.00
28
100
25
h 1.00
i
recc
h 100
i
39
CONCLUSIONES:
b) f6 7 : 7 de los 25 nios, ven televisin entre 16 y 18
recc
40
L
Los siguientes datos se refieren al nmero de libros de Estadstica
consultado por 50 estudiantes para rendir el examen parcial de la
asignatura:
2
recc
41
Se
pide:
R X mx X mn
R 60 6
recc
42
K 1 3.33LogN
K 1 3.33Log 50
K 1 3.33(1.70)
K 1 5.61 6.61
Necesariamente redondear al entero K 7
recc
43
Amplitud
6
0.86
7
del intervalo:
Ii
fi
Fi
Hi
Hi
hi(%)
Hi(%)
13
13
0.26
0.26
26
26
11
24
0.22
0.48
22
48
33
0.18
0.66
18
66
39
0.12
0.78
12
78
46
0.14
0.92
14
92
49
0.06
0.98
06
98
50
0.02
1.00
02
100
1.00
100
50
recc
44
b)
recc
45
Estado Civil
Hombre
Mujer
Soltero
10
12
22
Casado
22
23
45
Divorciado
13
20
Viudo
Otro
45
55
100 personas
recc
46
TCNICAS GRFICAS
Tcnicas Grficas
Pie
Barras
Histograma
Polgono
recc
48
49
recc
50
categoras
marcas de clase
recc
51
recc
52
recc
53
categoras
marcas de clase
54
Histograma
55
Histograma
recc
56
Histograma
En Excel (Opcin 1)
recc
57
Histograma
En Excel (Opcin 2)
Herramientas
Anlisis de Datos
Histograma:
58
Polgono
recc
59
Polgono
60
Polgono
recc
61
Polgono
En Excel (Opcin 1)
recc
62
Polgono
En Excel (Opcin 2)
63
TCNICAS NUMRICAS
Tcnicas Numricas
Tendencia Central
Dispersin
Forma
Medidas de Posicin
recc
65
Tcnicas Numricas
En Excel Opcin 1
Herramientas
Anlisis de Datos
Estadstica Descriptiva:
recc
66
Tendencia Central
Media Aritmtica
Mediana
Moda
Media Geomtrica
Media aritmtica ponderada
recc
67
Tendencia Central
Media Aritmtica
Agrupados
X=
X
i 1
X=
X * f
i 1
f i marca de clase
68
fi
Xi
X i fi
0 1.9
2 3.9
4 5.9
6 7.9
8 9.9
15
26
20
13
6
0.95
2.95
4.95
6.95
8.95
Entonces:
x.f
x
f
i
334
x
4 .2
80
Interpretacin:
69
Ventajas:
Desventajas:
Como incluye todos los datos, puede ser afectado por valores extremos.
Cuando los datos agrupados tienen clases abiertas en los extremos, no
es recomendable calcular la media aritmtica.
recc
70
Tendencia Central
Mediana
Se define como el valor central.
Ao de
estudio
No
Primero
25
segundo
Tercero
14
6
recc
Cuarto
9
Quinto
2
71
Solucin:
- Se halla la frecuencia acumulada.
- 56/2 = 28
- El valor que contiene a 28 es 39
- Entonces la Me = Segundo de secundaria.
Interpretacin:
La mitad de estudiantes repetidores lo hacen en segundo de
secundaria.
La otra mitad lo hacen como mximo hasta segundo de
secundaria.
En
72
f f
2
f me
Me Li
recc
73
De donde:
Me = mediana.
Li Lmite inferior del intervalo de la clase mediana
f / 2 = Semisuma de las frecuencias absolutas simples
mediana.
f Frecuencia de la clase mediana
me
recc
74
Ejemplo:
Ii
fi
Xi
Xifi
0 1.9
2 3.9
4 5.9
6 7.9
8 9.9
15
26
20
13
6
0.95
2.95
4.95
6.95
8.95
recc
75
Ventajas
recc
76
Tendencia Central
Moda
recc
77
FRMULA
Para datos agrupados:
d *w
Mo Li
d d
De donde:
Li = Lmite inferior de la clase modal.
d = diferencia de la frecuencia de la clase modal y la frecuencia de la
clase anterior a ella.
d = diferencia de la frecuencia de la clase modal y la frecuencia
anterior a ella.
Ii
fi
Xi
Xifi
0 1.9
2 3.9
4 5.9
6 7.9
8 9.9
15
26
20
13
6
0.95
2.95
4.95
6.95
8.95
recc
78
Desarrollo
La clase modal se ubica en aquella clase que tiene la mayor frecuencia (26).
d= 26 15 = 11
d = 26 20 = 6.
Otros datos Li = 2 ; w = 2
Se aplica la frmula
Respuesta Mo = 3.3 Interpretacin: Las familias en estudio consumen con
mayor frecuencia 3.3 kg/semana de carne vacuno.
VENTAJAS:
Al igual que la mediana, no est afectada por valores extremos.
Puede usarse cuando los datos agrupados tienen clases abierta en los
extremos
Se usa tambin para variables que pertenecen a la escala nominal.
recc
79
DESVENTAJAS
recc
80
Ejemplo
48
115
112
95
98
145
115
96
90
51
38
52
132
96
89
112
51
63
104
66
36
98
134
87
63
109
91
109
103
60
45
120
105
78
54
53
61
46
56
62
48
125
108
69
49
57
71
63
139
recc
81
recc
82
recc
83
recc
84
recc
85
Tendencia Central
Media Geomtrica
Es el crecimiento promedio.
Se obtiene a travs de la frmula
De donde:
fi
f1
f2
fi
xg
x1 . x2 ...xi
recc
86
Ejemplo
Nmero de centros
1
2
3
4
5
0 19
20 39
40 59
60 79
80 99
10
14
17
8
6
TOTAL
55
x g 55 (9.5)10 29.5
14
x g 36.3 %
87
Tendencia Central
Media Geomtrica
recc
88
Tendencia Central
Media Aritmtica Ponderada
Xp=
w X
i
i 1
n
w
i 1
recc
89
Medidas de dispersin
Rango
Desviacin Media
Varianza
Desviacin Estndar
Coeficiente de Variacin
recc
90
Dispersin
Rango
recc
91
Dispersin
Desviacin Media Absoluta
DM =
X X
i 1
92
Dispersin
Varianza poblacional
2 = i 1
n
Es un estimador sesgado. Funciona solo
para muestras grandes.
En Excel Opcin 2: funcin VARP
recc
93
Dispersin
Varianza muestral
S2 =
X X
i 1
n -1
94
Dispersin
Desviacin Estndar
recc
95
Dispersin
Desviacin Estndar
S= S
96
Dispersin
Desviacin Estndar
Teorema de Chebyshev
Regla Emprica
recc
97
EJEMPLO
.
45
48
115
112
95
98
145
115
96
90
51
38
52
132
96
89
112
51
63
104
66
36
98
134
87
63
109
91
109
103
60
45
120
105
78
54
53
61
46
56
62
48
125
108
69
49
57
71
63
139
recc
98
X 2S
X 3S
recc
99
X S
recc
100
X 2S
X 3S
recc
101
Dispersin
Coeficiente de Variacin
CV = x 100
X
recc
102
Forma
Sesgo
Curtosis
recc
103
Forma
Sesgo
104
Forma
Sesgo
Sesgo
=0
>0
La distribucin tiene
positivo o a la derecha.
<0
sesgo
105
Forma
Curtosis
recc
106
Forma
Curtosis
recc
107
Forma
Curtosis
Curtosis
=3
Mesocrtica
>3
Leptocrtica
<3
Platocrtica
recc
108
Medidas de Posicin
109
FRMULAS:
i fi
fi 1
4
Q1 Li
w
f Qi
La
recc
110
EJEMPLO:
Hallar
2 cuartiles, 3 deciles y 5
percentiles.
45
48
115
112
95
98
145
115
96
90
51
38
52
132
96
89
112
51
63
104
66
36
98
134
87
63
109
91
109
103
60
45
120
105
78
54
53
61
46
56
62
48
125
108
69
49
57
71
63
139
recc
111
GRACIAS
recc
112