You are on page 1of 112

HERRAMIENTAS DE DESCRIPCIN ESTADSTICA

Dr. Roberto Carrillo Mg.


DOCENTE
MATEMTICA F.C.A

ETAPA DE ANLISIS E INTERPRETACIN DE DATOS

MEDIDAS DE RESUMEN

ETAPA DE ANALISIS E
INTERPRETACIN

recc

ETAPA DE RECOLECCIN DE DATOS


En esta etapa empieza la ejecucin de la investigacin, es decir;
el investigador pone en marcha la etapa de Planeamiento.
A travs de la recoleccin, se obtienen los datos que se requieren
para alcanzar los objetivos y demostrar las hiptesis de la
investigacin. La obtencin de datos se realiza teniendo en
cuenta lo siguiente:

recc

Fuentes de informacin
Cuando se recoge informacin es posible que los datos ya
hayan sido obtenidos de las unidades de observacin y
publicados o registrados por otros, o que los datos se tengan
que obtener directamente de las unidades de observacin en
forma personal. Las fuentes de informacin son de dos
clases.
Fuente primaria: Si la informacin se obtiene directamente de
la misma persona o entidad, utilizando ciertas tcnicas
(entrevista, cuestionario, etc.).
Ej..:
- Aplicar un test a un grupo de estudiantes para determinar el
nivel intelectual.

recc

FUENTES:
Llevar a cabo una encuesta para conocer la situacin socioeconmica de los pobladores de la comunidad x.
- Observar la reaccin de un grupo de personas con
determinada adiccin.
- Fuente secundaria:
Si la informacin a obtener, ya ha sido recopilada por otras
personas o instituciones.
Este tipo de informacin la encontramos en los informes
estadsticos de las instituciones pblicas o privadas. Ej.. INEC
-

recc

Sistemas de recoleccin:
Los datos pueden ser recogidos a travs de:
Registros:
Mediante los registros se anotan los datos en forma regular,
permanente y obligatoria, obteniendo la informacin total y
sistemtica de los hechos ocurridos:
Ej.:
Registro de contribuyentes.
Registro electoral
Registro civil, etc.

recc

Sistemas de recoleccin:
Encuestas:
Es la recoleccin de datos en forma temporal y pueden ser:
Censal: Cuando abarca a toda la poblacin en estudio.
Ej..
Censo de poblacin y vivienda de una ciudad o pas.
Muestral: Cuando abarca una parte de la poblacin en
estudio.
Ej.:
Encuesta de nutricin.
Encuesta de preferencia de consumo, etc.
recc

Tcnicas de recoleccin:
Existen muchos mtodos para recoger la informacin, entre los
cuales el investigador debe elegir los que se adapten a las
circunstancias o al tipo de investigacin, Entre las tcnicas ms
usadas tenemos:
Cuestionario.
Observacin.
Entrevista
Test.
Anlisis de contenido, etc.

recc

ETAPA DE ELABORACIN DE DATOS


En la etapa de recoleccin se obtiene gran cantidad de datos, los
mismos que se encuentran en formularios, cuestionarios, etc., y
totalmente desordenados. En esta etapa se trata de organizar dichos
datos y para ello es necesario cumplir dos actividades: Revisin o
crtica y clasificacin de datos.
Revisin o critica de datos.
La revisin tiene por objeto: a) determinar si se han recibido todos los
formularios o al menos una proporcin que sea suficiente para no
invalidar las conclusiones que se podran hacer; b) verificar que estn
registradas todas las respuestas recogidas y c) localizar posibles
incongruencias en la informacin proporcionada. La revisin de datos
constituye lo se ha dado en llamar control de calidad de la
informacin.
recc

ETAPA DE ELABORACIN DE DATOS


Entre las posibles causas del envi incompleto de formularios tenemos:
- Formularios o cuestionarios muy extensos.
- Ausencia de instrucciones claras.
- Bajo nivel educativo del informante.
- Dotacin insuficiente o inoportuna de los formularios o cuestionarios.
Si no se han registrado todas las respuestas requeridas, puede deberse a:
- Formularios o cuestionarios mal diseados.
- Negligencia del entrevistador ya que no recibi adiestramiento.
- Informante se niega a contestar la pregunta.
Las incongruencias provienen de respuestas, cuyos valores quedan fuera de
lo considerado como posible o probable. Por ejemplo, si se indica que una
persona tiene 5 aos de edad y luego aparece su grado de instruccin como
secundaria, es evidente que existe incongruencia.
recc

10

Las causas de incongruencias pueden ser:


Personal poco calificado e irresponsable, preguntas confusas en el
formulario que por su extensin provoca fatiga, informante poco
motivado que da como respuesta lo primero que se le ocurre para salir
del paso o demasiado complaciente, pues piensa que negar o afirmar
determinada cosa va a ser recibido con beneplcito por el
encuestador
Clasificacin de datos.
La clasificacin tiene por objeto organizar los datos en categoras, pero
teniendo en cuenta la escala de medicin de las variables:
Clasificacin de los datos medidos a nivel nominal u ordinal.

recc

11

Importancia del estudio estadstico

Lo ms importante no est en lo que la


muestra nos dice sobre sus miembros
especficos, sino en cmo hacer
inferencias sobre los miembros de la
poblacin que no fueron incluidos en la
muestra.

recc

12

Importancia del estudio estadstico


Un estadstico primero disea la
muestra y el experimento para
minimizar los costos de obtener la
informacin.
Despus busca el mejor mtodo para
realizar la inferencia segn el muestreo
dado.
Finalmente mide la bondad de la
inferencia.

recc

13

Variables Aleatorias
A los diferentes fenmenos o
caractersticas que se miden en un
estudio estadstico se les denomina
variables aleatorias.
La diferencia entre variables aleatorias
y variables algebraicas es que nos
interesa saber la probabilidad de
ocurrencia de sus posibles valores
antes de que estos valores sean
observados.

recc

14

Tipos de Datos

Cualitativos:

Arrojan respuesta categricas.


Miden cualidades
Se les puede asignar despus un valor
numrico (codificarlas)

Cuantitativos:

Producen respuestas numricas.


Miden cantidades
Podemos tratar un dato cuantitativo como
cualitativo (categorizando)
recc

15

Tipos de Datos Cuantitativos

Discretos:
Si el nmero de posibles valores que puede tomar es
contable (nmero naturales).
Generalmente resultan de un proceso de conteo.
Ej.
Nmero de facturas
Nmero de estudiantes.
Nmero de nios nacidos vivos.
Nmero de ahorristas, etc.

recc

16

Tipos de Datos Cuantitativos

Continuos:
Si sus posibles valores son susceptibles de ser
medidos, pueden asumir valores decimales.
Generalmente resultan de un proceso de medicin.
Ej.
Peso
Temperatura
Edad en aos, meses y das, etc.

recc

17

Escalas de Medicin

Los datos que se asocian con las


variables aleatorias pueden medirse
con diferentes escalas dependiendo
del tipo de dato que se trate. Las
distintas medidas son:

recc

18

Escalas de Medicin
a) Medidas por Escala Nominal:

Los datos de tipo cualitativo se agrupan en varias categoras sin


orden, En este nivel de medicin, las categoras slo se nombran o se
enumeran pero no se comparan.
En este nivel los datos, pueden ser:
Dicotmicas.- Si tienen dos categoras o clases, ej.
SEXO: Masculino femenino
Tricotmicas: Si tienen tres categoras o clases, ej.
RAZA: Blanca Negra Amarilla
Politmicas o multitmicas.- Si tienen ms de tres categoras, ej.
ESTADO CIVIL: Soltero Casado Viudo Divorciado.

recc

19

Escalas de Medicin
b) Medidas por Escala Ordinal:

Los datos de tipo cualitativo guardan un orden natural.


Son datos que pueden medirse con una escala nominal, en donde
adems existe un orden natural entre las categoras.
Se pueden realizar operaciones aritmticas con los nmeros
asignados a las categoras. El resultado no indica nada.
Ej.
NIVEL SOCIO ECONMICO: Alto Medio Bajo.

recc

20

Escalas de Medicin
c) Medidas por Escala de Intervalo:

Los datos que se utilizan son cuantitativos y guardan las caractersticas


descritas en las medidas ordinales.
No existe un cero natural, es decir, el cero no implica necesariamente la
ausencia del atributo en estudio.
Implican la asignacin de nmeros de modo que a iguales diferencias
entre los grados del atributo, correspondan iguales diferencias entre los
valores numricos. Ej.:
Temperatura: Un paciente puede llegar a tener 39 C de fiebre, pero ello
no significa que su grado de temperatura haya tenido que partir de 0 C.
Rendimiento escolar: Un estudiante puede obtener 7.5 en algebra; pero
ello no nos lleca a pensar que necesariamente para llegar a esa
calificacin haya tenido que obtener primero nota cero.
Coeficiente de inteligencia.
Presin arterial.
recc

21

Escalas de Medicin
d) Medidas por Escala de Razn o proporcin:

Datos que cumplen con las caractersticas necesarias para medirse con
una escala de intervalo, y que adems posee un cero natural.
Tener un cero natural implica que el punto cero no es arbitrario y
corresponde a una total ausencia del atributo en estudio. Ej.
Edad: Un estudiante puede tener 28 aos de edad, pero para llegar a
esa edad necesariamente ha tenido que partir de cero aos.
Estatura.
Peso.
Tiempo de reaccin mental.
Los datos que segn su naturaleza son cualitativos, por su medicin
pertenecen a la escala nominal y las ordinales a escala ordinal. Los
datos que por su naturaleza son cuantitativos, pertenecen a la escala
de intervalo o razn.
recc

22

TABLAS DE FRECUENCIA

Tablas de Frecuencia

Los datos recopilados en la muestra se


pueden organizar en Tablas de
Frecuencias.
Estas tablas muestran:

las clases o categoras de respuesta de


donde se obtuvieron los datos (o los
intervalos de clase si los datos son
cuantitativos)
El nmero o proporcin de veces que la
clase se encontr en los datos
recopilados.
recc

24

Tablas de Frecuencia
Datos Cualitativos
Estado Civil
(clase)

Nmero de
ocurrencias
(frecuencia)

Porcentaje
(frecuencia
relativa)

Soltero

22

22 %

Casado

45

45 %

Divorciado

20

20 %

Viudo

8%

Otro

5%

Total

100 personas

100 %

recc

25

Tablas de Frecuencia
Datos Cualitativos

Frecuencia (f): Resulta de contar el


nmero de observaciones que "entran" en
una clase
Frecuencia Relativa (fr): Es la proporcin
de observaciones que "entran" en una clase:

fi
fri
n
recc

26

Tablas de Frecuencia
Datos Cuantitativos
Se construyen intervalos de clase:

Rango: Es la diferencia que existe entre el


valor mas grande y el mas pequeo.

rango max min

recc

27

Tablas de Frecuencia
Datos Cuantitativos

Nmero de Intervalos:

Se aconsejan no menos de 6 ni mas de 15


Para aproximarlo se puede utilizar de manera
alternativa:

Raz de n: el resultado se redondea al siguiente


entero.
Regla de Sturges:
num.de intervalos o de clases = 1 + 3.3 (log n)

recc

28

Tablas de Frecuencia
Datos Cuantitativos

Amplitud de Intervalos:

Se calcula aplicando la frmula:

rango unidad
c
num.intervalos

La unidad toma valores de acuerdo a los valores de


la variable:

Si la variable toma valores enteros, unidad=1


Si la variable toma valores con decimales, unidad=0.1
Si la variable toma valores con centsimas, unidad=0.01
Si la variable toma valores con milsimas, unidad=0.001
Si la variable toma valores con diezmilsimas,
unidad=0.0001
etc.

recc

29

Tablas de Frecuencia
Datos Cuantitativos

Lmites de Clase o Establecidos:

Lmite inferior: es el valor inicial del intervalo


de clase.
LI min
1

LI i LI i 1 c

Lmite superior: es el valor final del intervalo


de clase.

LS1 LI 2 unidad

LSi LSi 1 c LIi 1 unidad


recc

30

Tablas de Frecuencia
Datos Cuantitativos

Marca de Clase: Es el punto medio del


intervalo de clase. Se usa en los mtodos
estadsticos como valor estimado de las
observaciones que cayeron dentro de ese
intervalo

LIi LSi
Xi
2

recc

31

Tablas de Frecuencia
Datos Cualitativos y Cuantitativos

Frecuencia Acumulada (fa): Es el nmero de


observaciones acumuladas hasta la clase de
referencia:
i

fa i f j
j1

recc

32

Tablas de Frecuencia
Datos Cualitativos y Cuantitativos

Frecuencia Relativa Acumulada (fra): es la


proporcin de observaciones acumuladas
hasta la clase de referencia:

fa i
fra i
n

recc

33

Tablas de Frecuencia en Excel


1.

Cargar el mdulo de Anlisis de Datos:

Herramientas
Complementos
Palomeo Herramientas para Anlisis

recc

34

Tablas de Frecuencia en Excel


2.

Acceso la subrutina Histograma de mdulo


de Anlisis de Datos:

Herramientas
Anlisis de Datos
Histograma:

Selecciono a los datos de la muestra como rango


de entrada
OPCIONAL: Selecciono a los lmites superiores
como rango de clases

recc

35

Ejemplo
Un

investigador social desea determinar en la


comunidad X, el nmero de horas semanales
que dedican los nios de 6 aos de edad, a ver
televisin. Una muestra de 25 nios, arroj los
siguientes resultados (en nmero de horas
semanales).
10

19

25

19

26

16

19

27

27

25

23

22

17

12

20

15

21

23

26

14

18

25

23

24

21

recc

36

Se

pide:
a) ordenar la informacin en una tabla de
distribucin de frecuencias.
b) interpretar algunos valores de
frecuencias halladas.
Solucin:
a)

Para ordenar la informacin, utilizaremos


la regla de Sturges.

recc

37

Clculo

del Rango:

R X mx X mn

R 27 10 17
Nmero de clases:
K 1 3.33LogN
K 1 3.33Log 25
K 1 3.33 (1.40)
K 1 4.62 5.62
Necesariamente se debe redondear al
entero

K=6
recc

38

Amplitud del intervalo:


W

R 17

2.83
K 6

Redondearemos al entero porque la informacin horas


semanales est en nmeros enteros. W 3
Formacin de intervalos y frecuencias
I

Ii

fi

Fi

hi

Hi

hi(%)

Hi(%)

10-12

0.08

0.08

08

08

13-15

0.08

0.16

08

16

16-18

0.12

0.28

12

28

19-21

13

0.24

0.52

24

52

22-24

18

0.20

0.72

20

72

25-27

25

0.28

1.00

28

100

25

h 1.00
i
recc

h 100
i

39

CONCLUSIONES:
b) f6 7 : 7 de los 25 nios, ven televisin entre 16 y 18

horas/semanales, o sea, el 28% de los nios est la mayor


cantidad de tiempo viendo televisin.
f1 2 : 2 nios, que equivale al 8%, ven televisin entre
10 y 12 horas/semanales.
H4 52% : El 52% de los nios en esa comunidad ve
televisin entre 10 y 21 horas/semanales.

recc

40

L
Los siguientes datos se refieren al nmero de libros de Estadstica
consultado por 50 estudiantes para rendir el examen parcial de la
asignatura:
2

recc

41

Se

pide:

a) Ordenar los datos en un cuadro de frecuencias.


b) Qu porcentaje de alumnos no consult ningn examen para
el examen parcial?
c) Qu porcentaje de alumnos consult entre 5 y 6 libros?
Solucin:
Para ordenar la informacin utilizaremos la regla de Sturges.
Clculo del Rango:

R X mx X mn

R 60 6
recc

42

Clculo del nmero de clases:

K 1 3.33LogN
K 1 3.33Log 50
K 1 3.33(1.70)
K 1 5.61 6.61
Necesariamente redondear al entero K 7

recc

43

Amplitud

6
0.86
7

del intervalo:

Redondear al entero, porque la informacin


est en nmeros enteros.
Formacin de los intervalos y frecuencias
W

Ii

fi

Fi

Hi

Hi

hi(%)

Hi(%)

13

13

0.26

0.26

26

26

11

24

0.22

0.48

22

48

33

0.18

0.66

18

66

39

0.12

0.78

12

78

46

0.14

0.92

14

92

49

0.06

0.98

06

98

50

0.02

1.00

02

100

1.00

100

50

recc

44

b)

El 26 de los estudiantes no consult


ningn libro de Estadstica ( h1 26 )
c) El 8% de los estudiantes consult
entre 5 y 6 libros de Estadstica
( h6 h7 8 ).

recc

45

Tablas de Frecuencia Bivariadas

Se tabulan dos variables en una sola tabla.


Tambin se llaman tablas de cruce o de
contingencia.

Estado Civil

Hombre

Mujer

Total por Estado Civil

Soltero

10

12

22

Casado

22

23

45

Divorciado

13

20

Viudo

Otro

45

55

100 personas

Total por Sexo

recc

46

TCNICAS GRFICAS

Tcnicas Grficas

Graficamos el contenido de la tabla de


frecuencia.
Las ms importantes grficas:

Pie
Barras
Histograma
Polgono

recc

48

Grficas de Pie o de Sectores

Se usa con datos cualitativos o cuantitativos.


A travs de una regla de tres , un crculo se
divide en sectores.

gradosi fri 360

Cada rebanada representa la proporcin


de datos contenidos en una clase de la tabla
de frecuencia.
recc

49

Grficas de Pie o de Sectores

recc

50

Grficas de Pie o de Sectores


en Excel:

Selecciono la frecuencia de la tabla


Llamo al asistente para grficas

Selecciono una grfica circular


Coloco los rtulos de categora:

categoras
marcas de clase

Coloco los rtulos de datos en porcentaje

recc

51

Grficas de Columnas o Barras

Se usa con datos cualitativos o cuantitativos.


Se puede hacer con la frecuencia o con la
frecuencia relativa.
Se grafican rectngulos sobre un eje
cartesiano en donde cada rectngulo
representa a cada clase en la tabla de
frecuencia.

recc

52

Grficas de Columnas o Barras

recc

53

Grficas de Columnas o Barras


En Excel:

Selecciono la frecuencia o frecuencia


relativa de la tabla
Llamo al asistente para grficas

Selecciono una grfica de columnas o de


barras
Coloco los rtulos de categora:

categoras
marcas de clase

Coloco los rtulos de datos


recc

54

Histograma

Es exclusiva para datos cuantitativos.


Se puede hacer con la frecuencia o con la
frecuencia relativa.
Se grafican rectngulos sobre un eje
cartesiano en donde el rea de cada
rectngulo representa a cada intervalo de
clase en la tabla de frecuencia.
Sirve para comparar las magnitudes
representadas en cada intervalo de clase.
recc

55

Histograma

recc

56

Histograma
En Excel (Opcin 1)

Selecciono la frecuencia de la tabla


Llamo al asistente para grficas

Selecciono una grfica de columnas


Coloco los rtulos de categora: marcas de
clase
Coloco los rtulos de datos
Reduzco el ancho del rango a cero.

NOTA: Este procedimiento es vlido solo cuando la amplitud es la misma


para cualquier intervalo de clase.

recc

57

Histograma
En Excel (Opcin 2)

Acceso la subrutina Histograma de mdulo de


Anlisis de Datos:

Herramientas
Anlisis de Datos
Histograma:

Selecciono a los datos de la muestra como rango de


entrada
OPCIONAL: Selecciono a los lmites superiores como
rango de clases
Selecciono la opcin Crear Grfico

Ya en la grfica, reduzco la distancia entre barras a


cero.

NOTA: Este procedimiento es vlido solo cuando la amplitud es la misma para


cualquier intervalo de clase.
recc

58

Polgono

Es exclusiva para datos cuantitativos.


Se puede hacer con la frecuencia o con la
frecuencia relativa.
Es una grfica de punto y lnea sobre el eje
cartesiano.
Sirve para observar la forma de la
distribucin de frecuencias.

recc

59

Polgono

Lo importante en el polgono es mantener el


rea bajo la curva igual al rea acumulada
en el histograma.

Aado una marca de clase anterior a la


primera (restndole la amplitud)
Aado una marca de clase posterior a la
ltima (sumndole la amplitud)
Les adjudico frecuencia igual a cero a estas
marcas de clase adicionales
Grafico utilizando estas marcas de clase
adicionales.
recc

60

Polgono

recc

61

Polgono
En Excel (Opcin 1)

Selecciono la frecuencia o frecuencia


relativa de la tabla (ampliada)
Llamo al asistente para grficas

Selecciono una grfica de dispersin XY, que


muestre los puntos unidos por lneas.
Coloco las marcas de clase como rtulos de
categora
Coloco los rtulos de datos

NOTA: Este procedimiento es vlido solo cuando la amplitud es la misma


para cualquier intervalo de clase.

recc

62

Polgono
En Excel (Opcin 2)

Realizo el histograma de frecuencias a


travs de la subrutina de Anlisis de Datos
con la tabla ampliada.
Ya en la grfica, cambio el tipo de grfica a:
Dispersin XY.

NOTA: Este procedimiento es vlido solo cuando la amplitud es la misma


para cualquier intervalo de clase.
recc

63

TCNICAS NUMRICAS

Tcnicas Numricas

Estos son los estadsticos muestrales.


Calculamos valores que resumen las
caractersticas de los datos en la muestra:

Tendencia Central
Dispersin
Forma
Medidas de Posicin

recc

65

Tcnicas Numricas
En Excel Opcin 1

Acceso la subrutina Estadstica Descriptiva


del mdulo de Anlisis de Datos:

Herramientas
Anlisis de Datos
Estadstica Descriptiva:

Selecciono a los datos de la muestra como rango


de entrada
Selecciono la opcin Resumen de Estadsticas

recc

66

Tendencia Central

Las principales medidas son:

Media Aritmtica
Mediana
Moda
Media Geomtrica
Media aritmtica ponderada

recc

67

Tendencia Central
Media Aritmtica

La media aritmtica poblacional se denota como o x


La media aritmtica muestral es el promedio de los datos.
No agrupados

Agrupados

X=

X
i 1

X=

X * f
i 1

f i marca de clase

En Excel Opcin 2: funcin PROMEDIO


recc

68

EJEMPLO: El consumo semanal de carne vacuno en una


muestra de 80 familias en la comunidad x, es como sigue
Ii

fi

Xi

X i fi

0 1.9
2 3.9
4 5.9
6 7.9
8 9.9

15
26
20
13
6

0.95
2.95
4.95
6.95
8.95

15* 0.95 = 14.25


76.70
99
90.35
53.70

Entonces:

x.f

x
f
i

334
x
4 .2
80

Interpretacin:

La muestra de familias de la comunidad, consume en


promedio semanal 4.2 kg. Semanal de carne vacuno.
recc

69

Ventajas:

Es til cuando los datos siguen aproximadamente una progresin


aritmtica o estn distribuidos en forma normal o simtrica.
Es un estadgrafo de gran utilidad, porque toma en cuenta todos los
datos.
Nos permite estimar y probar parmetros en estadstica inferencial.

Desventajas:
Como incluye todos los datos, puede ser afectado por valores extremos.
Cuando los datos agrupados tienen clases abiertas en los extremos, no
es recomendable calcular la media aritmtica.

recc

70

Tendencia Central
Mediana
Se define como el valor central.

El valor que delimita al 50% de los datos .


Para datos no agrupados:
Se halla la frecuencia acumulada
Se divide la frecuencia total para 2
Se busca dentro de la frecuencia acumulada, el primer valor
que contiene a n/2
Ej..
Se obtiene la siguiente informacin de estudiantes repetidores de
ao.

Ao de
estudio
No

Primero
25

segundo

Tercero

14

6
recc

Cuarto
9

Quinto
2
71

Solucin:
- Se halla la frecuencia acumulada.
- 56/2 = 28
- El valor que contiene a 28 es 39
- Entonces la Me = Segundo de secundaria.
Interpretacin:
La mitad de estudiantes repetidores lo hacen en segundo de
secundaria.
La otra mitad lo hacen como mximo hasta segundo de
secundaria.

En

Excel Opcin 2: funcin MEDIANA


recc

72

Me para datos agrupados.

f f
2

f me

Me Li

recc

73

De donde:

Me = mediana.
Li Lmite inferior del intervalo de la clase mediana
f / 2 = Semisuma de las frecuencias absolutas simples

f = Suma de todas las frecuencias absolutas anteriores a la clase


i 1

mediana.
f Frecuencia de la clase mediana
me

recc

74

Ejemplo:

Ii

fi

Xi

Xifi

0 1.9
2 3.9
4 5.9
6 7.9
8 9.9

15
26
20
13
6

0.95
2.95
4.95
6.95
8.95

15* 0.95 = 14.25


76.70
99
90.35
53.70

Se halla la frecuencia acumulada.


Se halla la clase en la cual est incluido el valor n/2: 80/2 = 40. Este indicar
la clase mediana.
f i 1 15 ; f me 26 ; w 2
Otros datos
Aplicamos la frmula.
Respuesta.- 3.9 kg. Interpretacin: El 50 % de las familias consumen mximo
3.9 kg/semana de carne vacuno el otro 50 % de familias consumen ms de 3.9
kg/semana.

recc

75

Ventajas

No est afectada por valores extremos y por lo tanto es ms


representativa que la media aritmtica cuando alguno de los valores de
la variable se aleja mucho de los dems o cuando las series son poco
simtricas.
Es til cuando los datos agrupados tienen clases abiertas en los
extremos
Se aplica tambin a variables que pertenecen a la escala ordinal.

recc

76

Tendencia Central
Moda

Es el valor ms frecuente, el que se observa mayor


nmero de veces
Pueden existir varios o ningn valor de moda para un solo
conjunto de datos, la distribucin puede ser:

Amodal cuando ningn valor se repite


Unimodal cuando un solo valor es el ms frecuente
Bimodal cuando dos valores son los ms
frecuentes
trimodal,...., polimodal

En Excel Opcin 2: funcin MODA

recc

77

FRMULA
Para datos agrupados:

d *w
Mo Li

d d

De donde:
Li = Lmite inferior de la clase modal.
d = diferencia de la frecuencia de la clase modal y la frecuencia de la
clase anterior a ella.
d = diferencia de la frecuencia de la clase modal y la frecuencia
anterior a ella.
Ii

fi

Xi

Xifi

0 1.9
2 3.9
4 5.9
6 7.9
8 9.9

15
26
20
13
6

0.95
2.95
4.95
6.95
8.95

15* 0.95 = 14.25


76.70
99
90.35
53.70

recc

78

Desarrollo

La clase modal se ubica en aquella clase que tiene la mayor frecuencia (26).
d= 26 15 = 11
d = 26 20 = 6.
Otros datos Li = 2 ; w = 2
Se aplica la frmula
Respuesta Mo = 3.3 Interpretacin: Las familias en estudio consumen con
mayor frecuencia 3.3 kg/semana de carne vacuno.

VENTAJAS:
Al igual que la mediana, no est afectada por valores extremos.
Puede usarse cuando los datos agrupados tienen clases abierta en los
extremos
Se usa tambin para variables que pertenecen a la escala nominal.
recc

79

DESVENTAJAS

No es representativa a menos que la distribucin contenga


un gran nmero de datos y exista significativa repeticin de
alguno de ellos.
Muchas veces la serie no tiene moda porque ningn valor se
repite.
Cuando la serie tiene dos, tres, o ms modas, se hace difcil
su interpretacin y comparacin.

recc

80

Ejemplo

Se muestra a continuacin la estatura en cm, de un grupo de nios y


nias normales de 0 a 12 aos, residentes en las zonas rurales de la
ciudad de Ambato.
45

48

115

112

95

98

145

115

96

90

51

38

52

132

96

89

112

51

63

104

66

36

98

134

87

63

109

91

109

103

60

45

120

105

78

54

53

61

46

56

62

48

125

108

69

49

57

71

63

139

Encontrar la media aritmtica, mediana y la moda en datos agrupados y


no agrupados. Elaborar la tabla de distribucin de frecuencias
respectiva.

recc

81

Relacin entre Tendencia Central y


la Simetra de la distribucin
Simetra
Relacin
Simtrica o insesgada Moda = Mediana = Media
sesgo positivo o a la Moda > Mediana > Media
derecha
sesgo negativo o a la Moda < Mediana < Media
izquierda

recc

82

Relacin entre Tendencia Central y


la Simetra de la distribucin

recc

83

Relacin entre Tendencia Central y


la Simetra de la distribucin

recc

84

Relacin entre Tendencia Central y


la Simetra de la distribucin

recc

85

Tendencia Central
Media Geomtrica

Es el crecimiento promedio.
Se obtiene a travs de la frmula

De donde:

fi
f1
f2
fi

xg
x1 . x2 ...xi

x1 , x2, ... xi marcas de clase


f1 , f 2 ... f i Frecuencias absolutas simples

recc

86

Ejemplo

La siguiente informacin corresponde a los casos de tifoidea (en %),


segn el reporte de los centros mdicos donde fueron atendidos:
i

Casos de tifoidea (%)

Nmero de centros

1
2
3
4
5

0 19
20 39
40 59
60 79
80 99

10
14
17
8
6

TOTAL

55

Hallar el promedio de casos de tifoidea atendidos en los centros mdicos

x g 55 (9.5)10 29.5

14

49.5 17 69.5 8 89.5 6

x g 36.3 %

Los centros atendieron un promedio de 36.3 % de los casos de tifoidea.


recc

87

Tendencia Central
Media Geomtrica

La media aritmtica siempre es mayor que la


geomtrica.

recc

88

Tendencia Central
Media Aritmtica Ponderada

Se calcula la media aritmtica muestral,


adjudicando diferente importancia a cada
uno de los datos.
n

Xp=

w X
i

i 1
n

w
i 1

recc

89

Medidas de dispersin

Las principales medidas son:

Rango
Desviacin Media
Varianza
Desviacin Estndar
Coeficiente de Variacin

recc

90

Dispersin
Rango

Es la diferencia que existe entre el valor mas


grande y el mas pequeo.

rango max min

recc

91

Dispersin
Desviacin Media Absoluta

Es el promedio de las distancias absolutas


de los datos a su media aritmtica.
n

DM =

X X
i 1

En Excel: funcin DESVPROM


recc

92

Dispersin
Varianza poblacional

La varianza poblacional se denota como


Es el promedio de los cuadrados de las
distancias de los datos a su media
aritmtica.
n
2
Xi X

2 = i 1
n
Es un estimador sesgado. Funciona solo
para muestras grandes.
En Excel Opcin 2: funcin VARP
recc

93

Dispersin
Varianza muestral

La varianza muestral se denota como S


Se calcula igual que la varianza poblacional,
dividiendo entre n-1.
n

S2 =

X X
i 1

n -1

Es un estimador insesgado. Funciona para


cualquier tamao de muestra.
En Excel Opcin 2: funcin VAR
recc

94

Dispersin
Desviacin Estndar

Mide la variacin de los datos en trminos


absolutos.
Se interpreta como la distancia promedio de
los datos a su media aritmtica.
Se expresa en las mismas unidades que las
empleadas en los datos.
Se calcula tomando la raz cuadrada positiva
de la varianza.

recc

95

Dispersin
Desviacin Estndar

Desviacin Estndar Poblacional:

En Excel: funcin DESVESTP

Desviacin Estndar Muestral:

S= S

En Excel: funcin DESVEST


recc

96

Dispersin
Desviacin Estndar

Para interpretar la dispersin absoluta, se


construyen intervalos alrededor del
promedio. Con esto se determina en dnde
se sitan los valores de una distribucin de
frecuencia en relacin con la media
aritmtica. Esto se puede lograr utilizando:

Teorema de Chebyshev
Regla Emprica

recc

97

EJEMPLO

Con los siguientes datos, encontrar La media geomtrica,


desviacin estndar o tpica, la varianza y el coeficiente de
variacin.

.
45

48

115

112

95

98

145

115

96

90

51

38

52

132

96

89

112

51

63

104

66

36

98

134

87

63

109

91

109

103

60

45

120

105

78

54

53

61

46

56

62

48

125

108

69

49

57

71

63

139

recc

98

Dispersin: Desviacin Estndar


Teorema de Chebyshev

Cualquiera que sea la forma de la


distribucin de los datos:
al menos el 75% de los valores (poblacin)
caern dentro de 2 desviaciones estndar
respecto de la media de la distribucin:

X 2S

al menos el 89% de los valores (poblacin)


caern dentro de 3 desviaciones estndar
respecto de la media de la distribucin:

X 3S
recc

99

Dispersin: Desviacin Estndar


Regla Emprica

Solo cuando la forma de la distribucin de


los datos es simtrica (insesgada):
aproximadamente el 68% de los datos
(poblacin) se encuentran a una desviacin
estndar alrededor de la media de la
distribucin :

X S

recc

100

Dispersin: Desviacin Estndar


Regla Emprica

aproximadamente el 95% de los datos


(poblacin) se encuentran a 2 desviaciones
estndar alrededor de la media de la
distribucin :

X 2S

aproximadamente el 99% de los datos


(poblacin) se encuentran a 3 desviaciones
estndar alrededor de la media de la
distribucin :

X 3S
recc

101

Dispersin
Coeficiente de Variacin

Mide la variacin relativa de la variable con


respecto a su promedio.
Cuando deseamos comparar la dispersin
de dos distribuciones, necesitamos medir la
magnitud de la desviacin estndar en
relacin con la magnitud de la media
Expresa a la variacin de los datos como
porcentaje de su promedio.

CV = x 100
X
recc

102

Forma

Las medidas de forma son:

Sesgo
Curtosis

recc

103

Forma
Sesgo

Es el grado de asimetra que tiene la


distribucin
Una curva insesgada tiene sesgo cero
Medimos en cunto se aleja la distribucin
de una insesgada:

Si el polgono de frecuencias tiene la mayor


acumulacin a la izquierda, tiene sesgo
positivo o a la derecha.
Si el polgono de frecuencias tiene la mayor
acumulacin a la derecha, tiene sesgo
negativo o a la izquierda
recc

104

Forma
Sesgo

En Excel Opcin 2: funcin


COEFICIENTE.ASIMETRIA
Coeficiente de
Asimetra

Sesgo

=0

No hay sesgo. La distribucin


es insesgada

>0

La distribucin tiene
positivo o a la derecha.

<0

La distribucin tiene sesgo


negativo o a la izquierda.
recc

sesgo

105

Forma
Curtosis

Mide qu tan puntiaguda es una


distribucin, con respecto a la Normal.

La distribucin Normal se considera


mesocrtica, es el trmino medio.
Las distribuciones mas puntiagudas que la
Normal se llaman leptocrticas
Las distribuciones menos puntiagudas que la
Normal se conocen como platocrticas

recc

106

Forma
Curtosis

recc

107

Forma
Curtosis

En Excel Opcin 2: funcin CURTOSIS


Funcin Curtosis

Curtosis

=3

Mesocrtica

>3

Leptocrtica

<3

Platocrtica

recc

108

Medidas de Posicin

Las medidas de posicin son:

Cuartiles: Son tres y delimitan al 25%, 50% y


75% de los datos acumulados.
Deciles: Son nueve y delimitan al 10%,
20%, ... , 90% de los datos acumulados.
Percentiles: Son noventa y nueve y delimitan
al 1%, 2%, ... , 99% de los datos acumulados.

Siempre acumulamos de izquierda a


derecha.
En Excel: funcin PERCENTIL
recc

109

FRMULAS:
i fi

fi 1

4
Q1 Li
w
f Qi

La

misma formula se utiliza en deciles y percentiles. Cambia


Q por D o P y 4 por 10 o 100

recc

110

EJEMPLO:
Hallar

2 cuartiles, 3 deciles y 5
percentiles.
45

48

115

112

95

98

145

115

96

90

51

38

52

132

96

89

112

51

63

104

66

36

98

134

87

63

109

91

109

103

60

45

120

105

78

54

53

61

46

56

62

48

125

108

69

49

57

71

63

139

recc

111

GRACIAS

recc

112

You might also like