Professional Documents
Culture Documents
Tema: Estadstica
ESTADSTICA GENERAL
INTRODUCCIN
La palabra estadstica a menudo nos trae a la mente imgenes de nmeros apilados en
grandes arreglos y tablas, de volmenes de cifras relativas a nacimientos, muertes, viajes,
visitantes, ingresos, ventas y as sucesivamente.
Algunas personas podran pensar que la enseanza de la estadstica slo interesa a los
profesores, o bien a los investigadores que trabajan en los diferentes departamentos de una
universidad. Esta es una creencia errnea, puesto que la estadstica ha surgido desde la
misma estadstica y podemos encontrar Estadsticos en psicologa, economa, medicina,
ingeniera y otras reas.
Que es la estadstica?
Segn: Diccionario RAE
Ciencia o recuento de la poblacin, de los recursos naturales e industriales, del trfico o
de cualquier otra manifestacin de un Estado, provincia, pueblo, clase, etc.
Ciencia que utiliza conjuntos de datos numricos para obtener inferencias basadas en el
clculo de probabilidades.
La Estadstica se ocupa de los mtodos y procedimientos para recoger, clasificar, resumir,
hallar regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre
sea una causa intrnseca de los mismos; as como de realizar inferencias a partir de ellos, con
la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones.
La Estadstica, rama de las matemticas que se ocupa de reunir, organizar y analizar datos
numricos y que ayuda a resolver problemas como el diseo de experimentos y la toma de
decisiones.
Estadstica es un conjunto de mtodos cientficos para la recopilacin, representacin
condensacin y anlisis de los datos extrados de un sistema en estudio. Con el objeto de
poder hacer estimaciones y sacar conclusiones, necesarias para tomar decisiones.
Estadstica General
Tema: Estadstica
Estadstica General
Tema: Estadstica
TRABAJO
Observar y describir diferentes problemas relacionados con su carrera.
CLASIFICACION O TIPOS DE ESTUDIOS
Segn el tiempo de ocurrencia de los hechos y registros de la informacin
Se clasifican en:
Retrospectivo: Son aquellos estudios que el investigador indaga sobre hechos
ocurridos en el pasado.
Prospectivo: Son aquellos estudios que el investigador registra la informacin segn
van ocurriendo los fenmenos.
Estadstica General
Tema: Estadstica
ESTADSTICA GENERAL
DIVISIN DE LA ESTADSTICA
La Estadstica para su mejor estudio se ha dividido en dos grandes ramas: la Estadstica
Descriptiva y la Inferencial.
Estadstica Descriptiva: Se denomina estadstica descriptiva, al conjunto de
mtodos
estadsticos que se relacionan con el resumen y descripcin de los datos, como tablas,
grficas, y el anlisis mediante algunos clculos.
Estadstica Inferencial Se denomina inferencia estadstica al conjunto de mtodos con los
que se hacen la generalizacin o la inferencia sobre una poblacin utilizando una muestra.
La inferencia puede contener conclusiones que pueden no ser ciertas en forma absoluta,
por lo que es necesario que stas sean dadas con una medida de confiabilidad que es la
probabilidad.
Estas dos partes de la estadstica no son mutuamente excluyentes, ya que para utilizar los
mtodos de la inferencia estadstica, se requiere conocer los mtodos de la estadstica
descriptiva.
La Estadstica Inferencial investiga o analiza una poblacin partiendo de una muestra
tomada.
TRMINOS DE ESTADSTICA
Los trminos estadsticos que se usan en estadstica es necesario conocerlos para poder
entender el lenguaje estadstico que se utiliza en el desarrollo de la asignatura:
Poblacin:
En forma general, en estadstica; se denomina poblacin, a un conjunto de elementos (que
consiste de personas, objetos, etc.), que contienen una caracterstica observable comn.
Estadstica General
Tema: Estadstica
la
Poblacin (N)
Muestra (n)
Muestreo
X
S
S2
Inferencia
p
5
Estadstica General
Tema: Estadstica
Variable: Es una caracterstica de inters, toma diferentes valores. Las variables son
caractersticas observables, susceptibles de adoptar distintos valores o ser expresados en
varias categoras. Las variables se representan con letras maysculas del abecedario.
Ejemplo:
P: Mtodo de enseanza.
N: Tipo de batera que usan los equipos de Oftalmologa para el servicio de zonas rurales
en el CLAS de la ciudad de Sullana en Julio del 2008.
Cada alumno.
Estadstica General
Tema: Estadstica
Datos: Comnmente se le conoce como observaciones. Son los valores que toma la variable
en cada unidad estadstica.
De los ejemplos anteriores seria:
y1=12.2, y2=13.5
Etc.
Unidad de medida. Son las unidades fsicas en las que son expresados los datos. Las
variables cualitativas no tienen unidad de medida.
De los ejemplos anteriores.
cm.
Grados.
LAS VARIABLES
Podemos iniciar el tema indicando que definir las variables me permitir dar respuesta a lo
que quiero estudiar. El sexo, la edad, el nivel socioeconmico, el seguimiento de un
determinado plan de cuidados, el tipo de droga que se consume, la percepcin de riesgo
frente a una determinada conducta, etc. son aspectos que con seguridad se abordarn si
estamos realizando un estudio sobre el consumo de drogas, pues bien, estos aspectos a
estudiar, son lo que denominamos las variables de estudio.
Estadstica General
Tema: Estadstica
Medir es asignar valores a las variables del estudio. Su principal funcin es evitar la
subjetividad del investigador.
La forma de medir las variables va a determinar el anlisis matemtico, estadstico, de las
mismas.
Clasificacin segn su naturaleza:
VARIABLES CUALITATIVAS:
Miden una caracterstica, en trmino de cualidad, nunca de forma numrica.
Cada uno de los valores que puede tomar la variable se llama categoras. Deben incluir
todas las opciones posibles que puede adoptar la variable.
Pueden ser:
Escala nominal: Determina la igualdad o desigualdad de los individuos.
Sexo: masculino o femenino. Fumador: S. No.
Estado Civil: soltero, casado, viudo, separado o divorciado.
Escala ordinal: Determina el orden de los individuos de mayor, menor o igual
que.
Habito de fumar: no fumador, fumador moderado, fumador importante.
Consumo de tabaco: Tabaco: 0 c/d, 1-10 c/d, > 10 c/d
Escala de dolor: Muy fuerte, fuerte, regular, dbil, muy dbil.
Si las variables cualitativas tienen solo dos categoras se llama variable cualitativa
dicotmica (Ejemplo: Sexo: Hombre. Mujer), y si tiene ms de dos, variable cualitativa
politmica (color de cabello: negro, rubio, castao, pelirrojo)
VARIABLES CUANTITATIVAS:
Miden una caracterstica de forma numrica, miden una cantidad. Pueden ser:
Variables Discretas: Entre dos valores consecutivos no existe otro valor, es decir toman
solo valores enteros. Se obtienen siempre por conteo.
Ejemplo.
Nmero de hijos.
Nmero de maquinas registradoras.
Nmero de mquinas empacadoras de cemento.
Nmero de estaciones de servicio.
Nmero de cajeros automticos.
Estadstica General
Tema: Estadstica
Peso de pernos
Talla.
Tiempo de vida til de una maquina de sellado.
VARIABLES
CUALITATIVAS
Nominal
Ordinal
CUANTITATIVAS
Continua Discreta
Estadstica General
Tema: Estadstica
Distribucin Porcentual
Tasa de Nupcionalidad
Etc.
Segunda forma:
(1) Menos de 300
(2) Medio
(3) Bajo
EJERCICIOS 01
De los enunciados siguientes Identificar la poblacin, muestra, unidad de anlisis, dato
y la variable (tipo de variable y sus elementos)
10
Estadstica General
Tema: Estadstica
1) Se desea saber el tiempo de vida de los motores en las motocar YAMAHA cierto estudio
se hizo ciudad de Tumbes e Iquitos ya que son las ciudades donde el calor es intenso
todo el ao y el motor de cierto objeto de estudio sufre en estas condiciones climticas.
2) En la UNP se quiere saber cul es el deporte ms practicado por los alumnos la cual se
tomo informacin de 200 alumnos elegidos al azar de las diferentes escuelas de esta
universidad.
3) Se desea saber cul es la estatura y el peso medio de los alumnos de la facultad de
Educacin de la UNP, la cual para obtener esta informacin para la estimacin se eligi
solo a tres escuelas de esta facultad y a 50 alumnos de dichas escuelas.
4) La UNP necesita informacin sobre lugar de procedencia de los alumnos que vienen a
integrarse a nuestra casa de estudio en el segundo semestre del presente ao.
Trabajo 02
Investigar, presentar y exponer acerca de:
Recoleccin de datos:
-
Concepto
Fuentes de datos
Censo y Encuesta
RECOPILACIN DE DATOS
La recopilacin de datos es el momento en la cual el investigador se pone en contacto
directo con los sujetos, objetos o elementos sometidos al estudio con el propsito de obtener
los datos o respuestas de las variables consideradas; a partir de estos datos se prepara la
informacin estadstica y se calcula las medidas de resumen e indicadores para el anlisis
estadstico.
Para recoger la informacin se toma en cuenta las siguientes modalidades: Las fuentes de
informacin, los sistemas de recoleccin y las tcnicas de recoleccin.
FUENTES DE INFORMACION
Es el lugar, la institucin o persona donde estn los datos para cada una de las variables o
aspectos de la investigacin. Las fuentes de informacin pueden ser:
a) Fuentes internas: Es la informacin recopilada por la empresa (o la institucin) de
los resultados de su propia gestin. Son pues las observaciones que constantemente
realizan los departamentos: Administrativos, contables, comerciales, tcnicos, etc.
11
Estadstica General
Tema: Estadstica
12
Estadstica General
Tema: Estadstica
13
Estadstica General
Titulo
Tema: Estadstica
CUADRO N 01
DISTRIBUCIN DE 20 EMPRESAS SEGN EL NMERO DE
TRABAJADORES EN PIURA, ABRIL DEL 2015.
N
Encabezamiento
fi
hi
Fi
Trabajadores
100
2
0.07
2
110
4
0.13
6
120
8
0.27
14
Cuerpo
130
10
0.33
24
140
4
0.13
28
150
2
0.07
30
Total
30
1
Fuente
Fuente: Oficina de RR.HH de las 20 empresas
TALLO Y HOJAS
Una manera muy simple de representar informacin en muestras de tamao
moderado, es el tallo y hojas. Bsicamente, consiste en un ordenamiento en que
el ltimo dgito se escribe separadamente de los de mayor significacin.
Mostraremos su uso mediante los datos que aparecen en la Tabla 01 que
presentamos a continuacin.
Tabla 01
DATOS DE ALUMNOS DEL TERCER DE INGENIERIA INDUSTRIAL CICLO DE
LA UNIVERSIDAD PRIVADA CESAR VALLEJO DE PIURA, 2011.
G T P E G T P E G T P E G T P E
G T P E G T P E
M 163 50 17 F 163 62 17 F 162 48 18 F 163 48 19
F 163 55 17 M 178 70 18
M 167 55 18 F 167 51 19 F 158 57 18 F 160 55 18
F 167 56 18 M 185 72 18
M 160 55 17 M 173 63 18 F 160 51 19 F 158 51 19
F 158 48 19 M 165 70 19
F 158 49 18 F 156 41 20 F 162 56 20 F 166 60 18
F 170 54 18 M 180 75 20
F 157 55 20 F 164 55 18 F 169 53 21 F 174 59 20
F 160 49 20 M 176 66 21
F 161 53 17 F 165 60 18 F 170 58 20 F 174 60 19 M 174 56 20 M 175 60 18
F 160 60 18 F 154 52 19 F 165 56 18 F 173 70 20 M 172 60 22 M 169 70 19
F 160 60 17 F 154 52 20 F 165 56 19 M 173 70 18 M 172 60 19 M 173 70 19
M 177 67 21 M 178 60 19 F 155 52 18 F 157 54 17 M 166 62 20
F 158 50 17 F 160 55 18 F 155 45 19 F 158 52 18 M 171 75 19
Fuente: Encuesta a alumnos.
Donde:
G : genero (M= Masculino, F=Femenino)
T: Estatura (cm)
P: Peso (kg)
E: Edad (aos)
En esta tabla, aparecen datos de 58 alumnos del tercer ciclo de ingeniera industrial
de la Universidad Privada Csar Vallejo, correspondientes a las variables Gnero,
Estatura (cm) y Peso (Kg), recolectados de una encuesta.
Para construir el tallo y hojas correspondiente a la variable Estatura, se escribe una
columna con las decenas de los nmeros que sern representados. Las estaturas
14
Estadstica General
Tema: Estadstica
disponibles en la muestra, tienen como decenas a los valores 15, 16, 17 y 18. De
este modo, el nmero 165 tiene 16 decenas y 5 unidades. Esto significa que en la
columna de la derecha, a la altura del 16, se anota el dgito 5. Repitiendo este
procedimiento para cada valor en la tabla, se obtiene lo siguiente:
TALLO Y HOJAS DE LA TABLA 01
ESTATURA DE ALUMNOS
1
455677888888
5
1 00000012233334555667
6 7799
1
001233344456788
7
1
05
8
El resultado obtenido puede considerarse como un reordenamiento de la
informacin original. Sin embargo, al poner ordenadamente las cifras, se tiene un
beneficio adicional: al mirar la figura globalmente, entrega una representacin
grfica de la informacin. (Esta visin se facilita si el grfico se observa
lateralmente). La simplicidad de este procedimiento lo hace muy adecuado para
representar pequeos conjuntos de datos en forma manual.
Trminos utilizados:
fi
-
15
Estadstica General
Tema: Estadstica
Yi
-
Marca de clase (
L Ls
Yi i
2
.
Frecuencias
Frecuencias
fi
hi
Absolutas:
Negro (N)
Blanco (B)
Rojo (R)
Total
Relativas:
9
8
3
20
0.45
0.40
0.15
1.00
Frecuencias
pi
Porcentajes:
45
40
15
100
ELABORACIN DE GRAFICOS
GRAFICO DE BARRAS
16
Estadstica General
Tema: Estadstica
Personas
9
8
7
6
5
4
3
2
1
0
0.45
0.40
0.15
Negro
Blanco
Rojo
Fuente: Cuadro 01
Grafico Circular
El grfico 2 es la representacin mediante grfica de sectores circulares del cuadro 1 La
frecuencia 45% es equivalente a
0. 40 360 144
0. 45 360 162
0.15 360 54
Grfico 2: Distribucin de personas por su color preferido de una marca de bebida gaseosa.
17
Estadstica General
Tema: Estadstica
15%
40%
R
B
N
45%
Fuente: Cuadro 01
Ejercicio.
En una muestra se recolecto datos sobre la marca de bateras que usaban 30 radios porttiles
del ejrcito peruano de la ciudad de Piura, enero del 2010 .
co
ca
se
co
ca
Donde:
ca: Panasonic
ca
co
ca
ca
se
co: Duracell
se
co
se
co
co
se: Akita
so: National
co
se
co
ca
co
so
co
ca
ca
co
co
co
co
co
ca
B) VARIABLE CUANTITATIVA
B.1) CUADRO SIN INTERVALOS
Suponga que se han recolectado n valores de alguna variable discreta X. El procedimiento
ms simple de organizar estos n datos, consiste en ordenar estos valores numricos en forma
ascendente.
18
Estadstica General
Tema: Estadstica
Si todos los n datos son distintos entre si, se obtendr una distribucin de frecuencias de n
valores de la variable X, donde cada uno de estos valores tienen frecuencia absoluta igual a
uno.
Si algunos valores se repiten, y si al terminar el ordenamiento se obtienen k (
kn
x1 , x 2 ,..., x k
f 1 , f 2 ,..., f k
f1
h1
p1
x2
f2
h2
p2
...
...
...
...
xk
fk
hk
pk
Total
1.00
100.00
Fuente:..
Las frecuencias absolutas relativas y porcentajes poseen , en el caso de variable discreta y
continua, el mismo significado y propiedades, que en el caso de la variable cualitativa.
Cuando es grande el nmero de datos observados de una variable discreta, su organizacin
es muy engorrosa. En este caso, para resumir los datos y poder calcular las medidas
descriptivas, es conveniente seguir el mtodo de organizacin de variable continua por
intervalos que se describe en la seccin 1.4.3 siguiente.
Grfica
La representacin grfica ms comn de una distribucin de frecuencias de variable discreta
es del tipo bastn que consiste en trazar en cada valor distinto de la variable, segmentos de
recta proporcionales a su frecuencia.
Tambin, se pueden usar barras rectangulares para graficar una distribucin de frecuencias
de variable discreta.
EJEMPLO 1.2.
Ante la pregunta del nmero de hijos por familia (variable X) una muestra de 20 hogares
de la ciudad de Piura, marc las siguientes respuestas:
2, 1, 2, 4, 1, 3, 2, 3, 2, 0, 3, 2, 1, 3, 2, 3, 3, 1, 2, 4.
Construir la distribucin de frecuencias de la variable X. Graficar.
19
Estadstica General
Tema: Estadstica
SOLUCION.
Al ordenar estos datos en forma ascendente, se obtienen cinco valores distintos 0, 1, 2, 3,
4 que se repiten respectivamente 1, 4, 7, 6, 2 veces. La distribucin de frecuencias de X se
da en el cuadro 1.4.
Cuadro 2: Familias de la ciudad de Piura, segn su nmero de hijos.
Nmero de
Frecuencias
Frecuencias
Frecuencias
Hijos
Absolutas
relativas
Porcentajes
Xi
fi
hi
pi
0
1
2
3
4
1
4
7
6
2
Total
20
Fuente: Elaboracin propia.
0.05
0.20
0.35
0.30
0.10
5
20
35
30
10
1.00
100
GRAFICO DE BASTONES
Grafico 03: Familias de la ciudad de Piura, segn su nmero de hijos.
7
6
5
fi
hi
0.35
0.30
0.20
3
2
0.10
0.05
0
4 X
Fuente: Cuadro 02
En la grfica de bastones, se indican las frecuencias absolutas y relativas en cada valor
distinto de la variable.
20
Estadstica General
Tema: Estadstica
Ejercicio.
Se tomo a 20 empresas de transportes de la Ciudad del norte del pas la cual se tiene
datos de la cantidad de aos dando servicio de transporte puntos tursticos del norte del
pas:
6
5
4
4
3
3
4
4
5
5
4
5
6
2
4
3
4
6
5
3
Elabora un cuadro de distribucin de frecuencias
///...
f1
h1
p1
I2
///...
f2
h2
p2
...
...
///...
...
...
...
fk
hk
pk
Total
Fuente:..
1.00
100.00
Ik
21
Estadstica General
Tema: Estadstica
X max
donde
X min
es el dato mximo
es el
dato mnimo.
2. Determinar el nmero de intervalos, k, teniendo en cuenta la recomendacin R1.
Un valor aproximado del nmero de intervalos, k, nos proporciona la regla de Sturges,
donde,
k = 1 + 3.3log(n),
Por
n 10
ejemplo,
si
se
tienen
n 45
Si la divisin
no es exacta en el nmero de decimales de los datos, entonces,
el nmero A se aproxima por exceso de manera que se cubra todo el rango, esto es, de
kA R
manera que
.
Si los datos son enteros, A es entero, si los datos tienen un decimal, A tiene un
decimal, etc. Por ejemplo, si los datos tienen dos decimales y si
A
R/k
5.3416, se elige
22
Estadstica General
Tema: Estadstica
Observe que se cierra por la derecha el ltimo intervalo. Esto se debe a que si la
divisin
R/k es exacta en el nmero de decimales de los datos, entonces,
X max X min k A
.
EJEMPLO 1.3.
70
57
62
43
68
62
26
64
72
52
51
62
60
71
61
55
59
60
67
57
67
61
67
51
81
53
64
76
44
73
56
62
63
60
SOLUCION:
X max
X min
89 y
R 63
7.875.
k
8
A8
[26,34[
[34,42[
[42,50[
[50,58[
[58,66[
/
//
////
///// /////
///// ///// ///// /
fi
hi
pi %
1
2
4
10
16
0.022
0.044
0.089
0.222
0.356
2.2
4.4
8.9
22.2
35.6
23
Estadstica General
Tema: Estadstica
[66,74[
///// ///
8
[74,82[
///
3
[82,90]
/
1
Total
45
Fuente: Elaboracin propia.
0.178
0.067
0.022
1.000
17.8
6.7
2.2
100.0
Ejercicio.
Estos datos corresponden a las puntuaciones de 60 ingresantes a la Escuela de Ingeniera
Industrial en el ltimo examen de admisin para el ingreso a la UCV Piura.
65
43
88
59
35
76
21
45
62
41
36
78
50
48
62
60
35
53
65
74
49
37
60
76
52
48
61
34
55
82
84
40
56
74
63
55
45
67
61
58
79
68
57
70
32
51
33
42
73
26
56
72
46
51
80
54
61
69
50
35
35
C A N T ID A D
30
25
20
15
10
30 - 34
25 - 29
20 - 24
15 - 19
10 - 14
EDAD (aos)
24
Estadstica General
Tema: Estadstica
POLGONO DE FRECUENCIA:
Tambin es un grafico que se utiliza para representar la distribucin de frecuencias
absolutas o relativas simples.
Consiste en un grafico lineal que se obtiene uniendo los puntos hallados, mediante el par
de valores de marca y frecuencia correspondientes. Para fines de grfico, se hace
necesario incrementar un intervalo de clase en cada extremo, con frecuencias cero.
35
30
C A N T ID A D
25
20
15
10
5
0
12
17
22
27
EDAD (aos)
12
17
22
27
EDAD (aos)
32
37
35
C A N T ID A D
30
25
20
15
10
5
0
32
37
OJIVAS:
Son grficos que se utilizan para representar las frecuencias acumuladas absolutas o
relativas, y que consiste en un grafico lineal que nos permite observar la cantidad de
elementos que quedan por encima o por debajo de determinados valores.
Las ojivas son de dos tipos:
ojivas menor que, ojivas o ms.
Para su elaboracin se trabaja con los lmites inferiores de cada intervalote clase y las
frecuencias acumuladas correspondientes.
GRAFICO N 12
COMISARIA X
GRAFICO N 13
COMISARIA X
25
Estadstica General
Tema: Estadstica
DISTRUBUCION ACUMULADA
MENOR QUE DE PERSONAS
DETENIDAS POR DELITO DE ROBO,
SEGN EDAD - JUNIO 2005
DISTRUBUCION ACUMULADA O
MAS DE PERSONAS DETENIDAS POR
DELITO DE ROBO, SEGN EDAD JUNIO 2005
120
NUMERO DE PERSONAS
NUMERO DE PERSONAS
120
100
80
60
40
20
0
10
15
20
25
30
35
100
80
60
40
20
0
EDAD (aos)
10
15
20
25
30
35
EDAD (aos)
PRACTICA DIRIGIDA
1. En el tema de estadstica nos referamos a un atleta de decatln cuya media de
puntuacin en las 10 pruebas era de 801.6 puntos. Especifica en este estudio estadstico
quin es la poblacin y qu tipo de variable se considera.
2. Indica que variab les s on cu alitativas y cua les cu an titativas :
a. Comida F avorita.
b. P rofes in que te gus ta.
c. N me ro de goles ma rcados por tu equipo favori to en la lti ma
te mporad a.
d. N me ro de alu mnos de la U CV-PIU RA . El color de los oj os de
tus compaeros de clas e.
e. Coefici ente inte lectu al de tus compaeros de clas e.
f. N me ro de art culos defe ctuos os .
g. P orcentaj e de artcu los defectuos os .
26
Estadstica General
Tema: Estadstica
h. P es o en gr. de pernos .
i. Capacid ad de carga del mon tacarga.
3. Clasifique las variables e indique el tipo de escala en que estn medidas las siguientes
caractersticas
- Profesin
- Ao de nacimiento - Nacionalidad
Edad
- Grado de instruccin
- Estado civil
- Nmero de hijos
- Ingreso mensual familiar promedio
- Nmero de telfono
- Nmero de DNI
- Direccin
4. D e las s iguient es variab l es indi ca cul es s on d is cretas y cua les
con tin as .
a. N me ro de ac ciones vendid as cada da en la Bols a.
b. Temperatur as regis tradas cada hora en un obs ervatorio.
c. P erodo de durac in de un au tomvi l.
d. El di metro de las ruedas de varios coches .
e. N me ro de hij os de 50 fa mi lias .
5. C las ific ar las s igui entes variab l es en cu alitat ivas y cu an titativas
d is cretas o con tin u as .
a. La naciona lidad de una pers ona.
b. N mero de litros de agua cont enidos en un deps ito.
c. N mero de libro en un es tante de librer a.
d. S u ma de puntos tenidos en el lan za mi ento de un par de dados .
e. La profes in de una pers ona.
f. El rea de las dis tin tas baldos as de un edific io.
g. N mero de ma quinas remal ladoras .
h. N mero de pernos producidos diari amen te.
6. Al investigar el nivel socioeconmico en una encuesta a Profesores de la I.E. San
Miguel de Piura en el mes de Diciembre del 2010 con los valores: Bajo(B), medio (M),
alto(A), 20 profesores dieron las siguientes respuestas: M, B, B, M, A, B, B, M, M, B,
M, B, B, A, M, B, M, A, M, B. Construir la distribucin de frecuencias y trazar su
grfica.
27
Estadstica General
Tema: Estadstica
10.
,
,
,
,
de frecuencias absolutas y graficar el polgono
Y 2=40 y
,y
F6 60
Y 4 =80 , frecuencias:
, completar la distribucin
28
Estadstica General
12.
Tema: Estadstica
Duran te es te ao s e han cont abil izado de los regis tros los s iguient es
naci mi entos en la zona norte de l P er en el ao 2009, del acat a medi co
s e obtuvo lo s iguien te:
Se registra el tiempo en minutos que utilizan 30 alumnos para ejecutar una tarea,
resultando los siguientes: 21.3 15.8 18.4 22.7 19.6 15.8 26.4 17.3 11.2 23.9 26.8
22.7 18.0 20.5 11.0 18.5 23.0 24.6 20.1 16.2 08.3 21.9 12.3 22.3 13.4 17.9
12.2 13.4 15.1 19.1
Nota
[
,
[6 ,
[
[
hi
Hi
0.15
0.45
29
Estadstica General
Tema: Estadstica
[
,
[
0.70
[
,
[
13.5
[
,
]
0.10
17. Los pes os reco lec tados de una encu es ta a los 65 emple ados de la
fbrica BA CKU S de la Ciud ad de Li ma en el ao 2009 vienen dados
por la s iguien te tabla :
19.
20.
satisface la relacin:
histograma.
30
Estadstica General
21.
Tema: Estadstica
, la
f 2 2 f1 5
frecuencia absoluta:
, y si se sabe que el 85% de los obreros demoran
menos de 12 minutos. Completar la distribucin de frecuencias.
22.
REDUCCION DE DATOS
En las tres semanas anteriores estn referidos, con cierto detalle, a la clasificacin
de variables, recoleccin de datos, construccin de tablas de frecuencia y a la
representacin grafica, como fase preliminar en la descripcin y anlisis
estadstico. El objetivo principal de estas primeros temas, ha sido determinar la
naturaleza y formas de la distribucin de frecuencias, como base para la
reduccin de datos a travs de ciertas caractersticas descriptivas y medidas de
resumen.
En el problema de comparar dos o mas distribuciones de frecuencias, puede
resultar fcil hacer una comparacin grafica de las frecuencias, sin embargo,
existen dificultades para hacer comparaciones cuantitativas. Estadsticamente para
facilitar este anlisis comparativo es necesario disponer de algunos indicadores o
medidas de resumen.
31
Estadstica General
Estas
caractersticas
Tema: Estadstica
descriptivas
(cantidad),
constituyen
los
llamados
Recopilacin de datos
DATOS ORIGINALES
Organizacin y procesamientos
de datos
DISTRIBUCION DE FRECUENCIAS
CARACTERISTICAS DESCRITIVAS
Reduccin de datos
ESTADIGRAFOS
x
n
x1 x 2 x 3 ........... x n
n
32
Estadstica General
Tema: Estadstica
5 6 7 8 9 10
7.5
6
LA MEDIANA
si
n e s impar
si
n es
Me
pa r
Me
1
2
de datos, la
76
48
48
68
78
90
87
67
76
78 78
72
78
Entonces n = 11
Ordenamos los datos
48
48
65
67
68
72
87
90
M e x 1 1 1 x 6
2
si
es
imp ar
Me
si
es
pa r
Me
Ejemplo: Supongamos que tenemos datos sobre los sueldos en soles que reciben
mensualmente el personal que labora en el hospital de la ciudad de Piura.
445
510 323
425
33
Estadstica General
Tema: Estadstica
Me
x8 x8
2
x4 x5
432 440
436
2
2
Y i f i
i 1
M(Y) =
n
2
a) Que
no coincide con algn Nj se tiene que:
Entonces Me = Yi
N j 1
n
N j
2
34
Estadstica General
b) Que
n
2
N j 1
n
N j
2
N j 1
n
N j
2
Me :
Entonces:
2.
Tema: Estadstica
1
Y j i Y j
2
a.
Hallamos
n
2
n N
j 1
M e Li c 2
N N j 1
j
nj
frecuencia se denotara con
nj
La moda Mo =
2. La moda en tablas con intervalos
M o Li c
n j 1
n j 1 n j 1
MEDIDAS DE POSICIN
MEDIDAS DE POSICIN PARA DATOS AGRUPADOS
35
Estadstica General
Tema: Estadstica
kn
4 N j 1
QK LI C
N j N j 1
K 1, 3
DECILES: son los nueve valores que dividen al conjunto de datos ordenados en
diez partes iguales, tal que entre dos decilas consecutivas se encuentre no mas del
10% del total de las observaciones.
En total hay nueve decilas: D1, D2, D3, D4, D5,.., D9.
kn
10 N j 1
DK LI C
N j N j 1
K 1, 9
kn
100 N j 1
PK L I C
N j N j 1
K 1, 99
36
Estadstica General
Tema: Estadstica
MEDIDAS DE DISPERSIN
Introduccin
Las medidas de tendencia central no son suficientes para describir un conjunto de valores
de alguna variable estadstica. Los promedios determinan el centro, pero nada indican
acerca de cmo estn situados los datos respecto al centro.
En primer lugar se necesita una medida del grado de dispersin o variabilidad con respecto
al centro con la finalidad de ampliar la descripcin de los datos o de comparar dos o ms
series de datos.
En segundo lugar se necesita una medida del grado de asimetra o deformacin en ambos
lados del centro de una serie de datos, con el fin de describir la forma de la distribucin de
los datos. Esta medida se denomina ndice de asimetra.
En tercer lugar se necesita una medida que nos permita comparar el apuntamiento o curtosis
de distribuciones simtricas con respecto a la distribucin simtrica normal. Esta medida se
denomina ndice de apuntamiento o curtosis.
Las estadsticas de asimetra y apuntamiento se incluyen en este captulo dada su poca
importancia.
El lector debera correr paquetes de computo entre otros el MCEST para las aplicaciones de
este capitulo.
37
Estadstica General
Tema: Estadstica
xm ax
xm in
siendo
el valor mximo y
el valor mnimo.
El rango es una medida de dispersin muy fcilmente calculable, pero es muy inestable,
ya que depende nicamente de los dos valores extremos. Su valor puede cambiar
grandemente si se aade o elimina un slo dato. Por tanto su uso es muy limitado.
.
El rango intercuartil es una medida que excluye el 25% ms alto y el 25% ms bajo,
dando un rango dentro del cual se encuentra el 50% central de los datos observados y a
diferencia del rango total no se encuentra afectada por los valores extremos.
38
Estadstica General
Tema: Estadstica
Q3 70 $
, y
RI Q3 Q1 $70 62 $ 8.
es
Se deduce entonces, que el rango intercuartil y la mediana RSI, son la misma distancia.
Adems, como exactamente el 50% de los datos se encuentran en el rango intercuartil,
entonces, el intervalo: mediana
, y
Q3 70 $
4.
y referida a una
39
Estadstica General
Tema: Estadstica
s s2
. Esto es,
Clculo de la varianza
1) Varianza de datos no tabulados
x1 , x 2 ,..., x n
La varianza de n valores
es el nmero:
s2
n
(x
x)2
i =1
n
n
( xi x ) 2
i 1
2
i
nx 2
i 1
s2
x
i 1
2
i
x2
EJEMPLO 3.1
Calcular la varianza y la desviacin estndar de los 45 ingresos quincenales sin tabular
del ejemplo 1.3
SOLUCION
n
n 45
x
i 1
,
2682$,
Luego, la varianza es el nmero
n
s2
2682
x
45
2
i
i 1
x2
2
i
i =1
59.6,
166,244$2
166,244
(59 .6) 2
45
142.151$2.
s s 2 142 .151
40
Estadstica General
Tema: Estadstica
f (x
i
s2
k
f (x
i
Se verifica que
Por lo tanto,
x)2
i =1
x)
2
i 1
fx
2
i i
nx 2
i 1
s2
fx
2
i i
i 1
x2
EJEMPLO 3.2
Calcular la varianza y la desviacin estndar del nmero de hijos de la muestra de 20
familias del ejemplo 1.2.
SOLUCION.
La distribucin del ejemplo 1.2 se repite en el cuadro 3.1 donde se ha insertado una
f i ( xi ) 2
columna de productos
.
k
Entonces,
fx
20, k 5,
i i
i 1
44,
44
20
fx
2
i i
i =1
2.2,
118
s2
fx
2
i i
i 1
x2
118
(2.2) 2
20
1.06 hijos2.
s s 2 1.06
1.03 hijos.
fi
f i xi
f i xi2
0
1
2
1
4
7
0
4
14
0
4
28
41
Estadstica General
Tema: Estadstica
3
4
Total
6
2
20
18
8
44
54
32
118
f1 , f 2 ,..., f k
clases
nmero:
s2
f (y
i
y con media
es el
x)2
i =1
i 1
f i ( y i x ) 2 f i y i2 nx 2
i 1
Por lo tanto,
k
s2
f i (y i x )
i =1
n f i y
i 1
2
i
i 1
f i yi
f y
i 1
2
i
x 2.
EJEMPLO 3.3
Calcular la varianza y la desviacin estndar de los 45 ingresos quincenales tabulados del
ejemplo 1.3.
SOLUCION.
La distribucin del ejemplo 1.3 se repite en el cuadro 3.2 donde se ha insertado una
f i mi2
columna de productos
30
38
46
54
62
70
78
86
1
2
4
10
16
8
3
1
45
30
76
184
540
992
560
234
86
2702
Productos
f i y i2
900
2888
8464
29160
61504
39200
18252
7396
167764
42
Estadstica General
k
f
45, k 8,
Tema: Estadstica
yi
i 1
2702
45
2702,
fy
2
i
i =1
60.044,
167,764
s2
fy
i
i 1
2
i
x2
167,764
(60.044) 2
45
122.754 $2.
s s 2 122 .754
11.079 dlares.
hace
hi mi2 x 2
i 1
h m
i
i 1
, donde
La varianza
x1 , x 2 ,..., x N
, se define por:
N
( x i ) 2
i =1
x
i =1
2
i
utilizando la frmula
(x
x)2 n
n (n 1)
s2
, basta multiplicar a
por
. Por esta razn, algunos autores definen la varianza (en estadstica descriptiva ) con
denominador
n 1
43
Estadstica General
Tema: Estadstica
s
,
x
o en %
El coeficiente de variacin se utiliza para comparar la variabilidad de dos o ms series de
datos que tengan medias iguales o diferentes o que tengan unidades de medida iguales o
diferentes (por decir, una serie en kilogramos y otra serie en metros).
Por dar un ejemplo, si dos secciones H1 y H2 de matemtica I, tienen la misma
desviacin estndar igual a 14, no podemos concluir que los dos horarios tienen la misma
variabilidad. As mismo, si las desviaciones estndares de H1 y H2 son iguales a 2 y 4
respectivamente no podemos concluir que las notas de H2 son ms dispersas que las de H1.
La variabilidad depende de las medias de los dos grupos.
Si la media del horario H1 es 16 y la media del horario H2 es 11, los coeficientes de
variacin respectivos son:
C.V1 .
s1 14
s
14
X x
s
z 0
,y
s 2Z 1
44
Estadstica General
Tema: Estadstica
EJEMPLO 3.4
En una evaluacin de Matemticas e Historia resultan las medias 13 y 17 y las
desviaciones estndar 3 y 4, respectivamente. Si un alumno obtiene 14 en Matemticas y 16
en Historia, en cul de los dos cursos tiene mejor rendimiento relativo?.
SOLUCION
El hecho de que tenga 16 en Historia y 14 en Matemticas no significa que tiene mejor
rendimiento en Historia.
Se deben calcular los rendimientos relativos con la puntuacin estandarizada Z
z
14 13
0.333
3
16 17
0.25
4
En Matemticas
En Historia
En consecuencia, tiene mejor rendimiento relativo en Matemticas.
y la varianza
sX2
xi2 n( sX2 x 2 )
i =1
yi
es,
sY2
xi
a 2 s2X
es transformado en
yi axi b
(verificar!).
sY a sX
Consiguientemente,
Como casos particulares se tiene:
yi b
Si
sY2 0
, entonces,
. Es decir, si los n datos son iguales a una constante, entonces,
su varianza es igual a cero.
45
Estadstica General
sY2 s2X
y i xi b
Si
, entonces,
. Es decir, si sumamos a cada dato una constante, la
varianza (y la desviacin estndar) no cambian.
sY2 a 2 s2X
y i axi
Si
Tema: Estadstica
, entonces,
. Es decir, si multiplicamos a cada dato por una constante,
a, la varianza de los nuevos valores es igual que la varianza de los antiguos valores
multiplicada por
a2
n k , x k , s k2
, ...,
, entonces, la varianza,
s T2
n1 n 2 ... n k n
, de los
datos
es:
k
s T2
n s n (x
2
i i
i 1
x) 2
i 1
6) Desigualdad de Chebyshev.
Cualquiera sea la forma de la distribucin de frecuencias (simtrica o asimtrica), el
intervalo
[ x ksX , x ksX ] k 1
1
k2
en % de los datos.
El porcentaje de datos que se hallan fuera del intervalo es menor que el
1
k2
en % .
1
[ x 2 s X , x 2s X ]
1
2
3
4
o 75%, de
[ x 3s X , x 3s X ]
El intervalo
El intervalo
[ x 4s X , x 4s X ]
EJEMPLO 3.5
En el mes de Enero el sueldo promedio de los trabajadores del sector industrial era de
$200. Para el mes de Julio se considera un aumento del 30% al sueldo del mes de Enero ms
un adicional de $50. Si el coeficiente de variacin en Enero era de 0.25, se puede decir
que la distribucin de sueldos en Julio es ms homognea?
46
Estadstica General
Tema: Estadstica
SOLUCION
Sea X: Sueldos de Enero,
Y: Sueldos de Julio
s X CV x
0.25200 $50
Y 1.30X 50,
Entonces, la media de los sueldos de Julio es
y 1.3x 50 1.3(200 ) 50 310
(1.3)2(50)2 4225
sY 4225
La desviacin estndar:
65
CV
sY
65
y 310
$300,
$30, de la relacin
[300 k (30 ), 300 k (30 )] [240 , 360 ]
k2
1
2
3
4
resulta
. Entonces el,
ingresos en el intervalo [240, 360].
47
Estadstica General
Tema: Estadstica
[300 k (30 ), 300 k (30 )]
1
k2
0.8889
entonces,
. De donde resulta
Luego, el intervalo es [$210, $390].
k 3
c) Fuera del intervalo [$210, $390] est menos del 11.11% de los ingresos. Si el mnimo es
$210, entonces, el porcentaje de ingresos mayor que $390 es menos de 11.11%.
EJEMPLO 3.7
El costo inicial de produccin, X ; de una muestra de 80 objetos de cierto tipo, tiene una
desviacin estndar de $30. La media del costo de produccin es de $250 para el 60% de la
muestra y de $200 para el resto. El costo final de produccin Y es dado por la relacin:
Y 1.2X 5.
Si el precio de venta de cada objeto de la muestra es proporcional al cuadrado del costo
final de produccin, cunto se recaudara por la venta total?.
SOLUCION.
sX
$30,
De Y 1.2X 5, se tiene,
sY2
(1.2) 2 s 2X
y 1.2 x 5 1.2(230 ) 5
281. Tambin,
(1.2)2(30)2 1296
80
y
Recaudacin total
2
i
i 1
80 ( sY2 y 2 )
80(1296(281)2) 6,420,560.
x Mo
s
x Mo 3( x Me )
48
Estadstica General
Tema: Estadstica
3( x Me)
.
s
AS
Interpretacin.
As 0
As 0
la derecha, si
a la izquierda si
x Me Mo
As 0
a) Simtrica
Mo Me x
x Me Mo
b) Asimetra positiva
Figura. 3.1
c) Asimetra negativa
Por ejemplo, la distribucin de los 45 ingresos quincenales del ejemplo 1.3 tabulados
en ocho intervalos tiene asimetra negativa:
As
0.191
s
11 .079
M3
(X
x )3
nM 3
(n 1)( n 2) s 3
i 1
donde
,
nmero de casos,
la desviacin estndar.
Este ndice es utilizado por los paquetes de computo estadstico para determinar la
asimetra de distribuciones de la forma dato-frecuencia.
Para n datos tabulados en k intervalos, un mtodo alternativo es utilizar el ndice de
asimetra de Fisher definido por:
As
k
M3
f (m x )
i
s3
i 1
donde:
M3 / n
Si la distribucin es simtrica
asimtrica negativa.
la desviacin estndar
As 0
. Si
As 0
, es asimtrica positiva y
si
As 0
49
, es
Estadstica General
Tema: Estadstica
Por ejemplo, continuando con el ejemplo 1.3, el ndice de asimetra de los 45 ingresos
quincenales tabulados en la forma dato-frecuencia es
As
As
3.4 Curtosis
La curtosis es la propiedad de una distribucin de frecuencias por la cual se compara
la dispersin de los datos observados cercanos al valor central con la dispersin de los datos
cercanos a ambos extremos de la distribucin. La curtosis se mide en comparacin a la curva
simtrica normal o mesocrtica (fig. 3.3a)
50
Estadstica General
Tema: Estadstica
A medida que
P90 P10
P90 P10
P75 P25
0.5
P90 P10
tiende a 0.5, es
Por ejemplo, la distribucin de los 45 ingresos quincenales del ejemplo 1.3 tabulados en
K (66 .75 53 .4) (73 .5 45 ) 0.5
Mj
(X
x) j
n(n 1) M 4 3M 2 M 2 (n 1)
(n 1)( n 2)( n 3) s 4
i 1
donde
,
nmero de casos,
la desviacin estndar.
Esta curtosis es utilizado por los paquetes de computo estadstico para determinar la
curtosis de distribuciones de la forma dato-frecuencia.
Para n datos tabulados en k intervalos, la curtosis se calcula por:
K
k
M4
f (m x )
i
i 1
M4 /n
s4
donde:
,
la desviacin estndar.
Si la distribucin es normal, K0. Si K0, es leptocrtica, y si K0 es platicrtica.
Por ejemplo, continuando con el ejemplo 1.3, la curtosis de los 45 ingresos quincenales
tabulados en la forma dato-frecuencia es
K
intervalos es
0.244. Sin embargo, no se puede decir que es leptocrtica, por que la
distribucin de los datos no es simtrica.
51
Estadstica General
Tema: Estadstica
52