Professional Documents
Culture Documents
Matemtica II
UNIDAD VII
ESTADSTICA
1.
INTRODUCCIN
El actual desarrollo cientfico-tecnolgico de la sociedad, en casi todos sus
niveles, exige permanentemente el manejo de una gran masa de datos que por
su extensin hace prcticamente imposible el proceso de manipulacin de ellos y
por tanto se dificulta enormemente los estudios y conclusiones que deben
obtenerse en cada situacin concreta.
El mtodo estadstico es uno de los procesos que utilizamos para tratar de
resolver tales situaciones y as poder efectuar el tipo de generalizaciones que nos
permitan la comprensin de un fenmeno econmico, social, fsico, poltico, etc.
La industria precisa de la informacin estadstica para poder tomar decisiones en
materia de inversin, planeacin, ventas, produccin, etc.
El estado utiliza este instrumento para estimar la recaudacin de impuestos, para
control de precios y de productos, para proyectar la construccin de obras de
infraestructura, para investigaciones en materia econmica que le permitan
aplicar nuevas y mejoras polticas ajustadas a sus propsitos y metas. La
medicina, la qumica, la fsica, las ciencias sociales, en fin todas las reas de la
ciencia, precisan de los conceptos y tcnicas estadsticas para su desarrollo.
1.1
POBLACIN Y MUESTRA
Poblacin es el conjunto mayor de personas o cosas cuyo estudio nos
interesa o acerca de los cuales se desea informacin. Los elementos de
este conjunto se denominan datos u observaciones.
La poblacin puede ser infinita, y por tanto, es imposible tener una
informacin completa sobre ella o si la poblacin es numerosa y no sea
posible estudiar todos y cada uno de sus elementos, se acude a la
informacin proporcionada por una parte finita de dicha poblacin
llamada muestra.
En trminos matemticos: Poblacin es el universo de la teora de
conjuntos y muestra es un subconjunto propio finito de la poblacin.
1.2
ESTADSTICA
Disciplina que nos proporciona un conjunto de mtodos y procedimientos
que nos permitan recopilar, clasificar, presentar y describir datos en
forma adecuada para tomar decisiones frente a la incertidumbre o
55
Matemtica II
TECSUP - PFR
POBLACIN
Estadstica
Descriptiva
(Tcnicas de muestreo)
MUESTRA
MUESTRA
Estadstica
Inferencial
1.4
VARIABLES
La estadstica se interesa fundamentalmente en el estudio de ciertas
variables llamadas aleatorias, cuyo comportamiento lo veremos luego. Por
ahora se especificar que existen dos tipos de variables estadsticas, a
saber:
Variables discretas: aquellas que solo pueden tomar valores enteros. Por
ejemplo, el nmero de hijos de una familia, el nmero de objetos
producidos por una mquina, etc., pueden ser descritos mediante una
variable del tipo discreto:
x = 1, 2, 3, 4, etc.
56
TECSUP - PFR
Matemtica II
ESTADSTICA DESCRIPTIVA
La estadstica descriptiva se ocupa de la recopilacin, clasificacin, presentacin y
descripcin de los datos.
RECOPILACIN
Los datos pueden recopilarse de dos maneras fundamentales:
a) Si se consideran todos los elementos de la poblacin y se registran
sus caractersticas se denomina censo.
b) Si se seleccionan algunos elementos de la poblacin, pero no todos,
se denomina muestra y la informacin obtenida por este
procedimiento se llama por muestreo; si la recopilacin de los
elementos muestrales se efecta al azar se dice que el muestreo es
aleatorio y la muestra se denomina muestra aleatoria.
Un ejemplo de una recopilacin completa o censo es el Censo Poblacional
del Per realizado en el ao 1993.
CLASIFICACIN
Los datos obtenidos por observacin o medicin suelen ser registrados en
el orden en que se recopilan. Para facilitar su interpretacin y el anlisis
correspondiente deben ser clasificados y esto equivale a que los datos
deben ser organizados de alguna manera sistemtica o particionado en
clases bien definidas y una manera sencilla de hacerlo es ordenar los
datos segn su magnitud o agruparlos de acuerdo a sus caractersticas.
PRESENTACIN DE DATOS
Una vez recolectados los datos y optado por su posible clasificacin es
necesario presentarlos en forma tal que se facilite su comprensin y su
posterior anlisis. Para ello se ordenan en cuadros numricos llamados
TABLAS (Tablas de frecuencias) y luego se presentan mediante GRFICAS
(de barras, sectores circulares, histograma, polgono de frecuencias, ojiva,
pictograma, etc.)
Haremos algunas definiciones en base a un ejemplo: Clasificar los
siguientes datos recopilados del nmero de cabezas de ganado vacuno
57
Matemtica II
TECSUP - PFR
2
3
0
4
0
3
4
6
3
5
9
8
5
12
0
11
1
10
1
0
0
4
3
1
8
3
13
3
1
0
1
8
2
10
3
0
A 0; 13
I i Li , Li 1 , i=1, 2, ...,k
Los intervalos semi-abiertos por la derecha Ii se denominan intervalos de
clase.
Los Li , i=1, 2, ...,k+1 se denominan los lmites de clase.
El valor entero de k, fundamentalmente, depende del estadstico y/o
investigador, pero es recomendable utilizar la regla de Sturges para
determinar un valor aproximado de k:
k 1 3,3logn
Donde n es el nmero total de datos disponibles.
La frmula es un poco conservadora y nos da un nmero de intervalos
un poco menor del que se utiliza en la prctica. Cuando el nmero de
datos es menor que 100, el nmero de intervalos se debe tomar menor
que 10. Para un nmero de datos bastante grande, el nmero de
intervalos es mayor que 10, la prctica aconseja los siguientes lmites: 5
k 15 .
En el ejemplo:
k = 1 + 3,3 log(40) = 6,286
Luego k podr tomar valores enteros: 5, 6 o 7
Tomemos:
k=7.
58
TECSUP - PFR
Matemtica II
Wi l ( I i ) Li 1 Li
Para conseguir anchos de clase iguales (W ), como es deseable; se usa
la siguiente relacin:
l ( A)
, donde l (A) es la longitud del alcance.
k
En el ejemplo:
W
13
1,857
7
tomamos W = 2
59
Matemtica II
TECSUP - PFR
PROCEDIMIENTOS DE MUESTREO
A) Muestreo probabilstico: cada elemento de la poblacin tiene una
oportunidad conocida de ser seleccionado para la muestra. Ntese que
decimos una oportunidad conocida y no una oportunidad igual de ser
seleccionado
B) Muestreo no probabilstico: la seleccin de un elemento de la poblacin
para que forme parte de la muestra se basa en parte en el juicio del
investigador o del entrevistador de campo. No existe una oportunidad
conocida de que cualquier elemento particular de la poblacin sea
seleccionado.
MUESTRAS NO PROBABILISTICAS
Entran en esta categora todas aquellas muestras en las cuales, los individuos se
escogen en base a la opinin personal. La persona que selecciona los elementos de la
muestra, usualmente es un experto en la materia dada.
Muestreo de Juicio
Un "experto" usa el juicio para identificar muestras representativas.
Hay situaciones en las que el muestreo de juicio es til y aconsejable.
a) Hay ocasiones en las que el muestreo probabilstico no es factible o es
prohibitivamente costoso.
Ej. Una muestra aleatoria de homosexuales puede ser imposible de obtener y
una muestra de juicio de aquellos que frecuentan los bares ser ms usada.
b) Si el tamao de la muestra es muy pequeo (menos de 10) una muestra de
juicio generalmente ser ms confiable y representativa que una muestra
probabilstica.
60
TECSUP - PFR
Matemtica II
61
Matemtica II
TECSUP - PFR
pues las diferencias entre los conglomerados son generalmente pequeas, pero las
diferencias entre las unidades dentro de cada conglomerado en general son mayores.
Ejercicios de Muestreo
1. Como seleccionara aleatoriamente 5 estudiantes de un aula de 40 alumnos.
2. Como seleccionara una muestra de 50 estudiantes de TECSUP del 1ro al 6to
ciclo de una sola especialidad.
3. Como seleccionara una muestra de 300 estudiantes de TECSUP del 1ro al 6to
ciclo de las 6 especialidades.
4. Como seleccionara una muestra de 30 computadoras de 4 aulas de laboratorio
de computo de TECSUP.
5. En un proceso de empaquetado de galletas, se desea seleccionar una muestra
100 galletas para determinar la calidad del producto. Si durante un da una
maquina empaquetan 800 galletas. Cul ser el proceso para seleccionar la
muestra?
6. Del problema anterior. Si se trabajan con 30 maquinas diferentes y deseamos
seleccionar las 100 galletas. Cul ser el proceso para seleccionar la muestra?
7. Un profesor quiere investigar sobre el tiempo diario de estudio de 20
estudiantes de una clase
Nombre
Juan
Alicia
Pedro
Marcos
Alberto
Jorge
Jos
Carlos
Miguel
Victoria
Nmero de horas
2,3
1,9
2,0
1,5
1,7
2,2
1,8
1,9
1,9
1,6
Nombre
Mara
Fernanda
Julio
Rosa
Fabin
Ana
Laura
Enrique
Carmen
Marcelo
Nmero de horas
2,9
0,7
0,8
1,0
1,3
2,8
0,8
0,9
1,1
1,2
TECSUP - PFR
Matemtica II
63
Matemtica II
TECSUP - PFR
64
TECSUP - PFR
Matemtica II
Tabulacin
N de familias por
clases
Intervalos de clase o
clases: Ii
[0; 2>
Frecuencias Absolutas:
[2; 4>
[4; 6>
[6; 8>
[8; 10>
[10; 12>
[12; 14>
TOTAL
40
ni
14
En el ejemplo: n = 40
,k=7
Se verifica que:
i
1
14
k
ni n1 n2 n3 n4 n5 n6 n7 14 9 7 1 4 3 2 40 n
i 1
n3= 3
65
Matemtica II
TECSUP - PFR
Tabla N2
Cabezas
de ganado
N de
familias
Marcas
de clase
Frecuencias
relativas
Clases
[0; 2>
ni
xi
hi
14
0,350
[2; 4>
0,225
[4; 6>
[6; 8>
[8; 10>
Frecuencias
relativas
acumuladas
Frecuencias
absolutas
acumuladas
Frecuencias
relativas
porcentuales
Frecuencias
relativas
acumuladas
porcentuales
Hi
Ni
0,35
14
100hi%
35
100Hi%
35
0,575
23
22,5
57,5
0,175
0,750
30
17,5
75
0,025
0,775
31
2,5
77,5
0,100
0,875
35
10
87,5
[10; 12>
11
0,075
0,950
38
7,5
95
[12; 14>
13
0,050
40
100
TOTALES
40
100
xi
Li Li 1
2
i = 1, 2, ....., k
L L2 0 2
x1 1
1
2
2
L L3 2 4
x2 2
3
2
2
......
Se verifica que:
0 hi 1
66
; .....
TECSUP - PFR
Matemtica II
k
hi h1 h2 h3 h4 h5 h6 h7 0,350 0,225 0,175 0,025 0,100 0,075 0,050 1
i 1
i = 1, 2, ....., k
En el ejemplo:
N1 n1 14
N2 n1 n2 14 9 23
N3 30,.... N7 40
Se verifica:
0 Ni 40
Nk N7 40
clase es 31
H i h1 h2 ... hi
Hi
H1 h1 0,350
H2 h1 h2 0,575
H3 0,750,..... H7 1
67
Ni
; i 1, 2, ... , k
n
Matemtica II
TECSUP - PFR
Se verifica:
0 Hi 1
Hk H7 1
2da.clase es 0,575
Ii
Ii
vs. ni
vs. ni
Ii
vs. hi
b) Polgonos de frecuencias
(Fig. N 2)
,n
,h
i
i
i
i
Son polgonos construidos uniendo los puntos
mediante segmentos de recta, o uniendo los puntos medios de los
techos de los rectngulos del histograma. (Fig. N 3)
ni
ni
Histograma
15
Polgono de Frecuencias
15
Fig. N2
Fig. N3
10
10
10
12
14
Ii
68
10
12
14
Ii
TECSUP - PFR
Matemtica II
Ii
vs. Ni
Ii
vs. Hi
(Fig. N 4)
d) Ojivas
Son poligonales asociadas a distribuciones de frecuencias absolutas o
relativas acumuladas construidas como aparece en la Figura N5
Ni
Funcin Escalonada
Ni
Ojiva
40
40
30
30
20
20
10
10
10
12
14
Ii
Fig. N4
10
12
14
Fig. N5
PROBLEMAS PROPUESTOS
1. Los accidentes en una planta de papas fritas se clasifican de acuerdo con la parte
del cuerpo lesionada.
Dedos: 17
Brazos: 2
Ojos: 5
Piernas: 1
69
Ii
Matemtica II
TECSUP - PFR
2. Los siguientes datos son velocidades (en Km/h) de 30 carros que pasaron por un
punto de control de velocidad. Clasificar estos datos convenientemente. Hallar las
tablas de frecuencias, graficar el histograma y la ojiva correspondiente a las
frecuencias absolutas.
60
35
40
30
80
30
20
10
55
40
38
40
46
45
28
60
54
60
105
15
45
38
49
29
82
20
35
38
49
72
3. Los siguientes datos constituyen las vidas tiles en horas de una muestra aleatoria
de 60 bombillas de luz de 100 watts:
807
660
881
766
1056
832
811
753
872
787
1076
863
620
1050
869
923
958
852
650
918
841
792
970
788
815
850
863
799
765
968
725
876
842
937
896
817
743
1027
851
816
740
678
703
889
837
758
891
865
844
878
822
817
1075
759
907
890
811
753
1074
923
c)
70
TECSUP - PFR
Matemtica II
Frecuencias
32
47
75
89
126
38
10
417
862
873
700
790
909
851
926
885
753
784
912
864
857
910
882
922
800
844
847
859
791
931
907
784
903
825
722
917
936
925
935
774
786
706
704
895
903
820
758
792
758
925
930
887
888
890
763
892
914
889
925
805
893
794
791
895
796
915
931
782
768
759
890
701
713
869
916
888
772
724
892
853
865
935
868
895
789
909
887
842
912
943
931
880
892
850
712
710
933
905
920
764
798
905
792
71
Matemtica II
TECSUP - PFR
Toallas desechables: 85
Otros: 12 productos
72
TECSUP - PFR
Matemtica II
10. La siguiente tabla muestra el nmero de jvenes que obtuvieron los puntajes
sealados en una prueba de ingreso.
Puntaje
10 15
15 20
20 25
25 30
30 35
Nmero de Jvenes
10
15
28
20
17
Ii
xi
ni
hi %
22%
,
,
Ni
11
12
,
,
7
6%
73
Matemtica II
TECSUP - PFR
xi
26 ,
ni
Ni
hi %
8,75%
20
20
,
,
44
18,75%
54
63
39
47
21
38
27
30
28
40
43
52
20
48
33
49
23
50
55
52
32
37
35
38
41
43
58
32
60
36
23
42
49
41
36
41
38
23
39
48
22
39
58
57
57
59
49
28
27
41
47
29
45
42
67
26
40
49
33
37
74
TECSUP - PFR
Matemtica II
30
54
49
60
60
70
45
70
31
38
85
80
31
108
39
100
60
35
83
35
65
26
83
55
45
27
30
28
34
24
65
50
20
45
40
60
73
27
72
63
34
40
46
82
68
40
46
64
29
55
105
72
81
75
62
65
35
45
29
63
65
43
43
61
20
60
38
36
80
85
63
69
IMPUESTO
900
360
120
1000
2200
3400
4000
SUELDO
Cunto de impuesto mensual paga una persona que gana s/.1500?. Cunto gana
una persona que paga mensualmente s/.300 de impuesto?
75
Matemtica II
TECSUP - PFR
16. La siguiente tabla de frecuencias muestra los haberes mensuales de 200 obreros
de cierta fbrica, en nuevos soles (ao2000)
Haberes mensuales
Nmero de obreros
Menores a 500
500 , 700
700 , 900
900 , 1100
1100 ,1300
1300 ,1500
1500 ,1700
60
40
48
24
14
8
ms de 1700
TOTAL
200
76
TECSUP - PFR
Matemtica II
DESCRIPCIN DE DATOS
En esta etapa nos ocuparemos del clculo y estudio de los estadgrafos.
Estadgrafos.- Son nmeros que describen alguna caracterstica de la
muestra y se obtienen a partir de los datos muestrales o experimentales.
Existen bsicamente dos tipos de estadgrafos:
a) Estadgrafos de Posicin: Localizan el centro de la distribucin
de frecuencias. Se denominan tambin medidas de tendencia central
o de localizacin. Ejemplos: media, mediana, moda, cuarteles, etc.
b) Estadgrafos de Dispersin: Nos indican como estn dispersos los
datos con respecto a algn estadgrafo de posicin. Miden el grado de
variabilidad de los datos alrededor de alguna medida de tendencia
central, por esta razn, se les denomina tambin estadgrafos de
variabilidad. Ejemplos: rango, la desviacin media, varianza,
desviacin tpica, etc.
2.4.1
MEDIA ( x )
Llamada tambin media aritmtica o promedio aritmtico es un
estadgrafo que localiza el centro de la distribucin en base a
su centro de gravedad y se obtiene a partir de las siguiente
frmulas.
Para datos no clasificados:
Sean x1 , x2 ,..., xn las variables matemticas que representan
n
x
i 1
xn
i i
i 1
x xi hi
i 1
Donde:
k : nmero de clases
77
Matemtica II
TECSUP - PFR
Media Ponderada:
k
x P
i 1
k
i i
P
i 1
Siendo
las
variables
Media global:
Si una muestra de tamao n se particiona en k submuestras
y
Entonces: x
i 1
ni xi
n
muestra particionada.
Ejemplos:
Media de datos no clasificados:
x1 9 ,
x2 5 ,
x3 3 ,
x4 10 ,
x5 8
5
xi
x x2 x3 x 4 x5 9 5 3 10 8
x i 1 1
7
5
5
5
78
TECSUP - PFR
Matemtica II
Tabla N 3
Intervalos de clase
ni
xi
xi ni
hi
xi hi
[10, 26
[26, 42
[42, 58
[58, 74
[74, 90
[90, 106
Total
4
12
7
4
2
1
30
18
34
50
66
82
98
72
408
350
264
164
98
1356
0,133
0,400
0,233
0,133
0,067
0,033
1
2,394
13,600
11,650
8,778
5,494
3,234
45,15
xini
1356
i
x 1
45,2
n
30
x xihi 45,15
i 1
Media ponderada:
Tabla N4
Ex. Parcial
Ex. Final
Notas
Pesos
xi
Pi
xi Pi
05
13
1
3
4
5
39
44
k
xiPi
44
x i 1
11
k
4
Pi
i 1
Media Global:
Si una muestra de tamao 60 se particiona en 5 submuestras de tamaos 8, 18, 12, 9, 13 con medias
15,14,12,8,11 respectivamente. Entonces, la media global
ser:
xini
8 * 15 18 * 14 12 * 12 9 * 8 13 * 11 731
i
x 1
12,18
n
60
60
79
Matemtica II
TECSUP - PFR
2.4.2
MEDIANA
(Xm)
Xm
x n 1
muestrales
tales
que
; si n es impar
1
( xn xn 2 )
2 2
2
; si n es par
x2 6
x3 9
x4 10
x5 14
como n es impar ( n = 5 )
X m x 5 1 x3 9
2
x2 10
x3 17
80
x4 21 x5 29
x6 43
TECSUP - PFR
Matemtica II
como n es par ( n = 6 ) Xm 19
Para datos clasificados:
Est dada por la frmula:
N m 1
X m Lm Wm 2
nm
donde:
Lm
N m 1 : Frecuencia
inmediata
absoluta
acumulada
hasta
la
clase
m 1
N m 1 ni
i 1
nm
Wm
Wm Lm1 Lm
Clase Mediana
Es el intervalo de clase que contiene el dato que ocupa la
posicin media o central. Se identifica observando las
frecuencias acumuladas absolutas o relativas y es aquella que
n
hasta ese nivel acumul la mitad del nmero total de datos ( 2
0,5) o super por primera vez a la mitad.
Clase mediana=
[ Lm , Lm1
Ejemplo:
81
X m [ Lm , Lm1
Matemtica II
TECSUP - PFR
Ta
bl
a
N
5
Velocidades en
Km/h
[10, 26
[26, 42
[42, 58
[58, 74
[74, 90
[90, 106
Total
ni
Ni
Hi
4
12
7
4
2
1
30
4
16
23
27
29
30
0,133
0,533
0,766
0,899
0,966
1
n 30
15
2
2
Lm
26
74
90
n = 12
Wm 16
nm
12
N m 1
30
2 4
Xm 26 16
40, 67
12
Ni
30
25
20
15
10
5
10
26
82
42
58
106
Ii
TECSUP - PFR
Matemtica II
X 3500;
x1 1000,
x2 1000,
x3 1000,
x4 1000,
x5 1000,
x6 16 000
X m = 1000
En este caso, la mediana es la ms representativa en el sentido
que localiza mejor que la media el centro de los datos bajo
consideracin.
Existe un valor extremo bastante discrepante o exagerado
( x6 16 000).
USOS DE LA MEDIA ARITMTICA
La media de la muestra se usa cuando se necesita una
medida de tendencia central que no vare mucho entre una y
otra muestra extrada de la misma poblacin, esta es la
razn para preferirla cuando se desea la mxima
confiabilidad en la estimacin de la media poblacional.
83
Matemtica II
TECSUP - PFR
MODA (
Mo
84
TECSUP - PFR
Matemtica II
1
M o Li Wi
1 2
85
Matemtica II
TECSUP - PFR
Tabla N 6
Ii
ni
[12,5
[20,5
20,5
28,5
1
8
[28,5
[36,5
[44,5
[52,5
36,5
44,5
52,5
60,5
22
26
20
12
[60,5 68,5
[68,5 76,5
TOTALES
6
5
26 -22 = 4
2 =
26 -20 = 6
1
4
Mo 36,5 W
36,5 8
39,7
4 6
1
2
ni
25
20
15
10
5
86
Ii
TECSUP - PFR
Matemtica II
2.4.4
CUARTILES (QI)
Son medidas de posicin que dividen en cuatro partes iguales al
conjunto de valores ordenados en una distribucin de
frecuencias. Estas medidas son: el primer Cuartil Q1, el segundo
Cuartil Q2 y el tercer Cuartil Q3
25%
Q1
Q2
25%
Q3
75%
N i 1
Q1 Li Wi 4
ni
3n
N i 1
Q3 Li Wi 4
ni
Ejemplo
A partir de la siguiente tabla determinar el 25% inferior y el
25% superior.
Tabla N 7
Altura en
pulgadas
[60, 63
ni
Ni
Hi
0,05
[63, 66
18
23
0,23
[66, 69
42
65
0,65
[69, 72
27
92
0,92
[72, 75
100
TOTALES
Para determinar el 25% inferior debemos calcular el primer
cuartil.
Para determinar el 25% superior debemos calcular el tercer
cuartil
Clculo de Q1 :
87
Matemtica II
TECSUP - PFR
n 100
25
4
4
Luego:
100
4 23
Q1 66 3
66,14
42
Clculo de Q3 :
3n 3x100
75
4
4
Luego:
3x100
4 65
Q3 69 3
70,11
27
2.4.5
DECILES ( DI )
Son medidas de posicin que dividen en 10 puntos iguales al
conjunto de los valores ordenados de una distribucin de
frecuencias. Estas medidas son: el primer decil D1, el segundo
decil D2 y as sucesivamente hasta el noveno decil D9.
El primer decil distribuye al lado izquierdo el 10% de los datos y
al otro lado el 90%, es decir, ocupa la posicin n/10.
En igual forma para los dems deciles hasta el noveno decil
9n/10 que deja a la izquierda el 90% de los datos y a la
derecha el 10%.
30%
D1
D2
D3
D4
10%
D5
D6
D7
D8
D9
90%
rn
N i 1
Dr Li Wi 10
ni
88
TECSUP - PFR
Matemtica II
Donde:
Dr = el decil buscado.
Li = lmite inferior del intervalo donde se halla el decil buscado
r = indica el decil. Por ejemplo si queremos el tercer decil r
= 3.
rn
indica la situacin del decil, es decir, la clase donde est el
10
decil
Intervalos
40; 45
45; 50
50; 55
55; 60
60; 65
65; 70
70; 75
75; 80
80; 85
85; 90
Totales
ni
Ni
10
14
18
32
25
57
46
103
53
156
37
193
29
222
18
240
10
250
250
89
Matemtica II
TECSUP - PFR
Clculo de D2:
2n 2x250
50 32
58,6
25
Por frmula: D 55 5
225 222
80,83
18
Por frmula: D 80 5
CARACTERSTICAS DE DISPERSIN
Las dos siguientes series de datos:
95
50
97
75
100
100
103
125
105
150
MEDIDAS DE DISPERSIN
Varianza ( S x2 V( x ) )
Se define:
V( x )
n
2
( xi x)
i 1
2
n
Sx k
( xi x) 2 ni
i 1
90
, datos no clasifcado s
, datos clasificad os
TECSUP - PFR
Matemtica II
V( x )
n x
2
i i
i 1
x ; datos clasificad os
Desviacin Tpica
S x
S x V( x )
Una idea sencilla del significado de la desviacin tpica se
obtiene cuando se comparan dos series de la misma
naturaleza: la que posee una desviacin tpica ms alta es la
ms dispersa.
Coeficiente de variacin (C.V.)
C.V .
Sx
x
91
Matemtica II
TECSUP - PFR
ASIMETRA
Es la deformacin horizontal de las curvas de frecuencias.
Cuando la curva est inclinada o alargada hacia la derecha se
denomina asimetra a la derecha o asimetra positiva (Fig.1).
Observamos que la media aritmtica queda hacia el lado ms
largo (el derecho) y que x X m M o .
Cuando la curva est inclinada o alargada al lado izquierdo se
denomina asimetra a la izquierda o negativa (Fig.2). Notamos
que la media aritmtica est del lado ms largo (el izquierdo) y
que x X m M o .
En la Fig. 3 observamos que la curva est igualmente inclinada
a los dos lados por eso se llama curva simtrica. En este caso:
x Xm Mo
Fig. 1
Fig. 2
Mo Md x
Fig. 3
x Md M o
x
Md
Mo
AS1
Media Moda
desviacin estndar
AS1
x Mo
Sx
92
TECSUP - PFR
Matemtica II
ni
xi
xi X 2 ni
xi.ni
ni xi2
18
2959,36
72
1296
12
34
1505,28
408
13872
50
161,28
350
17500
66
1730,56
264
17424
82
2708,48
164
13448
98
2787,84
98
9604
11852,8
1356
73144
Ii
10; 26
26; 42
42; 58
58; 74
74; 90
90;106
Total
30
V(x)
Sx
11852,8
395,09
30
395,09 19,88
Sx
19,88
C.V.
0, 44
45,2
X
V(x)
1356
45,2
30
8
M0 26 16
35,85
8 5
e l(A) 105 10 95
30
4 4
Q1 26 16
30, 67
12
90
4 16
Q3 42 16
56,86
7
93
73144
45,22 395,09
30
Matemtica II
TECSUP - PFR
30
10 0
D1 10 16
22
4
270
10 23
D9 58 16
74
4
RID D9 D1 74 22 52
AS1
AS1
X Mo
Sx
45,2 35,85
0, 47
19,88
94
TECSUP - PFR
Matemtica II
PROBLEMAS PROPUESTOS
1.
2.
3.
4.
81.47
64.90
70.88
86.02
77.25
76.76
84.21
84.92
90.23
78.01
88.05
73.37
87.09
57.41
85.43
74.76
86.51
86.37
76.15
88.64
84.71
66.05
83.91
56.02
a)
b)
Agrupar los datos en una tabla de frecuencias cuyas marcas de clase sean:
60, 70, etc. y calcular la desviacin tpica y la mediana.
5.
6.
95
Matemtica II
TECSUP - PFR
Ii
ni
Ni
xi
30
ni xi2
600
800
46
,
,
xi ni
700
34
880
,120
,
TOTALES
a) Determinar la media, la mediana y los cuartiles de la distribucin.
b) El N de datos que estima pertenezcan al intervalo [media, mediana].
c) La desviacin estndar.
d) El intervalo interdeclico. Precisar el significado del resultado obtenido.
7.
Ii
,
12.5 ,
,
,
, 72.5
ni
Ni
xi
10
xi ni
ni xi2
180
42
30
360
750
98
120
TOTALES
96
TECSUP - PFR
8.
Matemtica II
Cantidades
0
3
8
18
31
51
69
84
95
99
100
0
10.
510
460
475
420
490
480
450
435
485
470
465
500
455
435
97
Matemtica II
11.
TECSUP - PFR
Ni
90
90
83
72
75
60
45
45
30
15
Ii
650
12.
1150
1650
2150
2650
3150
Nmero de
trabajadores
15
24
29
38
24
20
600 , 900
900 , 1400
1400, 1700
1700, 2100
2100, 2400
2400 , 2600
Por incremento del costo de vida se plantean dos alternativas de aumento para el
mes siguiente. La primera propuesta consiste en un aumento general de 350
soles mensuales.
La segunda propuesta consiste en un aumento del 30% de los salarios de Abril a
los trabajadores que ganan menos de 2100 soles y del 5% a los trabajadores que
98
TECSUP - PFR
Matemtica II
ganan ms de 2100 soles y un aumento adicional de 100 soles para todos los
trabajadores.
a) Cul de las propuestas convendra a los trabajadores?
b) Para los trabajadores que ganan menos de 2100 soles Qu propuesta les
convendra?
13.
14.
15.
ni
80 a menos de 90 cm
90 a menos de 95 cm
95 a menos de 100 cm
100 a menos de 105 cm
105 a menos de 110 cm
110 a menos de 120 cm
TOTALES
3
15
22
18
12
5
ni xi2
xi ni
xi
xi
150
300
420
570
ni
11
Hallar x y S x
99
Matemtica II
17.
TECSUP - PFR
Pesos
10 ,
,
,
,
18 ,
,
ni
Ni
13%
100 hi %
142
TOTALES
Cunto resulta a+b-c?.
Nota.- el ancho de clase es constante
Cualitativa vs cualitativa
Cualitativa vs cuantitativa
100
TECSUP - PFR
Matemtica II
Total
Celda
Celda
Total marginal
f11
f12
f1.
Celda
Celda
Total marginal
f21
f22
f2.
Total
Total
Total de
marginal
marginal
individuos
f.1
f.2
Categora 1
Categora 2
Total
Distribucin Marginal
Cuando slo interesa conocer la frecuencia de ocurrencia de cada una de las
variables por separado se habla de Frecuencia Marginal de la variable
Por ejemplo:
Hbitos de Fumar
SI
NO
Total
MUJER
DISTRIBUCION
CONJUNTA
DISTRIBUCION
MARGINAL
Total
DISTRIBUCION
MARGINAL
Tamao
de
muestra
SEXO
VARON
101
Matemtica II
TECSUP - PFR
SI
VARON
MUJER
Total
Hbitos de Fumar
NO
Total
800
1200
2000
1000
2000
3000
1800
3200
5000
X/Y
Categora
Categora
variable Y
variable Y
f11
f12
marginal
f1./n
f21
f22
marginal
f2./n
Total
Total
Total de
marginal
marginal
indivduos
f.1/n
f.2/n
n/n
Total
Total
Categora
variable X
Total
Categora
variable X
Total
102
TECSUP - PFR
Matemtica II
Hbitos de Fumar
SI
NO
0.16
0.24
0.20
0.40
0.36
0.64
SEXO
VARON
MUJER
Total
Total
0.40
0.60
1
Frecuencia Condicional
Cuando se pregunta por la frecuencia relativa de una de las variables, digamos
X, restringida a los elementos observados de una clase dada de la otra; esto es,
estudiar el comportamiento de una variable dado un valor fijo de la otra.
Y
Categora
Categora
variable Y
variable Y
Categora 1
f1 / f.1
f12/f.2
Categora 2
f21/f.1
f22/f.2
Total
EJERCICIO
En la ciudad de Lima se ha incrementado durante los ltimos cinco aos el nmero de
restaurantes de comida rpida. Debido a esto los expertos la empresa de investigacin
de mercado Consultores-ECE se pregunta. La preferencia de un cliente por la comida
rpida tiene que ver la edad?. La empresa eligi una muestra aleatoria de 500 clientes
de comida rpida mayores de 16 aos y se les pregunt su restaurante favorito,
obtenindose los siguientes datos:
Grupo de
edad
16 - 21
21 - 30
30 - 49
50 a ms
Kentuky
75
89
54
21
Restaurant
McDonalds Burger-King
34
10
42
19
52
28
25
7
Otro
6
10
18
10
103
Matemtica II
TECSUP - PFR
ANOTACIONES:
104