You are on page 1of 50

TECSUP - PFR

Matemtica II

UNIDAD VII

ESTADSTICA

1.

INTRODUCCIN
El actual desarrollo cientfico-tecnolgico de la sociedad, en casi todos sus
niveles, exige permanentemente el manejo de una gran masa de datos que por
su extensin hace prcticamente imposible el proceso de manipulacin de ellos y
por tanto se dificulta enormemente los estudios y conclusiones que deben
obtenerse en cada situacin concreta.
El mtodo estadstico es uno de los procesos que utilizamos para tratar de
resolver tales situaciones y as poder efectuar el tipo de generalizaciones que nos
permitan la comprensin de un fenmeno econmico, social, fsico, poltico, etc.
La industria precisa de la informacin estadstica para poder tomar decisiones en
materia de inversin, planeacin, ventas, produccin, etc.
El estado utiliza este instrumento para estimar la recaudacin de impuestos, para
control de precios y de productos, para proyectar la construccin de obras de
infraestructura, para investigaciones en materia econmica que le permitan
aplicar nuevas y mejoras polticas ajustadas a sus propsitos y metas. La
medicina, la qumica, la fsica, las ciencias sociales, en fin todas las reas de la
ciencia, precisan de los conceptos y tcnicas estadsticas para su desarrollo.
1.1

POBLACIN Y MUESTRA
Poblacin es el conjunto mayor de personas o cosas cuyo estudio nos
interesa o acerca de los cuales se desea informacin. Los elementos de
este conjunto se denominan datos u observaciones.
La poblacin puede ser infinita, y por tanto, es imposible tener una
informacin completa sobre ella o si la poblacin es numerosa y no sea
posible estudiar todos y cada uno de sus elementos, se acude a la
informacin proporcionada por una parte finita de dicha poblacin
llamada muestra.
En trminos matemticos: Poblacin es el universo de la teora de
conjuntos y muestra es un subconjunto propio finito de la poblacin.

1.2

ESTADSTICA
Disciplina que nos proporciona un conjunto de mtodos y procedimientos
que nos permitan recopilar, clasificar, presentar y describir datos en
forma adecuada para tomar decisiones frente a la incertidumbre o

55

Matemtica II

TECSUP - PFR

predecir o afirmar algo acerca de la poblacin a partir de los datos


extrados de la misma.
Esta definicin nos permite distinguir la Estadstica Descriptiva de la
Inferencial.
Estadstica Descriptiva.- trata de la recopilacin, clasificacin,
presentacin y descripcin de los datos.
Estadstica Inferencial.- nos proporciona la teora necesaria para
afirmar algo acerca de la poblacin o tomar decisiones generales a
partir de los datos bajo estudio.
1.3

CICLO METODOLGICO DE UN TRABAJO ESTADSTICO


Cuando no sea posible obtener una informacin completa de la poblacin,
se extraen muestras representativas de dicha poblacin mediante las
tcnicas de muestreo, y en base al estudio o informacin obtenidas de los
datos muestrales se afirma algo acerca de la poblacin total o se toman
decisiones generales confiables con ayuda de la Estadstica Inferencial.
Este ciclo se cumple en la mayora de las veces del quehacer estadstico

POBLACIN

Estadstica
Descriptiva

(Tcnicas de muestreo)

MUESTRA

MUESTRA

Estadstica
Inferencial
1.4

VARIABLES
La estadstica se interesa fundamentalmente en el estudio de ciertas
variables llamadas aleatorias, cuyo comportamiento lo veremos luego. Por
ahora se especificar que existen dos tipos de variables estadsticas, a
saber:
Variables discretas: aquellas que solo pueden tomar valores enteros. Por
ejemplo, el nmero de hijos de una familia, el nmero de objetos
producidos por una mquina, etc., pueden ser descritos mediante una
variable del tipo discreto:

x = 1, 2, 3, 4, etc.

56

TECSUP - PFR

Matemtica II

Variables continuas: aquellas cuyo campo de variacin o conjunto de


valores a tomar son nmeros reales pertenecientes a cierto intervalo. Por
ejemplo, pesos de individuos, estaturas, medidas de longitud, dimetros
de piezas producidas por una o varias mquinas pueden ser descritos
mediante variables del tipo continuo. As, si 1 x 2; x es una variable
que puede tomar cualquier nmero real comprendido entre 1 y 2 incluidos
ambos.
2.

ESTADSTICA DESCRIPTIVA
La estadstica descriptiva se ocupa de la recopilacin, clasificacin, presentacin y
descripcin de los datos.
RECOPILACIN
Los datos pueden recopilarse de dos maneras fundamentales:
a) Si se consideran todos los elementos de la poblacin y se registran
sus caractersticas se denomina censo.
b) Si se seleccionan algunos elementos de la poblacin, pero no todos,
se denomina muestra y la informacin obtenida por este
procedimiento se llama por muestreo; si la recopilacin de los
elementos muestrales se efecta al azar se dice que el muestreo es
aleatorio y la muestra se denomina muestra aleatoria.
Un ejemplo de una recopilacin completa o censo es el Censo Poblacional
del Per realizado en el ao 1993.
CLASIFICACIN
Los datos obtenidos por observacin o medicin suelen ser registrados en
el orden en que se recopilan. Para facilitar su interpretacin y el anlisis
correspondiente deben ser clasificados y esto equivale a que los datos
deben ser organizados de alguna manera sistemtica o particionado en
clases bien definidas y una manera sencilla de hacerlo es ordenar los
datos segn su magnitud o agruparlos de acuerdo a sus caractersticas.
PRESENTACIN DE DATOS
Una vez recolectados los datos y optado por su posible clasificacin es
necesario presentarlos en forma tal que se facilite su comprensin y su
posterior anlisis. Para ello se ordenan en cuadros numricos llamados
TABLAS (Tablas de frecuencias) y luego se presentan mediante GRFICAS
(de barras, sectores circulares, histograma, polgono de frecuencias, ojiva,
pictograma, etc.)
Haremos algunas definiciones en base a un ejemplo: Clasificar los
siguientes datos recopilados del nmero de cabezas de ganado vacuno

57

Matemtica II

TECSUP - PFR

que posee cada una de las 40 familias de las comunidades campesinas de


la Sierra Central del Per, tomados al azar.
1
4
0
5

2
3
0
4

0
3
4
6

3
5
9
8

5
12
0
11

1
10
1
0

0
4
3
1

8
3
13
3

1
0
1
8

2
10
3
0

Alcance (A): es el intervalo definido por los datos de mayor y menor


valor.
En el ejemplo:

A 0; 13

Intervalos de clase ( Ii ) y Lmites de clase ( Li ): clasificar los


datos en k grupos equivale a particionar el alcance A en k clases o k
intervalos Ii ,donde: i=1, 2, ...,k
y determinar cuntos datos
pertenecen a cada uno.

I i Li , Li 1 , i=1, 2, ...,k
Los intervalos semi-abiertos por la derecha Ii se denominan intervalos de
clase.
Los Li , i=1, 2, ...,k+1 se denominan los lmites de clase.
El valor entero de k, fundamentalmente, depende del estadstico y/o
investigador, pero es recomendable utilizar la regla de Sturges para
determinar un valor aproximado de k:

k 1 3,3logn
Donde n es el nmero total de datos disponibles.
La frmula es un poco conservadora y nos da un nmero de intervalos
un poco menor del que se utiliza en la prctica. Cuando el nmero de
datos es menor que 100, el nmero de intervalos se debe tomar menor
que 10. Para un nmero de datos bastante grande, el nmero de
intervalos es mayor que 10, la prctica aconseja los siguientes lmites: 5
k 15 .
En el ejemplo:
k = 1 + 3,3 log(40) = 6,286
Luego k podr tomar valores enteros: 5, 6 o 7
Tomemos:

k=7.

58

TECSUP - PFR

Matemtica II

Ancho de Clase ( Wi ): es la longitud de un intervalo de clase.

Wi l ( I i ) Li 1 Li
Para conseguir anchos de clase iguales (W ), como es deseable; se usa
la siguiente relacin:

l ( A)
, donde l (A) es la longitud del alcance.
k

En el ejemplo:
W

13
1,857
7

tomamos W = 2

Frecuencia Absoluta (ni ): una vez decidido el valor de k y calculado


el ancho de clase. Mediante la tabulacin se determina el nmero de
datos contenidos en cada clase y este nmero entero se denomina
frecuencia absoluta( ni )

ni : frecuencia absoluta de i sima clase .


SELECCIN DE LA MUESTRA
Evaluar el comportamiento de una o varias caractersticas o variables de una poblacin
sera muy costoso, por lo que la estadstica nos brinda procedimientos para seleccionar
a una parte de esa poblacin y analizarla de tal forma que sus caractersticas coincidan
con la poblacin.
Definiciones Bsicas
Poblacin: Es el conjunto de unidades del universo a las cuales se enfoca
el estudio de investigacin.
Segn el nmero de elementos la poblacin puede ser finita o infinita. Cuando el
nmero de elementos que integra la poblacin es muy grande, se puede considerar a
esta como una poblacin infinita.
Muestra: Es el conjunto de unidades extradas de la poblacin y se espera que sea lo
ms representativa de ella.
Marco muestral: Es el listado o instrumento que contiene todas las unidades
que integran la poblacin estudiada, el cual sirve de soporte para la
extraccin de la muestra.
El muestreo ofrece algunos beneficios importantes en comparacin con la
realizacin de un censo.

59

Matemtica II

TECSUP - PFR

1. Una muestra ahorra dinero.


2. Una muestra ahorra tiempo; en cuanto a las horas de entrevistas, de
impresin del cuestionario, entrenar a los entrevistadores y preparar los
cuestionarios completos para el anlisis de la informacin.
3.

Una muestra puede ser ms precisa. Mientras ms pequea sea el estudio,


sern mayores las posibilidades de obtener ms personal calificado para
cada una de las etapas del proceso de investigacin. Adems un censo
puede tomar tanto tiempo que el fenmeno de mercado que se est
analizando puede haber cambiado.

PROCEDIMIENTOS DE MUESTREO
A) Muestreo probabilstico: cada elemento de la poblacin tiene una
oportunidad conocida de ser seleccionado para la muestra. Ntese que
decimos una oportunidad conocida y no una oportunidad igual de ser
seleccionado
B) Muestreo no probabilstico: la seleccin de un elemento de la poblacin
para que forme parte de la muestra se basa en parte en el juicio del
investigador o del entrevistador de campo. No existe una oportunidad
conocida de que cualquier elemento particular de la poblacin sea
seleccionado.
MUESTRAS NO PROBABILISTICAS
Entran en esta categora todas aquellas muestras en las cuales, los individuos se
escogen en base a la opinin personal. La persona que selecciona los elementos de la
muestra, usualmente es un experto en la materia dada.
Muestreo de Juicio
Un "experto" usa el juicio para identificar muestras representativas.
Hay situaciones en las que el muestreo de juicio es til y aconsejable.
a) Hay ocasiones en las que el muestreo probabilstico no es factible o es
prohibitivamente costoso.
Ej. Una muestra aleatoria de homosexuales puede ser imposible de obtener y
una muestra de juicio de aquellos que frecuentan los bares ser ms usada.
b) Si el tamao de la muestra es muy pequeo (menos de 10) una muestra de
juicio generalmente ser ms confiable y representativa que una muestra
probabilstica.

60

TECSUP - PFR

Matemtica II

Muestreo por cuotas


Es un muestreo de juicio, con la restriccin de que la muestra incluye un
nmero mnimo de cada subgrupo especificado dentro de la poblacin.
Se basa frecuentemente en datos demogrficos como localizacin geogrfica,
edad, sexo, educacin e ingreso.
MUESTRAS PROBABILSTICAS.
Son aquellas en que cada individuo de la poblacin tiene una probabilidad
perfectamente conocida de ser incluida en la muestra. No es ni siquiera necesario que
los diferentes individuos tengan un igual chance de pertenecer a la muestra, basta con
que tengan cualquier posibilidad (diferente de cero) de formar parte de ella y que esa
probabilidad sea conocida.
Primero.- Es esencial que la probabilidad de elegir cada individuo sea perfectamente
conocida, pues si no lo es, no ser posible calcular errores que puedan cometerse al
hacer su seleccin.
Segundo.- Es indispensable que los individuos se elijan al azar, sin permitir la
intervencin de ningn factor que favorezca la eleccin de unos en detrimento de los
otros.
Muestreo Aleatorio Simple
En este caso cada observacin tiene la misma probabilidad de ser seleccionada.
Ejemplo: para seleccionar al delegado del aula en forma aleatoria, todos ponen su
nombre en un papelito, lo introducen dentro de una bolsa, y luego cogen uno al azar.
Tambin puede simplificarse el mtodo de seleccin empleando la tabla de nmeros
aleatorios y un computador.
Muestreo Sistemtico
Se selecciona una muestra tomando k-sima unidad de la poblacin una vez que todos
los elementos de la poblacin estn numerados a arreglados en una lista.
Entonces si se va a seleccionar una muestra de 40 unidades a partir de una poblacin
de 1000 unidades, la muestra se obtiene tomando cada 25 sima (1000 /40 ) unidad
de la poblacin.
Puede utilizarse el procedimiento de la urna para determinar con cul de las primeras
25 unidades se deben empezar.
Muestreo Estratificado
Seleccin aleatoria en estratos de diferente tamao de acuerdo a su peso relativo.
Ejemplo: se desea asistir a una visita en una empresa y que se beneficien los alumnos
de todas los departamentos de Tecsup. Por especialidad, el nmero de alumnos
difieren entre ellos, por lo tanto debo tomar una muestra que refleje el peso relativo de
cada especialidad.
Muestreo por Conglomerado
Permite dividir la poblacin en grupos y seleccionar una muestra de estos
conglomerados. El muestreo por conglomerado es diferente del muestreo estratificado,

61

Matemtica II

TECSUP - PFR

pues las diferencias entre los conglomerados son generalmente pequeas, pero las
diferencias entre las unidades dentro de cada conglomerado en general son mayores.
Ejercicios de Muestreo
1. Como seleccionara aleatoriamente 5 estudiantes de un aula de 40 alumnos.
2. Como seleccionara una muestra de 50 estudiantes de TECSUP del 1ro al 6to
ciclo de una sola especialidad.
3. Como seleccionara una muestra de 300 estudiantes de TECSUP del 1ro al 6to
ciclo de las 6 especialidades.
4. Como seleccionara una muestra de 30 computadoras de 4 aulas de laboratorio
de computo de TECSUP.
5. En un proceso de empaquetado de galletas, se desea seleccionar una muestra
100 galletas para determinar la calidad del producto. Si durante un da una
maquina empaquetan 800 galletas. Cul ser el proceso para seleccionar la
muestra?
6. Del problema anterior. Si se trabajan con 30 maquinas diferentes y deseamos
seleccionar las 100 galletas. Cul ser el proceso para seleccionar la muestra?
7. Un profesor quiere investigar sobre el tiempo diario de estudio de 20
estudiantes de una clase
Nombre
Juan
Alicia
Pedro
Marcos
Alberto
Jorge
Jos
Carlos
Miguel
Victoria

Nmero de horas
2,3
1,9
2,0
1,5
1,7
2,2
1,8
1,9
1,9
1,6

Nombre
Mara
Fernanda
Julio
Rosa
Fabin
Ana
Laura
Enrique
Carmen
Marcelo

Nmero de horas
2,9
0,7
0,8
1,0
1,3
2,8
0,8
0,9
1,1
1,2

En cada alternativa, use la tabla de nmeros aleatorios, empiece en la fila 1


columna 1 y contine seleccionando hacia la derecha.
a) Elija una muestra aleatoria simple de tamao n=4 de esta poblacin.
b) Calcule la media y desviacin estndar en (a).
c) Elija una muestra estratificada de tamao n=4 por sexo de esta
poblacin
d) Calcule la media aritmtica y desviacin estndar de cada estrato
8. El gerente de una compaa de urbanizacin quiere averiguar las
opiniones de los residentes ante las instalaciones recreativas del lugar
y los mejoramientos que les gustara que se hicieran. En la poblacin
viven residentes de varias edades y niveles de ingresos, pero una gran
proporcin es de clase media y su edad flucta entre 30 y 50 aos. El
gerente todava no est seguro de que haya diferencias entre los grupos
62

TECSUP - PFR

Matemtica II

de edades o los niveles de ingresos respecto al deseo de las


instalaciones recreativas. Conviene aplicar en este caso el muestreo
estratificado?
9. Un fabricante de cmaras fotogrficas est tratando de investigar cules
son, a juicio de los empleados, los principales problemas de la compaa
y que mejoramientos se necesitan hacer. Con objeto de evaluar las
opiniones de los 37 departamentos, la gerencia est estudiando un plan de
muestreo. Se ha recomendado al jefe de personal que la gerencia adopte un
plan de muestreo por conglomerados. La gerencia escoger 6 departamentos
y entrevistar a todos los empleados. Luego de reunir y valorar los
datos recabados de ellos, la compaa estar en condiciones de introducir
cambios y planear las reas de mejoramiento del trabajo. Es apropiado un
plan de muestreo por conglomerados?
10. El presidente de una compaa quiere ofrecer a los empleados cursos con
cintas de video durante la hora de la comida; desea adems recibir
sugerencias de los cursos que los empleados desearan que fueran
impartidos. As, pues ha ideado una papeleta que el empleado puede llenar
en 5 minutos, anotando en ella sus preferencias entre los cursos
posibles. La papeleta cuya impresin cuesta muy poco, sern distribuidas
con los cheques de nmina; los resultados sern tabulados por el personal
administrativo de un grupo recin disuelto de la compaa. El presidente
de ella proyecta encuestar a todos los empleados Hay motivos que
justifiquen encuestar una muestra de empleados y no toda la poblacin?

63

Matemtica II

TECSUP - PFR

64

TECSUP - PFR

Matemtica II

Distribucin de Frecuencias Absolutas:


Tabla N1
Cabezas de ganado

Tabulacin

N de familias por
clases

Intervalos de clase o
clases: Ii
[0; 2>

Frecuencias Absolutas:

[2; 4>

[4; 6>

[6; 8>

[8; 10>

[10; 12>

[12; 14>

TOTAL

40

ni

14

En el ejemplo: n = 40

,k=7

Se verifica que:

i
1
14
k
ni n1 n2 n3 n4 n5 n6 n7 14 9 7 1 4 3 2 40 n
i 1

n3= 3

, se lee: la frecuencia absoluta de la tercera clase es

Los intervalos de clase son:


I1 0;2 , I2 2; 4 , I3 4;6 , I4 6;8 , I5 8;10 , I6 10;12 , I7 12;14

Los lmites de clase son:


L1 0, L2 2, L3 4, L4 6, L5 8, L6 10, L7 12, L8 14

65

Matemtica II

TECSUP - PFR

Tabla N2
Cabezas
de ganado

N de
familias

Marcas
de clase

Frecuencias
relativas

Clases
[0; 2>

ni

xi

hi

14

0,350

[2; 4>

0,225

[4; 6>

[6; 8>

[8; 10>

Frecuencias
relativas
acumuladas

Frecuencias
absolutas
acumuladas

Frecuencias
relativas
porcentuales

Frecuencias
relativas
acumuladas
porcentuales

Hi

Ni

0,35

14

100hi%
35

100Hi%
35

0,575

23

22,5

57,5

0,175

0,750

30

17,5

75

0,025

0,775

31

2,5

77,5

0,100

0,875

35

10

87,5

[10; 12>

11

0,075

0,950

38

7,5

95

[12; 14>

13

0,050

40

100

TOTALES

40

100

Sigamos con las definiciones, observando la tabla N2:


Marcas de Clase ( xi ): son los puntos medios de los intervalos de
clase.

xi

Li Li 1
2

i = 1, 2, ....., k

L L2 0 2
x1 1

1
2
2
L L3 2 4
x2 2

3
2
2

......

x3 = 5 , se lee: la marca de clase del tercer intervalo de clase es 5


n
Frecuencias Relativas ( hi ): se define: hi i ; i = 1, 2, ....., k
n
n
14
h1 1
0,350
n
40
n
9
h2 2
0,225
n
40

Se verifica que:
0 hi 1

66

; .....

TECSUP - PFR

Matemtica II

k
hi h1 h2 h3 h4 h5 h6 h7 0,350 0,225 0,175 0,025 0,100 0,075 0,050 1
i 1

h3= 0,175, se lee: la frecuencia relativa de la tercera clase es 0,175


Frecuencia Relativa Porcentual (100 hi%)
Nos permite contestar preguntas del siguiente tipo: Qu porcentaje
de familias, de las 40 bajo estudio, tienen 4 5 cabezas de ganado?
Respuesta: 17,5 %
Frecuencia Absoluta Acumulada ( Ni ):
Se define:
Ni = n1 + n2 + .... + ni

i = 1, 2, ....., k

En el ejemplo:
N1 n1 14
N2 n1 n2 14 9 23
N3 30,.... N7 40

Se verifica:
0 Ni 40
Nk N7 40

N 4 31, se lee: la frecuencia absoluta acumulada hasta la cuarta

clase es 31

Frecuencia Relativa Acumulada ( Hi ):


Se define:

H i h1 h2 ... hi

Hi

H1 h1 0,350
H2 h1 h2 0,575
H3 0,750,..... H7 1

67

Ni
; i 1, 2, ... , k
n

Matemtica II

TECSUP - PFR

Se verifica:
0 Hi 1
Hk H7 1

H 2 0,575, se lee: la frecuencia relativa acumulada hasta la

2da.clase es 0,575

Frecuencia Relativa Acumulada Porcentual (100 Hi%):


Nos permite contestar preguntas del siguiente tipo: Qu porcentaje
de familias, de las 40 bajo estudio tienen menos de 8 cabezas de
ganado?
Respuesta: 77,5 %
Grficas
Las distribuciones de frecuencias pueden ser representadas grficamente
mediante:
a) Histogramas
Son grficas de barras o rectngulos cuyas bases representan los
intervalos de clase y las alturas las frecuencias absolutas o relativas.

Ii
Ii

vs. ni
vs. ni

Ii

vs. hi

b) Polgonos de frecuencias

(Fig. N 2)

,n

,h

i
i
i
i
Son polgonos construidos uniendo los puntos
mediante segmentos de recta, o uniendo los puntos medios de los
techos de los rectngulos del histograma. (Fig. N 3)

ni

ni

Histograma

15

Polgono de Frecuencias

15

Fig. N2

Fig. N3

10

10

10

12

14

Ii

68

10

12

14

Ii

TECSUP - PFR

Matemtica II

c) Diagramas escalonados o funciones escalonadas


Son grficas de barras o rectngulos cuyas bases representan los
intervalos de clase y las alturas las frecuencias absolutas o relativas
acumuladas.

Ii

vs. Ni

Ii

vs. Hi

(Fig. N 4)

d) Ojivas
Son poligonales asociadas a distribuciones de frecuencias absolutas o
relativas acumuladas construidas como aparece en la Figura N5

Ni
Funcin Escalonada

Ni

Ojiva

40

40

30
30

20
20

10

10

10

12

14

Ii

Fig. N4

10

12

14

Fig. N5

PROBLEMAS PROPUESTOS
1. Los accidentes en una planta de papas fritas se clasifican de acuerdo con la parte
del cuerpo lesionada.
Dedos: 17
Brazos: 2

Ojos: 5
Piernas: 1

69

Ii

Matemtica II

TECSUP - PFR

Trace un diagrama de barras

2. Los siguientes datos son velocidades (en Km/h) de 30 carros que pasaron por un
punto de control de velocidad. Clasificar estos datos convenientemente. Hallar las
tablas de frecuencias, graficar el histograma y la ojiva correspondiente a las
frecuencias absolutas.

60
35
40
30
80

30
20
10
55
40

38
40
46
45
28

60
54
60
105
15

45
38
49
29
82

20
35
38
49
72

3. Los siguientes datos constituyen las vidas tiles en horas de una muestra aleatoria
de 60 bombillas de luz de 100 watts:
807
660
881
766
1056
832

811
753
872
787
1076
863

620
1050
869
923
958
852

650
918
841
792
970
788

815
850
863
799
765
968

725
876
842
937
896
817

743
1027
851
816
740
678

703
889
837
758
891
865

844
878
822
817
1075
759

907
890
811
753
1074
923

a) Constryase una distribucin de frecuencias con anchos de clases iguales


b)

Trcese el polgono de frecuencias sobre un Histograma de intervalos de


clases vs. frecuencias relativas.

c)

Trcese la ojiva asociada a la funcin escalonada representando intervalos de


clases vs. frecuencias absolutas acumuladas.

70

TECSUP - PFR

Matemtica II

4. La siguiente tabla muestra la distribucin de los empleados de una compaa


aseguradora por sueldos mensuales en nuevos soles (ao 2001)
Clases
menos de 450
450 a menos de 900
900 a menos de 1350
1350 a menos de 1800
1800 a menos de 2500
2500 a menos de 4250
4250 a mas
TOTAL

Frecuencias
32
47
75
89
126
38
10
417

a) Qu porcentaje de empleados ganan sueldos mensuales inferiores a 900


nuevos soles?. Qu porcentaje ganan 2500 nuevos soles o ms?
b) Qu porcentaje de empleados ganan entre 1350 y 4250 nuevos soles?
c) Determinar los anchos y las marcas de clase.
Nota.- Se averigu que el mximo haber percibido en la compaa es de 5500
nuevos soles. Si no se tiene ninguna informacin se asume un mximo valor
de acuerdo al problema en cuestin; as como se supondr cero, como el
haber mnimo.
5. Para un estudio sobre resistencia de un metal, se han realizado cien experiencias
de rotura frente a la carga de un hilo del mismo grosor, y han sido anotados los
pesos lmites en cada caso.
Cargas de rotura de un hilo en gramos
711
915
853
789
941

862
873
700
790
909

851
926
885
753
784

912
864
857
910
882

922
800
844
847
859

791
931
907
784
903

825
722
917
936
925

935
774
786
706
704

895
903
820
758
792

758
925
930
887
888

890
763
892
914
889

925
805
893
794
791

895
796
915
931
782

768
759
890
701
713

869
916
888
772
724

892
853
865
935
868

895
789
909
887
842

912
943
931
880
892

850
712
710
933
905

920
764
798
905
792

a) Reagrupar estos datos en 7 intervalos de clase de igual longitud.


b) Trcese el histograma y el polgono de frecuencias.

71

Matemtica II

TECSUP - PFR

c) Trcese la ojiva correspondiente, y conteste:


Qu porcentaje presentan una carga no menor de 770 gramos?
Qu porcentaje presentan una carga entre 800 y 900 gramos?
6. Las distribuciones cualitativas o por categoras se suelen presentar en diagramas
de sectores en la que un crculo aparece dividido en sectores proporcionales en su
abertura a las frecuencias de las categoras que representan:
a) Construir un diagrama de sectores para trasmitir la informacin de que (segn las cifras
ms recientes disponibles) en el Per el nmero total de botellas de vino
consumidas provienen el 69% de ICA, el 18% de otras partes del pas, el 5%
se importan de Francia y el resto de otros pases.
b) Dibujar un diagrama de sectores para mostrar que en un hospital de una gran
ciudad la distribucin de su presupuesto es como sigue: 73% de sueldos,
honorarios profesionales mdicos y bonificaciones a los empleados; 13% en
suministros y equipo mdico y quirrgico; 8% en mantenimiento, alimentacin
y energa y el 6% en gastos administrativos.
7. En 1972, la poblacin activa de Francia estaba compuesta de:
11,1% de agricultores,
10,6% de patronos,
16,5% de ejecutivos,
16,7% de empleados,
38,6% de obreros,
6,5% de personal de servicios y otras categoras.
Representar esta distribucin mediante el grfico que parezca ms adecuado.
8. Las prdidas en una fbrica de papel (en miles de dlares) debidas a rasgaduras
pueden dividirse segn el producto:
Papel higinico: 132
Servilletas: 43

Toallas desechables: 85
Otros: 12 productos

a) Trace un diagrama en barras.


b) Qu porcentaje de las prdidas ocurre en la elaboracin de papel higinico?.
c) Qu porcentaje de las prdidas ocurre en la elaboracin de papel higinico o
toallas desechables?
9. Los pesos de ciertos especimenes minerales, dados en la dcima ms cercana de
una onza, se agrupan en una tabla con los intervalos: 10,5 11,4; 11,5 12,4;
12,5 13,4; y 13,5 14,4 onzas.

72

TECSUP - PFR

Matemtica II

a) Determine las marcas de clase.


b) Es posible determinar a partir de los datos agrupados cuntos especimenes
minerales pesan?:

Menos de 11, 5 onzas.


Ms de 11,5 onzas.
Al menos 12,4 onzas.
Cuando mucho 12,4 onzas.
De 11,5 a 13,5 onzas?

10. La siguiente tabla muestra el nmero de jvenes que obtuvieron los puntajes
sealados en una prueba de ingreso.
Puntaje
10 15

15 20
20 25
25 30
30 35

Nmero de Jvenes
10
15
28
20
17

Siendo A el porcentaje de jvenes con puntaje mayor a 20, B el porcentaje de


jvenes con puntaje menor a 15. Seale el valor de A-B

11. Dado el tablero incompleto de la distribucin de frecuencias de las notas de 50


alumnos. Completar el tablero, con un ancho de clase constante e igual a 2.
Seale: Cuntos alumnos sacaron un puntaje menor de 10? y Qu porcentaje de
alumnos obtuvieron 12 ms de 12 pero menos de 16?

Ii

xi

ni

hi %

22%

,
,

Ni

11

12

,
,

7
6%

73

Matemtica II

TECSUP - PFR

12. Dada la siguiente tabla incompleta, de las frecuencias de las edades de 80


empleados:
Ii

xi

26 ,

ni

Ni

hi %
8,75%

20

20

,
,

44

18,75%

Siendo el ancho de clase constante, encontrar:


a) Cuntos empleados tienen ms de 30 aos?
b) Qu porcentaje del total de empleados poseen menos de 42 aos?
13. En cierta fbrica se hizo un estudio sobre la edad de los trabajadores con el fin de
establecer un plan de seguro grupal. Los resultados fueron los siguientes:
25
60
21
43
28
26
19
36
51
37

54
63
39
47
21
38
27
30
28
40

43
52
20
48
33
49
23
50
55
52

32
37
35
38
41
43
58
32
60
36

23
42
49
41
36
41
38
23
39
48

22
39
58
57
57
59
49
28
27
41

47
29
45
42
67
26
40
49
33
37

a) Construya una distribucin de frecuencias apropiada para estos datos.


b) Conteste las siguientes preguntas, a partir de la tabla obtenida en a):
Cul el ancho de clase comn?
Cul es el lmite inferior de la tercera clase? L3 =
Cul es la frecuencia absoluta de la cuarta clase? n4 =
Cul es la frecuencia relativa de la segunda clase? h2 =
Cuntos trabajadores tienen menos de 50 aos? Y qu porcentaje
representan?
Cuntos trabajadores tienen 50 aos o ms? Y qu porcentaje
representan?
Qu porcentaje de trabajadores tienen entre 30 a 45 aos?

74

TECSUP - PFR

Matemtica II

Trcese el polgono de frecuencias y la ojiva correspondiente.


14. Los siguientes datos son las velocidades (en km/h) de 80 carros que pasaron por
un punto de control de velocidad:
60
40
49
102
70
25
120
60

30
54
49
60
60
70
45
70

31
38
85
80
31
108
39
100

60
35
83
35
65
26
83
55

45
27
30
28
34
24
65
50

20
45
40
60
73
27
72
63

34
40
46
82
68
40
46
64

29
55
105
72
81
75
62
65

35
45
29
63
65
43
43
61

20
60
38
36
80
85
63
69

Clasifique estos datos convenientemente y:


a) Muestre el histograma y el polgono de frecuencias correspondiente.
b) Disee la funcin escalonada y la ojiva respectiva.
c) Los carros con velocidades mayores a 80 km/h, son multados por exceso de
velocidad. Qu porcentaje sern multados?
d) Los carros con velocidades entre 45 y 70 km/h, van a ser considerados en
premios organizados por una compaa. Qu porcentaje sern premiados?
15. El grfico muestra el impuesto mensual (en soles) que debe pagar una persona,
segn su sueldo mensual (en soles):

IMPUESTO
900

360

120

1000

2200

3400

4000

SUELDO

Cunto de impuesto mensual paga una persona que gana s/.1500?. Cunto gana
una persona que paga mensualmente s/.300 de impuesto?

75

Matemtica II

TECSUP - PFR

16. La siguiente tabla de frecuencias muestra los haberes mensuales de 200 obreros
de cierta fbrica, en nuevos soles (ao2000)
Haberes mensuales

Nmero de obreros

Menores a 500

500 , 700
700 , 900
900 , 1100
1100 ,1300
1300 ,1500
1500 ,1700

60
40
48
24
14
8

ms de 1700

TOTAL

200

Con referencia a esta tabla, contestar:


a) Qu porcentaje de obreros tienen haberes inferiores a s/.1000 mensuales?
b) Qu porcentaje de obreros tienen haberes superiores a s/.1100 mensuales?
c) Qu porcentaje de obreros tienen haberes entre 1000 a 1500 soles
mensuales?
d) Graficar el histograma, el polgono de frecuencias y la ojiva correspondientes.

76

TECSUP - PFR

Matemtica II

DESCRIPCIN DE DATOS
En esta etapa nos ocuparemos del clculo y estudio de los estadgrafos.
Estadgrafos.- Son nmeros que describen alguna caracterstica de la
muestra y se obtienen a partir de los datos muestrales o experimentales.
Existen bsicamente dos tipos de estadgrafos:
a) Estadgrafos de Posicin: Localizan el centro de la distribucin
de frecuencias. Se denominan tambin medidas de tendencia central
o de localizacin. Ejemplos: media, mediana, moda, cuarteles, etc.
b) Estadgrafos de Dispersin: Nos indican como estn dispersos los
datos con respecto a algn estadgrafo de posicin. Miden el grado de
variabilidad de los datos alrededor de alguna medida de tendencia
central, por esta razn, se les denomina tambin estadgrafos de
variabilidad. Ejemplos: rango, la desviacin media, varianza,
desviacin tpica, etc.
2.4.1

MEDIA ( x )
Llamada tambin media aritmtica o promedio aritmtico es un
estadgrafo que localiza el centro de la distribucin en base a
su centro de gravedad y se obtiene a partir de las siguiente
frmulas.
Para datos no clasificados:
Sean x1 , x2 ,..., xn las variables matemticas que representan
n

los datos muestrales, entonces:

x
i 1

Para datos clasificados:


k

xn

i i

i 1

x xi hi

i 1

Donde:

k : nmero de clases

x1 , x2 ,..., xk : marcas de clase

n: nmero total de datos n1 , n2 ,..., nk : frecuencias absolutas

h1 , h2 ,..., hk : frecuencias relativas.

77

Matemtica II

TECSUP - PFR

Media Ponderada:
k

x P
i 1
k

i i

P
i 1

Siendo

P1, P2 ,..., Pk pesos asociados


x1 , x2 ,..., xk respectivamente.

las

variables

Media global:
Si una muestra de tamao n se particiona en k submuestras
y

x1, x 2 ,..., x k son las medias de las k submuestras de


tamaos n1 , n2 ,..., nk respectivamente.
k

Entonces: x

i 1

ni xi
n

se denomina la media global de la

muestra particionada.
Ejemplos:
Media de datos no clasificados:

x1 9 ,

x2 5 ,

x3 3 ,

x4 10 ,

x5 8

5
xi
x x2 x3 x 4 x5 9 5 3 10 8
x i 1 1

7
5
5
5

Media de datos clasificados:


Halle la velocidad media de los 30 carros que pasaron por un
punto de control de velocidad, del problema 2.
Use las frmulas que incluyen frecuencias absolutas y
relativas.

78

TECSUP - PFR

Matemtica II

Tabla N 3
Intervalos de clase

ni

xi

xi ni

hi

xi hi

[10, 26
[26, 42
[42, 58
[58, 74
[74, 90
[90, 106
Total

4
12
7
4
2
1
30

18
34
50
66
82
98

72
408
350
264
164
98
1356

0,133
0,400
0,233
0,133
0,067
0,033
1

2,394
13,600
11,650
8,778
5,494
3,234
45,15

xini
1356
i
x 1

45,2
n
30

x xihi 45,15
i 1

Media ponderada:
Tabla N4

Ex. Parcial
Ex. Final

Notas

Pesos

xi

Pi

xi Pi

05
13

1
3
4

5
39
44

k
xiPi
44
x i 1

11
k
4
Pi
i 1

Media Global:
Si una muestra de tamao 60 se particiona en 5 submuestras de tamaos 8, 18, 12, 9, 13 con medias
15,14,12,8,11 respectivamente. Entonces, la media global
ser:
xini
8 * 15 18 * 14 12 * 12 9 * 8 13 * 11 731
i
x 1

12,18
n
60
60

79

Matemtica II

TECSUP - PFR

2.4.2

MEDIANA

(Xm)

La mediana es un valor que divide a un conjunto de


observaciones ordenadas en forma ascendente o descendente
en dos grupos de igual nmero de observaciones.
Para datos no clasificados:
Sean

x1 , x 2 ,..., x n los datos


x1 x 2 ... x n . Entonces:

Xm

x n 1

muestrales

tales

que

; si n es impar

1
( xn xn 2 )
2 2
2

; si n es par

En palabras: una vez ordenados los datos en orden creciente


(o decreciente) de sus magnitudes:
Si n es impar, la mediana es el valor del dato que equidista
de los extremos.
Si n es par, la mediana es el promedio aritmtico de dos
datos consecutivos equidistantes de los extremos.
Ejemplos:
Hallar la mediana de los siguientes conjuntos de datos:
{ 10, 9, 3, 6, 14 }
Previamente ordenamos los datos:
x1 3

x2 6

x3 9

x4 10

x5 14

como n es impar ( n = 5 )

X m x 5 1 x3 9
2

{ 5, 10, 29, 43, 21, 17 }


Previamente ordenados los datos:
x1 5

x2 10

x3 17

80

x4 21 x5 29

x6 43

TECSUP - PFR

Matemtica II

como n es par ( n = 6 ) Xm 19
Para datos clasificados:
Est dada por la frmula:

N m 1

X m Lm Wm 2
nm

donde:

Lm

: Lmite inferior de la clase mediana (*)

: Nmero total de datos

N m 1 : Frecuencia

inmediata

absoluta

acumulada

hasta

la

clase

m 1

anterior a la clase mediana

N m 1 ni
i 1

nm

: Frecuencia absoluta de la clase mediana.

Wm

: Ancho de clase de la clase mediana:

Wm Lm1 Lm

Clase Mediana
Es el intervalo de clase que contiene el dato que ocupa la
posicin media o central. Se identifica observando las
frecuencias acumuladas absolutas o relativas y es aquella que

n
hasta ese nivel acumul la mitad del nmero total de datos ( 2
0,5) o super por primera vez a la mitad.
Clase mediana=

[ Lm , Lm1

Ejemplo:

81

X m [ Lm , Lm1

Matemtica II

TECSUP - PFR

Ta
bl
a
N
5

Velocidades en
Km/h
[10, 26
[26, 42
[42, 58
[58, 74
[74, 90
[90, 106
Total

ni

Ni

Hi

4
12
7
4
2
1
30

4
16
23
27
29
30

0,133
0,533
0,766
0,899
0,966
1

n 30

15
2
2

La frecuencia absoluta acumulada correspondiente a la segunda


clase (N2 = 16), supera por primera vez a 15; o la frecuencia
relativa acumulada a la segunda clase (H2 = 0,533), supera por
primera vez a 0,5.
Luego la clase mediana es [26;42>.

Lm

26

74

90

n = 12

Wm 16
nm

12

N m 1

30

2 4
Xm 26 16
40, 67
12

Ni
30
25
20
15
10
5

10

26

82

42

58

106

Ii

TECSUP - PFR

Matemtica II

MEDIANA COMO UNA MEDIDA DE TENDENCIA CENTRAL


MS REPRESENTATIVA
La media es un estadgrafo bastante sensible a los valores
extremos y como medida del centro de gravedad de la
distribucin tiende a inclinarse a los datos de mayor valor. Si
existen valores extremos que difieren considerablemente del
resto no localiza como se debe el centro de la distribucin. En
tanto que la mediana por no ser sensible a los valores extremos
y localizar el centro de la distribucin en base a la posicin
central que ocupa resulta siendo mejor que la media o ms
representativa en el sentido que localiza mejor el centro de la
distribucin; pero, en general, la media es ms representativa
que la mediana, como estadgrafo de localizacin:
Ejemplo:
Un empleador dice que el promedio mensual de salario pagado
a los ingenieros de su firma es de 3 500, esto sugiere que esta
firma paga bien. Sin embargo, un examen posterior indica que
se trata de una pequea compaa que emplea 5 jvenes
ingenieros con 1 000 soles de haber mensuales c/u y la renta
del ingeniero Jefe es de 16 000 soles mensuales.
Ud. puede seguir afirmando que la firma paga bien?. No.
Halle la mediana y compare, cul de los estadgrafos es ms
representativo?

X 3500;
x1 1000,

x2 1000,

x3 1000,

x4 1000,

x5 1000,

x6 16 000

X m = 1000
En este caso, la mediana es la ms representativa en el sentido
que localiza mejor que la media el centro de los datos bajo
consideracin.
Existe un valor extremo bastante discrepante o exagerado
( x6 16 000).
USOS DE LA MEDIA ARITMTICA
La media de la muestra se usa cuando se necesita una
medida de tendencia central que no vare mucho entre una y
otra muestra extrada de la misma poblacin, esta es la
razn para preferirla cuando se desea la mxima
confiabilidad en la estimacin de la media poblacional.

83

Matemtica II

TECSUP - PFR

Tambin se usa la media cuando la distribucin de


frecuencias de los datos es simtrica o tiene poca asimetra.
Se calcula la media cuando en un estudio tambin se debe
calcular la varianza o la desviacin estndar.
USOS DE LA MEDIANA
Se prefiere a la mediana como medida de concentracin,
cuando en los datos existen valores extremos muy grandes o
muy pequeos, o sea, valores muy altos o muy bajos que
obligan a la media aritmtica a desplazarse a la derecha o
izquierda del punto medio de la distribucin. En cambio la
Mediana siempre seala al punto que divide a los datos en
dos partes iguales: 50% a un lado y 50% al otro, sin
importar donde se halle ese punto.
Cuando simplemente necesitamos conocer si los datos que
nos interesan estn dentro de la mitad superior o inferior de
la distribucin de los datos y no tiene importancia saber
particularmente su alejamiento con respecto al centro de la
distribucin.
2.4.3

MODA (

Mo

La moda es un valor de la variable que tiene la ms alta


frecuencia, esto es, es el valor ms frecuente de la distribucin.
Si la distribucin de frecuencias tiene un solo mximo (mximo
absoluto), se dice que la distribucin es unimodal; en cambio si
tiene ms de un mximo (mximos relativos), se dice que la
distribucin es multimodal.
Si todas las frecuencias son iguales se dice que la distribucin
no tiene moda y se trata de una distribucin uniforme.
a) Para datos no clasificados
Determinar la moda del siguiente conjunto de datos:
2, 2, 3, 4, 5, 5, 6, 7, 7, 7, 9, 9, 12.
La moda es el nmero 7 porque es el dato ms repetido
(3 veces).
Esta distribucin se llama unimodal porque slo posee
una moda.
El siguiente conjunto de datos no tiene moda.
15, 19, 20, 35, 47, 58, 63.

84

TECSUP - PFR

Matemtica II

Porque ninguno de ellos est repetido


3.-La siguiente distribucin es bimodal es decir, tiene dos
modas:
8, 9, 9, 13, 13, 13, 18, 20, 24,24,24, 33, 59, 78, 78.
Mo = 13 y tambin Mo = 24
La siguiente distribucin es trimodal:
4, 8, 8, 8, 8, 15, 15, 15, 20, 20, 21, 21, 21, 21,32, 40,
40,40, 40, 80, 80, 90.
Mo = 8, Mo = 21, Mo = 40 Tiene tres modas.
b) Para datos clasificados

1
M o Li Wi
1 2

I i [ Li , Li 1 : clase modal, es aquella que tiene la


frecuencia mxima

Li : lmite inferior de la clase modal.


Wi : ancho de la clase modal
1 ni ni 1 : exceso de la frecuencia modal sobre la
frecuencia de la clase contigua inferior.

2 ni ni 1 : exceso de la frecuencia modal sobre la


frecuencia de la clase contigua superior.
Ejemplo
Determinar la moda de la siguiente distribucin de
frecuencias:

85

Matemtica II

TECSUP - PFR

Tabla N 6

Ii

ni

[12,5
[20,5

20,5
28,5

1
8

[28,5
[36,5
[44,5
[52,5

36,5
44,5
52,5
60,5

22
26
20
12

[60,5 68,5
[68,5 76,5
TOTALES

6
5

La clase modal ser: I = [36,5; 44,5


Adems es una distribucin unimodal.
1 =

26 -22 = 4

2 =

26 -20 = 6

1
4
Mo 36,5 W
36,5 8
39,7

4 6
1
2

ni

25
20
15
10
5

12,5 20,5 28,5 36,5 44,5 52,5 60,5 68,5 76,5


39,7

86

Ii

TECSUP - PFR

Matemtica II

2.4.4

CUARTILES (QI)
Son medidas de posicin que dividen en cuatro partes iguales al
conjunto de valores ordenados en una distribucin de
frecuencias. Estas medidas son: el primer Cuartil Q1, el segundo
Cuartil Q2 y el tercer Cuartil Q3
25%

Q1

Q2

25%

Q3
75%

Las frmulas para calcular los cuartiles se derivan de la frmula


utilizada para calcular la mediana y los pasos para el clculo
son los mismos:
Para el primer cuartil:

Para el tercer cuartil:

N i 1

Q1 Li Wi 4
ni

3n

N i 1

Q3 Li Wi 4
ni

Ejemplo
A partir de la siguiente tabla determinar el 25% inferior y el
25% superior.
Tabla N 7
Altura en
pulgadas
[60, 63

ni

Ni

Hi

0,05

[63, 66

18

23

0,23

[66, 69

42

65

0,65

[69, 72

27

92

0,92

[72, 75

100

TOTALES
Para determinar el 25% inferior debemos calcular el primer
cuartil.
Para determinar el 25% superior debemos calcular el tercer
cuartil
Clculo de Q1 :
87

Matemtica II

TECSUP - PFR

n 100

25
4
4

.Luego tomamos la clase: I = [66; 69

Luego:
100

4 23
Q1 66 3
66,14
42

Clculo de Q3 :
3n 3x100

75
4
4

.Luego tomamos la clase: I = [69; 72

Luego:
3x100

4 65
Q3 69 3
70,11
27

2.4.5

DECILES ( DI )
Son medidas de posicin que dividen en 10 puntos iguales al
conjunto de los valores ordenados de una distribucin de
frecuencias. Estas medidas son: el primer decil D1, el segundo
decil D2 y as sucesivamente hasta el noveno decil D9.
El primer decil distribuye al lado izquierdo el 10% de los datos y
al otro lado el 90%, es decir, ocupa la posicin n/10.
En igual forma para los dems deciles hasta el noveno decil
9n/10 que deja a la izquierda el 90% de los datos y a la
derecha el 10%.
30%

D1

D2

D3

D4

10%

D5

D6

D7

D8

D9

90%

Entre cada dos deciles consecutivos debe encontrarse


comprendido el 10% del nmero de datos.
La frmula para calcular deciles es:

rn

N i 1

Dr Li Wi 10

ni

88

TECSUP - PFR

Matemtica II

Donde:
Dr = el decil buscado.
Li = lmite inferior del intervalo donde se halla el decil buscado
r = indica el decil. Por ejemplo si queremos el tercer decil r
= 3.
rn
indica la situacin del decil, es decir, la clase donde est el
10
decil

Los dems signos: n , Ni-1 , Wi , ni tienen los mismos


significados que para el caso de la mediana.
Ejemplo
Se presenta la distribucin de frecuencias de los puntajes
obtenidos por 250 alumnos en una prueba de rendimiento de
Fsica. Determinar qu puntajes deben tener los que se hallen
en el 20% inferior y cules puntajes los que se encuentren en
el dcimo superior.
Tabla N8

Intervalos

40; 45
45; 50
50; 55
55; 60
60; 65
65; 70
70; 75
75; 80
80; 85
85; 90
Totales

ni

Ni

10

14

18

32

25

57

46

103

53

156

37

193

29

222

18

240

10

250

250

Primero debemos determinar el segundo decil a fin de


determinar el 20% inferior.

89

Matemtica II

TECSUP - PFR

Clculo de D2:
2n 2x250

50 ; Luego el segundo decil est en la clase: I


10
10
= [55, 60

50 32
58,6
25

Por frmula: D 55 5

Para hallar los que se encuentran en el dcimo superior


calculamos el noveno decil.
Clculo de D9:
9n 9x250

225 ; Luego el noveno decil est en la clase: I


10
10
= 80; 85

225 222
80,83
18

Por frmula: D 80 5

CARACTERSTICAS DE DISPERSIN
Las dos siguientes series de datos:
95
50

97
75

100
100

103
125

105
150

Tienen la misma media aritmtica y la misma mediana (100).


Sin embargo difieren profundamente. Lo que las hace
diferentes es lo que, en estadstica, se llama dispersin; la
segunda serie es mucho ms dispersa que la primera.
Es pues importante resumir una serie estadstica no slo por
caractersticas de tendencia central, sino por caractersticas de
dispersin. Veremos de dos tipos: las ligadas a la media:
desviacin tpica; las ligadas a la mediana: intervalo
intercuartlico, intervalo interdeclico.
2.4.6

MEDIDAS DE DISPERSIN
Varianza ( S x2 V( x ) )
Se define:

V( x )

n
2
( xi x)
i 1

2
n
Sx k
( xi x) 2 ni
i 1

90

, datos no clasifcado s

, datos clasificad os

TECSUP - PFR

Matemtica II

Se interpreta como la media aritmtica de los cuadrados de


las desviaciones de las xi con respecto a x .
A menudo el clculo de la varianza es muy laborioso, sobre
todo si la media no es entera, para facilitar los clculos
podemos usar una segunda forma:
k

V( x )

n x

2
i i

i 1

x ; datos clasificad os

Desviacin Tpica

S x

S x V( x )
Una idea sencilla del significado de la desviacin tpica se
obtiene cuando se comparan dos series de la misma
naturaleza: la que posee una desviacin tpica ms alta es la
ms dispersa.
Coeficiente de variacin (C.V.)

C.V .

Sx
x

Generalmente se expresa en porcentajes. Es til para la


comparacin en trminos relativos del grado de
concentracin en torno a la media de dos distribuciones
distintas.
Rango o extensin (e)
Indica la extensin del intervalo en donde se halla toda la
poblacin estudiada.
e = Lk L1 =l(A)
Por ejemplo de la Tabla N8, tenemos e = 90 - 40 = 50
Rango interdeclico = D9 D1
Rango intercuartlico = Q3 Q1
Por ejemplo, a partir de la tabla N8, tenemos:
Rango intercuartil = 74,26 60.97 = 13,99
Rango interdeclico = 80,83 53,06 = 27,77

91

Matemtica II

TECSUP - PFR

ASIMETRA
Es la deformacin horizontal de las curvas de frecuencias.
Cuando la curva est inclinada o alargada hacia la derecha se
denomina asimetra a la derecha o asimetra positiva (Fig.1).
Observamos que la media aritmtica queda hacia el lado ms
largo (el derecho) y que x X m M o .
Cuando la curva est inclinada o alargada al lado izquierdo se
denomina asimetra a la izquierda o negativa (Fig.2). Notamos
que la media aritmtica est del lado ms largo (el izquierdo) y
que x X m M o .
En la Fig. 3 observamos que la curva est igualmente inclinada
a los dos lados por eso se llama curva simtrica. En este caso:

x Xm Mo

Fig. 1

Fig. 2

Mo Md x

Fig. 3

x Md M o

x
Md
Mo

Primer coeficiente de Asimetra de Pearson

AS1

Media Moda
desviacin estndar

AS1

x Mo
Sx

Notar que el valor del Primer coeficiente de Asimetra de


Pearson nos indica el tipo de asimetra que tendr la curva.
Ejemplo:
Considerando la tabla del Problema 1, calcular: la varianza, la
desviacin tpica, el coeficiente de variacin, el rango, el rango
intercuartil, el rango interdeclico y con ayuda del primer

92

TECSUP - PFR

Matemtica II

coeficiente de Pearson indicar que tipo de asimetra presenta al


curva.
Tabla N9

ni

xi

xi X 2 ni

xi.ni

ni xi2

18

2959,36

72

1296

12

34

1505,28

408

13872

50

161,28

350

17500

66

1730,56

264

17424

82

2708,48

164

13448

98

2787,84

98

9604

11852,8

1356

73144

Ii

10; 26
26; 42
42; 58
58; 74
74; 90
90;106
Total

30

V(x)

Sx

11852,8
395,09
30

395,09 19,88

Sx

19,88
C.V.

0, 44
45,2
X

V(x)

1356
45,2
30

8
M0 26 16
35,85
8 5

e l(A) 105 10 95
30

4 4
Q1 26 16
30, 67
12

90

4 16
Q3 42 16
56,86
7

RIQ Q3 Q1 56,86 30,67 26,19

93

73144
45,22 395,09
30

Matemtica II

TECSUP - PFR

30

10 0
D1 10 16
22
4

270

10 23
D9 58 16
74
4

RID D9 D1 74 22 52

AS1

AS1

X Mo
Sx

45,2 35,85
0, 47
19,88

Asimetra a la derecha o positiva.

94

TECSUP - PFR

Matemtica II

PROBLEMAS PROPUESTOS
1.

Si el salario promedio semanal de n obreros es de 150 soles y cada obrero recibe


un aumento general de 7,5 soles semanales y una bonificacin semanal del 1,5%
del salario incrementado.
Cul es el salario promedio actual semanal de los obreros?

2.

En una fbrica trabajan 20 mujeres y 45 hombres, el salario promedio semanal


de las mujeres es de 100 soles y el de los hombres 120 soles.
Cul es el promedio del salario semanal de todos los trabajadores de la fbrica?

3.

4.

Para los siguientes datos:


55.31

81.47

64.90

70.88

86.02

77.25

76.76

84.21

84.92

90.23

78.01

88.05

73.37

87.09

57.41

85.43

74.76

86.51

86.37

76.15

88.64

84.71

66.05

83.91

56.02

a)

Calcular la mediana antes de clasificar los datos.

b)

Agrupar los datos en una tabla de frecuencias cuyas marcas de clase sean:
60, 70, etc. y calcular la desviacin tpica y la mediana.

El salario medio semanal pagado a los trabajadores de una compaa es de 300


soles. Los salarios medios semanales pagados a hombres y mujeres de la
compaa son 315 y 240 soles respectivamente. Determinar el porcentaje de
hombres y mujeres que trabajan en la compaa.
Un estudio final realizado determin que existen 800 trabajadores, Cuntos son
hombres?

5.

En una seccin de matemtica 24 estudiantes llevan el curso por primera vez, 6


llevan por segunda vez y 2 por tercera vez. Se sabe que 12 es el promedio de
notas de los que llevan por primera vez y que las notas de los que llevan por
segunda vez en promedio son superiores en un 10% de los que llevan por
primera vez.
Calcular el promedio de notas de los que llevan el curso por tercera vez si la
suma total de las notas es de 390.

6.

Se tiene la siguiente informacin sobre la distribucin de frecuencias de 100


elementos de un material sometido a prueba de ruptura (en kg/cm2).
La longitud de los intervalos de clase es constante:

95

Matemtica II

TECSUP - PFR

Ii

ni

Ni

xi

30

ni xi2

600
800

46

,
,

xi ni

700

34
880

,120
,

TOTALES
a) Determinar la media, la mediana y los cuartiles de la distribucin.
b) El N de datos que estima pertenezcan al intervalo [media, mediana].
c) La desviacin estndar.
d) El intervalo interdeclico. Precisar el significado del resultado obtenido.
7.

100 elementos de un material determinado fueron sometidos a prueba de ruptura


por compresin (obtenindose los resultados en kg/cm2).
Cuando se acudi a la tabla de clculos que el operador debi confeccionar se
encontr solamente lo siguiente:

Ii

,
12.5 ,
,
,
, 72.5

ni

Ni

xi
10

xi ni

ni xi2

180
42

30

360
750

98
120

TOTALES

a) Determinar la media, la moda y el valor mediano.


b) El coeficiente de variacin.
c) El primer coeficiente de Pearson. Qu puede afirmar acerca de la asimetra?
d) El intervalo intercuartlico. Precisar el significado del resultado obtenido.

96

TECSUP - PFR

8.

Matemtica II

Una mquina llena automticamente paquetes de tabaco. Se extrae una muestra


de la produccin; tras su pesado, se obtiene:
Pesos de los paquetes de tabaco
Pesos en gramos
menos de 38
menos de 39
menos de 39,5
menos de 40
menos de 40,5
menos de 41
menos de 41,5
menos de 42
menos de 42,5
menos de 43
menos de 44
ms de 44

Cantidades
0
3
8
18
31
51
69
84
95
99
100
0

a) Trazar el histograma de esta serie estadstica.


b) Construir una nueva tabla, dando las frecuencias por clases de amplitud 2
gramos. Trazar el histograma representativo. Qu se puede deducir de la
comparacin de los dos histogramas?
c) Calcular la media, la mediana y la desviacin tpica de la distribucin de los
pesos de los paquetes de tabaco.
d) Utilizando los datos agrupados por clases de amplitud 2 (b), repetir los
mismos clculos. Qu se puede deducir de ello?
9.

Sea la siguiente distribucin de lados X en mm medidos en 10 piezas: 1,20 2,40


6,00 7,20 12,00 13,20 16,80 21,60 22,80 y 25,20 mm.
a) Determinar la media x y la desviacin tpica Sx de la variable X.
b) Tras emplear el cambio de variable Y 5 X 54 / 6 determinar la media y y
la desviacin tpica Sy de la nueva variable Y.

10.

Los siguientes datos son las temperaturas registradas en grados Farenheit:


415

510

460

475

420

490

480

450

435

485

470

465

500

455

435

Encontrar x y Sx a partir de los datos.

97

Matemtica II

11.

TECSUP - PFR

Dada la siguiente grfica de la distribucin de salarios bsicos de 90 trabajadores


de una fbrica, donde el haber bsico mnimo es de 650 soles y el haber bsico
mximo es de 3150 soles. Determinar:
a) La moda, la desviacin tpica.
b) El coeficiente de variacin.
c) El coeficiente de Pearson
d) El decil D4 y el cuartil Q3 .

Ni
90

90
83
72

75
60
45

45

30

15

Ii
650

12.

1150

1650

2150

2650

3150

La siguiente tabla muestra la distribucin de salarios de 150 trabajadores de


TECSUP durante el mes de Abril del ao 2001.
Haberes

Nmero de
trabajadores
15
24
29
38
24
20

600 , 900
900 , 1400
1400, 1700
1700, 2100
2100, 2400

2400 , 2600

Por incremento del costo de vida se plantean dos alternativas de aumento para el
mes siguiente. La primera propuesta consiste en un aumento general de 350
soles mensuales.
La segunda propuesta consiste en un aumento del 30% de los salarios de Abril a
los trabajadores que ganan menos de 2100 soles y del 5% a los trabajadores que

98

TECSUP - PFR

Matemtica II

ganan ms de 2100 soles y un aumento adicional de 100 soles para todos los
trabajadores.
a) Cul de las propuestas convendra a los trabajadores?
b) Para los trabajadores que ganan menos de 2100 soles Qu propuesta les
convendra?
13.

El ingreso percpita anual de un pas es de 9000 dlares. El sector obrero que


1
constituye el 60% de la poblacin percibe 5 del ingreso total. Calcular el ingreso
percpita del sector no obrero.

14.

La produccin de la fbrica A es el triple de la de B y la de sta 18% inferior a la


de C. Si los costos unitarios correspondientes, todos inferiores en 20% de sus
respectivos precios de venta son:
200, 240 y 260. Se pide calcular el precio medio de venta.

15.

Se da la clasificacin de un grupo de nios por estaturas:


Estatura (en cm)

ni

80 a menos de 90 cm
90 a menos de 95 cm
95 a menos de 100 cm
100 a menos de 105 cm
105 a menos de 110 cm
110 a menos de 120 cm
TOTALES

3
15
22
18
12
5

ni xi2

xi ni

xi

a) Calcular la media y la desviacin tpica S de la distribucin de los nios por


estaturas.
b) Determinar la mediana de estas observaciones.
c) Cul es la moda de la distribucin?
d) Cul es la proporcin de nios que tienen una estatura comprendida entre
x 2S y x 2S ?
16.

Sea la distribucin de salarios (en nuevos soles) de 20 trabajadores de una


compaa (ao 2000)

xi

150

300

420

570

ni

11

Hallar x y S x

99

Matemtica II

17.

TECSUP - PFR

Se tiene la siguiente tabla de frecuencias de los pesos de 200 objetos de similar


confeccin, cuya distribucin es simtrica: Cuntos objetos tienen pesos
comprendidos entre 15 y 20Kg?

Pesos

10 ,
,
,
,
18 ,
,

ni

Ni

13%

100 hi %

142

TOTALES
Cunto resulta a+b-c?.
Nota.- el ancho de clase es constante

ANLISIS DE DATOS BIVARIADAS


Hemos estudiado ahora datos provenientes de una sola variable, sin embargo
con frecuencia es necesario analizar respecto a la relacin entre dos variables.
La relacin entre dos variables puede darse de la siguiente manera:
1
2

Cualitativa vs cualitativa
Cualitativa vs cuantitativa

Para el segundo caso cualitativa vs cuantitativa puede trabajarse la variable


cuantitativa con sus datos originales o puede elaborarse intervalos y analizarlo
como el primer caso cualitativa vs cualitativa.
Cualitativa vs cualitativa
Supongamos que se toma una muestra de tamao n de una poblacin que se
est investigando.
Sean X e Y las variables a estudiar, tal que los datos obtenidos son:
( X1,Y1 ),( X2,Y2), .,( Xn,Yn).

100

TECSUP - PFR

Matemtica II

Distribucin conjunta y marginal.


La tabla de frecuencia que agrupa a esta informacin se conoce tabla de
contingencia. Por ejemplo, para el caso de dos variables cualitativas con dos
modalidades o categoras, la tabla sera:
Y
Categora 1 Categora 2

Total

Celda

Celda

Total marginal

f11

f12

f1.

Celda

Celda

Total marginal

f21

f22

f2.

Total

Total

Total de

marginal

marginal

individuos

f.1

f.2

Categora 1

Categora 2

Total

Distribucin Marginal
Cuando slo interesa conocer la frecuencia de ocurrencia de cada una de las
variables por separado se habla de Frecuencia Marginal de la variable
Por ejemplo:

Hbitos de Fumar
SI
NO

Total

MUJER

DISTRIBUCION
CONJUNTA

DISTRIBUCION
MARGINAL

Total

DISTRIBUCION
MARGINAL

Tamao
de
muestra

SEXO
VARON

101

Matemtica II

TECSUP - PFR

Cuntas variables tenemos?


..
Cules son?
..
Ejemplo 1:
Frecuencia absoluta: conjunta y marginal
SEXO

SI

VARON
MUJER
Total

Hbitos de Fumar
NO

Total

800

1200

2000

1000

2000

3000

1800

3200

5000

Frecuencia relativa: conjunta y marginal

X/Y

Categora

Categora

variable Y

variable Y

f11

f12

marginal

f1./n

f21

f22

marginal

f2./n

Total

Total

Total de

marginal

marginal

indivduos

f.1/n

f.2/n

n/n

Total
Total

Categora
variable X

Total
Categora
variable X

Total

102

TECSUP - PFR

Matemtica II

Hbitos de Fumar
SI
NO
0.16
0.24
0.20
0.40
0.36
0.64

SEXO
VARON
MUJER
Total

Total
0.40
0.60
1

Frecuencia Condicional
Cuando se pregunta por la frecuencia relativa de una de las variables, digamos
X, restringida a los elementos observados de una clase dada de la otra; esto es,
estudiar el comportamiento de una variable dado un valor fijo de la otra.

Y
Categora

Categora

variable Y

variable Y

Categora 1

f1 / f.1

f12/f.2

Categora 2

f21/f.1

f22/f.2

Total

EJERCICIO
En la ciudad de Lima se ha incrementado durante los ltimos cinco aos el nmero de
restaurantes de comida rpida. Debido a esto los expertos la empresa de investigacin
de mercado Consultores-ECE se pregunta. La preferencia de un cliente por la comida
rpida tiene que ver la edad?. La empresa eligi una muestra aleatoria de 500 clientes
de comida rpida mayores de 16 aos y se les pregunt su restaurante favorito,
obtenindose los siguientes datos:

Grupo de
edad
16 - 21
21 - 30
30 - 49
50 a ms

Kentuky
75
89
54
21

Restaurant
McDonalds Burger-King
34
10
42
19
52
28
25
7

Otro
6
10
18
10

Cules sern las conclusiones que llegarn los expertos de la empresa


Consultores-ECE?

103

Matemtica II

TECSUP - PFR

ANOTACIONES:

104

You might also like