You are on page 1of 30

MSc. Ing. Tania N.

Colque Ortiz

CAPITULO 1
INTRODUCCION A LA ESTADISTICA DESCRIPTIVA

EL PROCESO ESTADSTICOTO
La estadstica es una ciencia que estudia una serie de fenmenos no deterministas, a partir de la
recogida, anlisis e interpretacin de unos datos que tienen lugar dentro de una colectividad.
Un ejemplo nos ayuda a diferenciar entre fenmenos deterministas y no deterministas:
Al pulsar el interruptor de la luz, si sta estaba apagada, se encender; y al contrario, si la luz
est encendida y pulsamos el interruptor, la luz se apagar. Este fenmeno es determinista,
ya que antes de ejecutar la accin puedo prever el resultado de la misma, y, si no hay ningn
imprevisto (en el caso de la luz, que la bombilla est encendida), obtendremos el resultado
esperado.
Los fenmenos no deterministas son aquellos en los que no se puede predecir el resultado,
antes de su ejecucin. Sera un fenmeno no determinista la puntuacin que se obtiene al
tirar un dado; antes de realizar la tirada no sabemos los puntos que se obtendrn. Adems
este fenmeno descrito se denomina aleatorio, ya que el resultado depende exclusivamente
del azar (si el dado no est trucado). Tambin hay fenmenos no deterministas que no son
aleatorios, por ejemplo, la respuesta a la pregunta sobre el Estado Civil en una encuesta. El
encuestador no conoce previamente la respuesta que va a obtener, pero de ninguna manera
depende la respuesta del azar.

Tenemos por tanto:


Deterministas
Fenmenos
Aleatorios
No deterministas
No aleatorios
Otras acepciones de la palabra estadstica:
Coleccin de datos numricos ordenados y clasificados segn un determinado criterio; as
hablamos de estadsticas de produccin, de cotizaciones burstiles, demogrficas, etc.

MSc. Ing. Tania N. Colque Ortiz

Es una ciencia que, utilizando como instrumento a las matemticas, estudia las leyes de
comportamiento de aquellos fenmenos que dependen del azar. Generalizando estas leyes y
basndose en ellas predice e infiere resultados.
Significa la tcnica o el mtodo que se sigue para recoger, organizar, resumir, presentar,
analizar, generalizar y contrastar los resultados de las observaciones de los fenmenos reales.
La importancia de la estadstica no est reducida al mbito de la matemtica sino que se ha
convertido en una herramienta de trabajo fundamental para muchas otras ciencias y facilita
mediciones e inferencias de mbito educativo y social: por ejemplo, costumbres relativas al
cuidado de la salud, nios que estn escolarizados en diferentes tipos de centros, capacidades
(tests).
La Estadstica es una ciencia positiva y sigue unas reglas y procesos determinados.
Resumindolo de una manera sencilla, enumeramos los pasos elementales a seguir en un estudio
estadstico.
Para llevar a cabo el proceso estadstico son necesarias varias fases, que se pueden resumir en
estas cuatro1:
1. El diseo o planteamiento, mediante el cual se fija el objetivo a conseguir, la poblacin y
muestra que va a estudiarse, los caracteres que interesan y la presentacin que se har con los
datos recogidos; es preciso tambin determinar tanto costes como tiempo que se va a invertir.
Se respondera a las siguientes preguntas: sobre quin se realiza el estudio? y qu
caracterstica o caractersticas vamos a analizar?
2. La recogida de datos, que puede ser directa, cuando es el propio individuo el que facilita los
datos, generalmente mediante un cuestionario o la observacin directa; o puede ser indirecta,
cuando se recurre a un fichero, a un banco de datos, etc.
3. La obtencin de resultados mediante el tratamiento de datos: son las operaciones, cuadros,
tablas, grficos, previstos en el diseo, que hay que efectuar para obtener los resultados. Si la
cantidad de datos es grande, se usan tcnicas informticas. En este punto tratamos, por tanto
la cuantificacin y anlisis de los datos. Las tcnicas que se utilizan para ello son tanto de
clculo como grficas.
4. La interpretacin de resultados. Al final del proceso, se pueden tomar las soluciones
pertinentes a partir de la informacin obtenida. Dependiendo del estudio y de la temtica, se
terminar definiendo predicciones o conclusiones sobre los fenmenos estudiados.
Analizamos estos pasos a la luz de un ejemplo:

MSc. Ing. Tania N. Colque Ortiz

Suponemos que nos preocupa el nivel de violencia infantil y juvenil; sus ndices
han crecido enormemente en los ltimos aos y que formamos parte de un equipo
que pretende analizar la causas de dicha situacin. Debemos ir perfilando en
primer trmino los diferentes factores: violencia familiar, soledad de nios y
adolescentes, situaciones de marginacin, influencia de programas televisivos con
una gran carga de violencia, etc. Debemos definir ahora nuestro centro de inters,
formular nuestra hiptesis.
Nuestra hiptesis se centra en que el ndice de violencia infantil ha crecido debido
al elevado nmero de horas que los nios ven la televisin. (Hemos dejado de
lado otros factores, pues es necesario completar el ejemplo).
Primero determinamos la poblacin: el trmino nios es ambiguo y amplio;
necesitamos escoger los mrgenes con los que vamos a trabajar: por ejemplo,
analizaremos a los nios entre 7 y 10 aos; tambin necesitamos hacer una
concrecin geogrfica: nios espaoles (o que viven en Espaa) de edades
comprendidas entre 7 y 10 aos.
Tras definir la poblacin y dado que no podemos obtener datos de todos los nios
espaoles de esas edades, pues convertira nuestro trabajo en algo inabarcable y
costoso, buscamos la seleccin de una parte de la poblacin. Para que el resultado
sea fidedigno, tendremos que respetar el reparto proporcional de nios de la
poblacin y nios encuestados: es decir, si hay 300.000 nios de las caractersticas
sealadas, no podemos recoger datos de 450, o solamente de alumnos de colegios
pblicos o solo de habitantes de grandes poblaciones urbanas. En la muestra
(definiremos ms tarde este concepto) tendr que haber nios de diferentes niveles
socioeconmicos, de barrios acomodados y marginales, de colegios pblicos,
privados y concertados, de mbito rural y mbito urbano; y todo, guardando la
debida proporcin muestra-poblacin. (No hemos querido hacer un elenco
exhaustivo de factores, simplemente ilustrar las necesidades que surgen al
seleccionar la muestra).

MSc. Ing. Tania N. Colque Ortiz

Recogeramos los datos de los nios incluidos en la muestra. Pero es necesario


perfilar la pregunta, objeto de estudio: cuntas horas ves la televisin? Esta
pregunta no est bien definida, pues es diferente el nmero de horas entre semana
que el fin de semana, en vacaciones o durante el curso escolar, la franja horaria,
etc. Para no alargar excesivamente el ejemplo concretaremos el nmero de horas
semanales que ven la televisin los nios espaoles entre 7 y 10 aos, durante
el curso escolar. Este es por tanto nuestro objeto de estudio.
Recogemos los datos de 5.000 nios, cuidando la proporcin con la poblacin
real, lo ordenamos, los analizamos grfica y matemticamente y ya hemos
obtenido los resultados. Hemos llegado al punto 6 del proceso y estamos en
disposicin de presentar nuestros resultados a los representantes del MEC que nos
lo han encargado. Ahora bien, aunque hemos obtenido datos de 5.000 nios, no
concluimos que cinco mil nios espaoles ven una media de 6,7 h de televisin a
la semana, sino que lo expresaremos diciendo que los nios espaoles de edades
comprendidas entre 7 y 10 aos ven la TV una media de 6,7h a la semana. Es
decir, aunque nosotros hemos recogido datos de una parte de la poblacin, los resultados
los extendemos a toda la poblacin.

GENERALIDADES.El campo de la estadstica tiene que ver con la recopilacin, presentacin, anlisis y uso
de datos para tomar decisiones y resolver problemas. Cualquier persona, tanto en su
carrera profesional como en la vida cotidiana recibe informacin en forma de datos a
travs de peridicos, de la televisin y de otros medios. De manera especfica, el
conocimiento de la estadstica y la probabilidad puede constituirse en una herramienta,
poderosa para ayudar a los cientficos e ingenieros a disear nuevos productos y
sistemas, a perfeccionar los existentes y a disear, desarrollar y mejorar los procesos
productivos.

MSc. Ing. Tania N. Colque Ortiz

Qu es la estadstica?

Es una ciencia que estudia los mtodos cientficos, para reunir,


organizar, resumir y analizar datos; as como para sacar
conclusiones y tomar decisiones sobre la base de tales anlisis.

ESTADSTICA DESCRIPTIVA
ESTADISTICA
INFERENCIA ESTADSTICA
ESTADISTICA DESCRIPTIVA.- Es la ciencia que estudia a los mtodos para reunir,
clasificar, presentar y describir a un conjunto de datos.
El trmino estadstica tiene su raz en la palabra Estado. Surge cuando se hace necesario
para sus intereses cuantificar conceptos. En la mayora de los casos esta cuantificacin
se har en funcin de unos fines econmicos o militares. El estado quiere conocer censo
de personas, de infraestructura, de recursos en general, para poder obtener conclusiones
de esta informacin.
Actualmente la estadstica es una ciencia. No es ya una cuestin reservada al
estado. Podramos decir que se encuentra en la totalidad del resto de ciencias. La razn
es clara: por una parte la estadstica proporciona tcnicas precisas para obtener
informacin, (recogida y descripcin de datos) y por otra parte proporciona mtodos
para el anlisis de esta informacin.

MSc. Ing. Tania N. Colque Ortiz

De ah el nombre de ESTADSTICA DESCRIPTIVA, ya que el objetivo ser, a


partir de una muestra de datos (recogida segn una tcnica concreta), la descripcin de
las caractersticas ms importantes, entendiendo como caractersticas, aquellas
cantidades que nos proporcionen informacin sobre el tema de inters del cual hacemos
el estudio.
ESTADISTICA INFERENCIAL.- Es la ciencia que estudia los mtodos que permiten
generalizar o tomar decisiones en base a la informacin particular o parcial que
presenta la Estadstica Descriptiva; es decir, cuando se trata de inferir o predecir
conclusiones de un conjunto de datos.

La estadstica inferencial comprende las tcnicas con las que, con base nicamente en
una muestra sometida a observacin, se toman decisiones sobre una poblacin o proceso
estadsticos. Dado que estas decisiones se toman en condiciones de incertidumbre,
suponen el uso de conceptos de probabilidad. Mientras que a las caractersticas medidas
de una muestra se les llama estadsticas muestrales, a las caractersticas medidas de una
poblacin estadstica, o universo, se les llama parmetros de la poblacin. El
procedimiento para la medicin de las caractersticas de todos los miembros de una
poblacin definida se llama censo. Cuando la inferencia estadstica se usa en el control
de procesos, al muestreo, le interesa en particular el descubrimiento y control de las
fuentes de variacin en la calidad de la produccin.
Ejemplo. Para estimar el voltaje requerido para provocar fallas en un dispositivo
elctrico, una muestra de estos dispositivos puede someterse a voltajes crecientes hasta
que falle cada uno de ellos. Con base en estos resultados muestrales puede estimarse la
probabilidad de falla a varios niveles de voltaje de los dems dispositivos de la
poblacin muestreada.

MSc. Ing. Tania N. Colque Ortiz

ALGUNAS DEFINICIONES IMPORTANTES.-

Muestra
Poblacin

POBLACIN.- La poblacin es el conjunto de de todos los


elementos, que cumpliendo una condicin, deseamos
estudiar.
Por ejemplo: los habitantes de una ciudad, los alumnos de un
colegio, las gallinas de una granja, etc.
MUESTRA.Una muestra es cualquier subconjunto
representativo de la poblacin (por ejemplo: 100 alumnos del
colegio, 1.000 habitantes de una ciudad, 300 gallinas de una
granja, etc).

- Individuo.- Es cada uno de los elementos de la poblacin


La poblacin es un agregado de unidades individuales, compuesto de personas o cosas
que se hallan en una situacin determinada. Las unidades individuales se llaman
unidades elementales. Definir una poblacin es determinar sus unidades elementales de
acuerdo con el inters que se tiene respecto a alguna caracterstica de aqulla.
Tanto la definicin de una poblacin como la caracterstica por observar de sus unidades
elementales dependen de la naturaleza del problema. Por ejemplo, si el problema es
"Camisas para personas adultas de El Salvador", se trata de determinar la cantidad
adecuada de produccin de camisas de acuerdo con las diversas medidas. La poblacin
son todas las personas adultas de El Salvador. La caracterstica de inters son las
medidas del cuello de las personas adultas en dicho pas.
Las poblaciones pueden ser infinitas o finitas. Una poblacin infinita es la que contiene
un nmero infinito de unidades elementales; por ejemplo, el conjunto de piezas que se
obtienen en un proceso productivo; en el sentido de que se siguen produciendo
indefinidamente. Otro ejemplo son todos los posibles resultados al lanzar una moneda
sin cesar.
Una poblacin es finita cuando tiene un nmero finito de unidades elementales. Por
ejemplo, los estudiantes de una determinada universidad; el nmero de escuelas que
existen en una determinada ciudad, el nmero de rboles de coco sembrados en una
7

MSc. Ing. Tania N. Colque Ortiz

determinada parcela, etctera. El nmero de unidades elementales de una poblacin se


denota con la letra N.
Una muestra es una parte de la poblacin; por ejemplo, cuando se desea hacer un
estudio relativo al rendimiento acadmico de los alumnos de cierta universidad, y para
esto se toma slo un grupo de estudiantes de la misma. Todos los estudiantes de ella son
la poblacin y el grupo escogido constituye la muestra. Es importante hacer notar que
para hacer una investigacin mediante el anlisis de una muestra, sta tiene que ser,
necesariamente, representativa. La representatividad de la muestra implica que cada
unidad de la poblacin debe tener igual probabilidad de ser seleccionada. En estas
condiciones, se dice que la muestra es aleatoria. La obtencin de una muestra
representativa es uno de los aspectos ms importantes de la teora estadstica. Incluye
preguntas como, qu tan grande debe ser la muestra?, qu tipo de datos deben ser
recolectados?, cmo se recogern stos? Estas preguntas sern contestadas ms
adelante. (El nmero de unidades elementales de una muestra se denota con la letra n).
Parmetro: Son todas las medidas dirigidas a la poblacin. Un parmetro es un valor
desconocido, y por lo tanto tiene que ser estimado. Los parmetros se utilizan para
representar una determinada caracterstica de la poblacin. Por ejemplo, la media
poblacional es un parmetro que normalmente se utiliza para indicar el valor
promedio medio de una cantidad.
Dentro de una poblacin, un parmetro es un valor fijo que no vara. Cada muestra
tomada de la poblacin tiene su propio valor de cualquier estadstica que se utilice para
estimar este parmetro. Por ejemplo, la media de los datos en una muestra es utilizada
para dar informacin sobre la media de la poblacin total de la cual esa muestra fue
tomada.

MSc. Ing. Tania N. Colque Ortiz

Estadstico:

Son todas las medidas dirigidas a la muestra. Un estadstico es una

cantidad calculada de una muestra de datos. Se utiliza para dar informacin sobre
valores desconocidos correspondientes a la poblacin. Por ejemplo, el promedio de los
datos en una muestra se utiliza para dar informacin sobre el promedio total de la
poblacin de la cual esa muestra fue tomada.
Los datos discretos son datos contables y recolectados por conteo, por ejemplo, el
nmero de los artculos defectuosos producidos durante un da de produccin.
Los datos continuos son recolectados por medicin y expresados en una escala
continua. Por ejemplo, midiendo la altura de una persona.
Al tratar las variables cuantitativas, podemos encontrarnos a la hora de elaborar las
tablas con los siguientes casos:
1. La variable es discreta y hay un nmero no muy grande de valores diferentes: un
ejemplo es el del nmero de medios de transporte, donde solamente hay 4 valores
diferentes (0, 1, 2 y 3), aunque haya 50 datos.
2. La variable es continua, es decir, cabe la posibilidad de que haya infinitos valores
diferentes. (Pesos, caloras, etc.)
3. La variable es discreta, pero hay gran disparidad de valores diferentes. Por ejemplo,
si preguntara a los alumnos de una clase cul es el nmero total de pginas que tiene
el libro (recreativo) que estn leyendo en ese momento. Lo ms probable es que no
hubiera dos respuestas iguales. En estos casos la variable se tratar como en el caso
2; es decir, aunque sea discreta su tratamiento se equipara al de las variables
continuas.
Las variables cuantitativas continuas o discretas del caso 3, pueden ofrecer problemas a
la hora de situar sus valores en una tabla, puesto que podamos tener una gran
disparidad de valores; por ello se utilizan para este tipo de variables los intervalos de
clase, definidos como los intervalos parciales en que dividimos el campo de variacin
de una variable estadstica continua. Un intervalo queda definido por sus extremos inferior y superior- y por la pertenencia o no de dichos extremos al intervalo: intervalos
abiertos, cerrados, semiabiertos.

MSc. Ing. Tania N. Colque Ortiz

Ejemplos:
Intervalo cerrado: [2,4 : incluye todos los valores comprendidos entre dos y cuatro y

tambin los extremos 2 y 4.


Intervalo abierto: (2,4) : incluye todos los valores comprendidos entre dos y cuatro, pero no
los extremos 2 y 4, stos no pertenecen al intervalo.
Intervalo semiabierto: [2,4) : incluye todos los valores comprendidos entre dos y cuatro,
adems el 2, pero no el 4.

Variables.- Son todas las cualidades de la poblacin objeto de estudio.

Variables Discretas
(Son valores puntuales, exactos)

Nmero de hijos
Nmero de hermanos
Nm. De materias
aprobadas
Cantidad de autos
Cantidad de televisores

Variables Cuantitativas
(Son medibles; son numricas)

Edad
Peso
Estatura
Variables Continuas
Salarios
(Pueden estar dentro de un intrvalo) Tiempo
Dosis de medicamento

Variables

Variables Nominales
(No tienen orden
Ni jerarqua)

Marca de cerveza, gaseosas


Nombre de karaokes
Carreras universitarias
Lugar de nacimiento

Variables Cualitativas
(No son medibles; no son numricas)

Variables Ordinales
(Tienen orden
y jerarqua)

10

Grado Militar
Das de la semana
Meses del ao
Grado de aceptacin
Nivel acadmico

MSc. Ing. Tania N. Colque Ortiz

Ejercicio.- Clasificacin de algunas variables:


1.

Preferencias polticas (MIR, UCS, MAS, PODEMOS) (Var. Cualitativa Nominal)

2.

Marcas de cerveza. (Variable cualitativa nominal)

3. Velocidad en Km/h. (Variable cuantitativa continua)


4.

El peso en Kg.

(Variable cuantitativa continua)

5.

Signo del zodiaco.

(Variable cualitativa ordinal)

6.

Nivel educativo (primario secundario, superior). (Variable cualitativa ordinal)

7. Tipo de enseanza (privada o pblica). (Variable cualitativa nominal)


8.

Nmero de empleados de una empresa pequea. (Variable cuantitativa discreta)

9.

La clase social (baja, media o alta).

(Variable cualitativa ordinal)

10. La presin de un neumtico en Nw/cm2 (Var. Cuantitativa Continua)

La poblacin puede ser segn su tamao de dos tipos:


Poblacin finita: cuando el nmero de elementos que la forman es finito, por
ejemplo el nmero de alumnos de un centro de enseanza, o grupo clase.
Poblacin infinita: cuando el nmero de elementos que la forman es infinito, o
tan grande que pudiesen considerarse infinitos. Como por ejemplo si se realizase
un estudio sobre los productos que hay en el mercado. Hay tantos y de tantas
calidades que esta poblacin podra considerarse infinita.

11

MSc. Ing. Tania N. Colque Ortiz

TABLA DE DISTRIBUCION DE FRECUENCIAS.Para poder analizar la forma como se distribuye la frecuencia con que aparecen los
diferentes valores correspondientes a

las mediciones de las variables que se estn

estudiando, es necesario organizar, resumir y simplificar los datos mediante un soporte


que posibilite su recuperacin para el procesamiento estadstico.

Esto se realiza

mediante Tablas Inteligibles, denominadas Distribuciones de Frecuencias, o tambin


Base de Datos.
La tabla de distribucin de frecuencia es la representacin estructurada, en forma de
tabla, de toda la informacin que se ha recogido sobre la variable que se estudia.
Variable
(Valor)

Frecuencias absolutas
Simple
Acumulada

X
X1
X2

...
Xn-1
Xn

x
n1
n2
...
nn-1
nn

Frecuencias relativas
Simple
Acumulada

x
n1

n1 + n2
...
n1 + n2 +..+ nn-1
n

X
f1 = n1 / n
f2 = n2 / n
...
fn-1 = nn-1 / n
fn = nn / n

f1
f1 + f2
...
f1 + f2 +..+fn-1
f

A continuacin veremos como proceder en la tabulacin de las diferentes variables.


Regla de sturges
Para obtener la frmula k 1 3,32 log n , se deben hacer los siguientes supuestos:
1. El mnimo de datos que amerita clasificacin en intervalos es 16.
2. El nmero de intervalos no debe ser inferior a (5).
3. Cada vez que se duplique la informacin se incrementa en uno (1) el nmero de
intervalos.
As las cosas, se obtiene la siguiente correspondencia:

12

MSc. Ing. Tania N. Colque Ortiz

Se llega a la siguiente igualdad:


n= 2m 1
Tomando logaritmo a ambos lados de la ecuacin
log(n) log( 2 k 1 )
log(n) ( k 1) log(2)
log(n)
1
k
log 2
log(n)
k 1
0,30103
k 1 (3,322) log(n)

El uso de esta formula puede dar resultados irrazonables cuando el nmero de


observaciones es muy grande o muy pequeo. Por esta razn la Regla de Sturges no es
un sustituto del buen juicio. Tambin hay otros autores que toman como sugerencia
para hallar el nmero de clases log n o tambin Raiz de n ( k
de datos.

VARIABLES CUANTITATIVAS CONTINUAS.-

13

), con n nmero

MSc. Ing. Tania N. Colque Ortiz

Cuando el tamao de la muestra y el recorrido de la variable son grandes, por lo que


ser necesario agrupar en intervalos los valores de la variable. Por ejemplo si a un grupo
de 30 alumnos les preguntamos el dinero que tienen en ese momento ahorrado, nos
encontramos con los siguientes datos:

450

1152

250

300

175

80

25

2680

605 785

1595

2300

5000

1200

100

180

200

675

500

375

1500

205

985 185

125

315

425

560

1100

Evidentemente, la variable estadstica tiene un recorrido muy grande, 4998 euros, por lo
que s queremos hacer una tabla con estos datos tendremos que tomar intervalos. Para
decidir la amplitud de los intervalos, necesitaremos decidir cuntos intervalos queremos.
Normalmente se suele trabajar con no ms de 10 12 intervalos.
Amplitud =4998/10 = 499,8 por lo que tomaremos intervalos de amplitud 500
Debemos tener en cuenta las siguientes consideraciones:
-Tomar pocos intervalos implica que la "prdida de informacin" sea mayor.
-Los intervalos sern siempre cerrados por la izquierda y abiertos por la derecha [ L i-1 ,
Li )
Procuraremos que en la decisin de intervalos los valores observados no coincidan con
los valores de los extremos del intervalo y si esto ocurre que no sea en ms de un 5%
del total de observaciones.
Con estas recomendaciones tendremos la siguiente tabla:

14

[ Li-1 , Li )

Frecuencia

[ 0,500)

16

[ 500, 1000)

[ 1000,1500)

[ 1500, 2000)

[ 2000, 2500)

MSc. Ing. Tania N. Colque Ortiz

[ 2500, 3000)

[ 3000, 3500)

[ 3500, 4000)

[ 4000, 4500)

[ 4500, 5000)

[ 5000,5500)

A continuacin desarrollamos un ejercicio paso a paso:


Ej: Con los siguientes datos elaborar una tabla de distribucin de frecuencias.
35
56
29
72
43

42
52
36
66
44

31
53
41
64
61

20
43
48
60
32

80
61
54
56
27

71
58
60
52
34

n=30

1er. Paso.Se calcula el Rango, que es igual a la diferencia entre el valor mximo y el mnimo del
conjunto de datos.
R VMax VMin 80 20 60

2do. Paso.Se calcula la cantidad de clases, intervalos o filas que tendr la tabla de distribucin de
frecuencias. Para ello se utiliza la Regla de Sturges.
K 1 3,32. log n

Donde n = Tamao de la muestra


K 1 3,32. log 30
K 5,797 6

3er. Paso.Se encuentra el Ancho de Clases (AC)


15

MSc. Ing. Tania N. Colque Ortiz

AC

R
K

AC

60
6

AC = Ancho de clases
R = Rango
K = Cantidad de clases o intervalos
Lo que indica que cada intervalo tendr
un ancho de 6 unidades

AC 10

TIPOS DE FRECUENCIAS.-

Frecuencia absoluta.- (fi) Es la cantidad de valores u observaciones que estn


contenidos en cada clase.
Li - Ls
fi
Li =20Lmite
30 inferior
3 de clase
Ls =30Lmite
40 superior
5 de clase
fi =40
Frecuencia
absoluta
50
6
50 60
60 70
70 80

Frecuencia Acumulada (fa) Es la cantidad de valores u observaciones que se van


acumulando a medida que avanzamos en las clases de la primera a la ltima clase.
Li - Ls

fi

fa

20 30
30 40
40 50
50 60
60 70
70 80

3
5
6
9
4
3

3
8
14
23
27
30

SUMAR

9
4
3

Frecuencia Relativa.-(hi)

La frecuencia absoluta, es una medida que est influida por el tamao de la muestra, al
aumentar el tamao de la muestra aumentar tambin el tamao de la frecuencia
absoluta. Esto hace que no sea una medida til para poder comparar. Para esto es
necesario introducir el concepto de frecuencia relativa, que es el cociente entre la
frecuencia absoluta y el tamao de la muestra. La denotaremos por hi

16

MSc. Ing. Tania N. Colque Ortiz

Es la fraccin de valores u observaciones que est concentrada en cada clase.


Li - Ls
hi
hi = Frecuencia Relativa
fi
hi 20 30 fi = Frecuencia
0,100 absoluta
n
n = Nmero total de observaciones
30 40
0,167
40 50
50 60
60 70
70 80

0,200
0,300
0,133
0,100

La sumatoria de todas las frecuencias


relativas es igual a 1

Li - Ls

hi

Hi (-)

20 30
30 40
40 50
50 60
60 70
70 80

0,100
0,167
0,200
0,300
0,133
0,100

0,100
0,267
0,467
0,767
0,900
1,000

Frecuencia Porcentual.- hi % Es el porcentaje de valores u observaciones que se


encuentra concentrado en cada clase.
Li - Ls

hi %

20 30
30 40
40 50
50 60
60 70
70 80

10,0
hi = Frecuencia Relativa
16,7
20.0
30,0
13,3
10,0

hi % hi x 100

hi %= Frecuencia Porcentual

La sumatoria de todas las frecuencias


porcentuales es igual a 100 %
17

Frecuencia Relativa Acumulada (Hi) Es el acumulo de fracciones de los valores


u observaciones que se van acumulando a medida que avanzamos en las clases de la
primera a la ltima clase.

SUMAR

h % 100 %
i

MSc. Ing. Tania N. Colque Ortiz

Frecuencia Porcentual Acumulada (H)


Es el acmulo de porcentajes de los
valores u observaciones que se van acumulando a medida que avanzamos en las
clases de la primera a la ltima clase.

Li - Ls

hi %

Li - Ls

fi

fa

hi

20 30
30 40
40 50
50 60
60 70
70 80

3
5
6
9
4
3

3
8
14
23
27
30

0,100
0,167
0,200
0,300
0,133
0,100

10,0
16,7
20.0
30,0
13,3
10,0

SUMAR

20 30
30 40
40 50
50 60
60 70
70 80

Hi

hi %

0,100
0,267
0,467
0,767
0,900
1,000

10,0
16,7
20.0
30,0
13,3
10,0

Hi %(-)
10,0
26,7
46,7
76,7
90.0
100,0

Hi %
10,0
26,7
46,7
76,7
90.0
100,0

MARCA DE CLASE.- Llamado tambin Punto Medio de Clase, es el valor que se


encuentra exactamente en el centro de cada clase. Se lo obtiene sumando los lmites de
cada clase divididos entre 2.
MC

18

Li Ls
2

Li - Ls

fi

MC

20 30
30 40
40 50
50 60
60 70
70 80

3
5
6
9
4
3

25
35
45
55
65
75

MSc. Ing. Tania N. Colque Ortiz

GRAFICOS PARA VARIABLES CUANTITATIVAS CONTINUAS.a) HISTOGRAMA ABSOLUTO.- Para la elaboracin de un histograma absoluto
podemos relacionar:
Lmites de clase vs. Frecuencia Absoluta
Lmites de clase vs. Frecuencia Relativa
Lmites de clase vs. Frecuencia Porcentual

19

MSc. Ing. Tania N. Colque Ortiz

b) HISTOGRAMA ACUMULADO MENOR QUE.- Para la elaboracin de un


histograma acumulado menor que podemos relacionar:
Lmites de clase vs. Frecuencia Acumulada
Lmites de clase vs. Frecuencia Relativa Acumulada
Lmites de clase vs. Frecuencia Porcentual Acumulada

20

MSc. Ing. Tania N. Colque Ortiz

c) OJIVA.-

Para la elaboracin de una Ojiva podemos relacionar:

Marca de Clase (MC) vs. Frecuencia Acumulada


Marca de Clase (MC) vs. Frecuencia Relativa Acumulada
Marca de Clase (MC) vs. Frecuencia Porcentual Acumulada

d) POLIGONO DE FRECUENCIA.frecuencia podemos relacionar:

Para la elaboracin de un polgono de

Marca de Clase (MC) vs. Frecuencia Absoluta


Marca de Clase (MC) vs. Frecuencia Relativa
Marca de Clase (MC) vs. Frecuencia Porcentual

21

MSc. Ing. Tania N. Colque Ortiz

EJERCICIO.Los siguientes datos corresponden a los ingresos en dlares de un grupo de 50 personas.


Elaborar la tabla de distribucin de frecuencias.
250
100
180
220
250

Calcular Rango:

55
100
200
250
250

210
210
200
90
100

250
250
400
400
395

300
250
200
180
80

240
390
400
300
250

300
150
150
350
400

250
250
350
250
200

R MAX MIN

R 500 55 445

Calcular Nmero de clases: K 1 3.33 log .n


K 1 3.33 log 50 6.5 7

Calcular Ancho de Clase:

22

AC

R 445

63.57 64
K
7

300
200
400
500
400

300
250
250
240
340

MSc. Ing. Tania N. Colque Ortiz

VARIABLES CUANTITATIVAS DISCRETAS.Cuando el tamao de la muestra es grande y el recorrido de la variable es pequeo, por
lo que hay valores de la variable que se repiten. Por ejemplo, si preguntamos el nmero
de personas activas que hay en 50 familias obtenemos la siguiente tabla:
Personas Activas en 50 familias
2

Podemos observar que la variable toma valores comprendidos entre 1 y 4, por lo que
precisaremos una tabla en la que resumamos estos datos quedando la siguiente tabla:

23

Personas Activas

Nmero de Familias

16

20

MSc. Ing. Tania N. Colque Ortiz

Total

50

Una vez calculada las frecuencias absolutas, se procede a encontrar las dems
frecuencias de la misma manera que para datos cuantitativos continuos.

EJEMPLO.Ej: Se realiza una encuesta a 20 estudiantes de la Universidad sobre la cantidad de


hermanos que tiene, obtenindose los siguientes resultados
1 3 0 1 1
2 3 4 5 1
3 1 1 2 3
3 2 2 2 1
Introducimos los datos a una tabla de distribucin de frecuencias:

Cantidad
hermanos

fi

fa

0
1
2
3
4
5

1
7
5
5
1
1

1
8
13
18
19
19

20
24

fraccin
de
hQu
H
Hi (+)
i
i

personas tienen 2
o 4 hermanos?
Resp.- 0,05
0,30
0,05
1,00

0,35
0,25
0,25
0,05
0,05
1,00

0,40
0,65
0,90
0,95
1,00

0,95
0,60
0,35
0,10
0,05

hi %

Hi %

5,0
35,0
25,0
25,0
5,0
5,0

5
40
65
90
95
100

100 %

MSc. Ing. Tania N. Colque Ortiz

Cuntas
personas
tienen menos de 3
hermanos?
Resp.- 13 personas

Qu porcentaje de
personas menos de 4
hermanos?
Resp.- 90 %

GRAFICOS PARA VARIABLES CUANTITATIVAS DISCRETAS.a) Diagrama de Frecuencias Absolutas.Para la elaboracin del diagrama de frecuencias relacionamos:
(Valores de la variable vs. Frecuencia absoluta
(Valores de la variable vs. Frecuencia relativa

Yi vs. f i
Yi vs. hi

fi
7
6
5
4
3
2
1
0

25

Cant.
hermanos

MSc. Ing. Tania N. Colque Ortiz

b) Diagrama de Frecuencias Acumuladas.Para la elaboracin del diagrama de frecuencias relacionamos:


Yi vs. f i
Yi vs. hi

(Valores de la variable vs. Frecuencia acumulada


(Valores de la variable vs. Frecuencia relativa acumulada
fa(-)
20
16
12
8
4
Cant.
hermanos

VARIABLES CUALITATIVAS.Ej: Se realiza una encuesta a 25 personas fumadoras sobre la marca de cigarrillos que
fuman, obteniendo los siguientes resultados:
Marca de
Cigarrillos

fi

fa(-)

hi

CAMEL
LM
MARLBORO
DERBY
EXTRA

7
3
8
4
3

7
10
18
22
25

0,28
0,12
0,32
0,16
0,12

25
Cuantas personas
fuman CAMEL o
MARLBORO?
Resp.- 15 personas

26

Hi
0,28
0,40
0,72
0,88
1,00

1,00
Qu fraccin de
personas
fuman
CAMEL o LM?
Resp.- 0,40

Hi (+)

hi %

Hi %(-)

1,00
0,72
0,60
0,28
0,12

28,0
12,0
32,0
16,0
12,0

28,0
40,0
72,0
88,0
100,0

100 %
Qu porcentaje de
personas
fuman
CAMEL o EXTRA?
Resp.- 40 %

MSc. Ing. Tania N. Colque Ortiz

EJERCICIOS VARIABLE CUALITATIVA


Se les pregunt a 50 personas la opinin sobre la pelcula: Terror en el aire,
obtenindose las siguientes respuestas.
RESPUESTA

fi

MUY BUENA

BUENA

34

REGULAR
MALA
MUY MALA

10
3
1

Elaborar una tabla de distribucin de frecuencia.


SOLUCIN.fi

fa

hi

Hi

hi%

Hi

MUY BUENA

0,04

0,04

BUENA

34

36

0,68

0,72

68

72

REGULAR
MALA
MUY MALA

10
3
1

46
49
50

0,2
0,06
0,02

0,92
0,98
1,00

20
6
2

92
98
100

GRAFICOS.Para las variables cualitativas podemos crear los siguientes grficos:


a) TORTA O PASTEL.-

27

b) DIAGRAMA DE BARRAS

MSc. Ing. Tania N. Colque Ortiz

EJERCICIO RESUELTO.La distribucin de una variable tiene por polgono acumulativo de frecuencias
siguiente grfico:

28

el

MSc. Ing. Tania N. Colque Ortiz

Si el nmero total de observaciones es 50:


1. Elaborar una tabla estadstica con los siguientes elementos: Intervalos, Marcas
de clase, frecuencia absoluta, las frecuencia acumuladas, frecuencias relativas y
frecuencias relativas acumuladas
2. Cuntas observaciones tuvieron un valor inferior a 10, y cuantas fueron
superior a 11?

Solucin.Li - L S

fi

05
57
7 12
12 15

hi

HI

0,2
0,3
0,3
0,2

0,2
0,5
0,8
1,0

n = 50

Siendo:

hi

fi
n

Entonces: f i hi .n
Reemplazamos para encontrar
las frecuencias absolutas:
f1 0,2 x50 10

f 2 0,3 x50 15
f 3 0,3 x50 15
f 4 0,2 x50 10

29

Li - L S

fi

hi

HI(-)

05
57
7 12
12 15

10
15
15
10

0,2
0,3
0,3
0,2

0,2
0,5
0,8
1,0

n = 50

MSc. Ing. Tania N. Colque Ortiz

Completando la tabla de distribucin de frecuentas:


Li - L S
05
57
7 12
12 15

fi

fa

hi

HI

10
15
15
10

10
25
49
50

0,2
0,3
0,3
0,2

0,2
0,5
0,8
1,0

n = 50

1,0

Cuntas observaciones tuvieron un valor inferior a 10?


7 a 12
7 a 10

15
x

5
3

15
x

10 + 15 + 9 = 34 observaciones

30

3 x15
9
5

You might also like