You are on page 1of 29

Apunte 1 de Estadstica para la carrera Ingeniera en Construccin Profesor: Jorge Gmez M.

UNIDAD I: ESTADISTICA DESCRIPTIVA


Introduccin: La estadstica descriptiva es un conjunto de procedimientos que tienen por objeto presentar conjuntos de datos por medio de tablas, grficos y/o medidas de resumen. De acuerdo a lo anterior, la estadstica descriptiva es la primera etapa a desarrollar en un anlisis de informacin. Qu es la Estadstica? La estadstica es una disciplina que disea los procedimientos para la obtencin de los datos, como asimismo proporciona las herramientas que permiten extraer la informacin. Propsito de la Estadstica. El anlisis estadstico se usa para manipular, resumir e investigar datos con el fin de obtener informacin til en la toma de decisiones. Observacin: No olvide que el propsito de todos los procedimientos estadsticos, independientemente de su complejidad, es extraer informacin til de los datos disponibles. Algunas aplicaciones de conceptos estadsticos pueden ser: a) b) c) d) e) En contabilidad: Recoleccin de datos. En prevencin de riesgos: La prevalencia de accidentarte el trabajador. En sistemas de informacin administrativas: Recoleccin de datos, Regresin. En administracin de operaciones: Nmeros ndices. En control de calidad: Presentacin de datos, Estadstica descriptiva.

1. Definiciones 1.1. Poblacin y muestra Poblacin: es el conjunto completo de individuos o elementos de inters. Existen momentos en los que se puede medir o examinar cada elemento de la poblacin, por ejemplo, todos los estudiantes de una clase contestarn un cuestionario. Si hay 35 estudiantes en la clase y slo se desea la informacin sobre esta clase, los estudiantes constituyen la poblacin, y se puede medir a cada uno por sus respuestas al cuestionario. Cuando se intenta medir a todos los miembros de una poblacin de inters, el resultado es un censo. Censo: es medir todos los elementos de una poblacin de inters.

Apunte 1 de Estadstica para la carrera Ingeniera en Construccin Profesor: Jorge Gmez M.

En la mayora de las investigaciones estadsticas es imposible estudiar a toda la poblacin, debido que los censos son difciles y muy costosos. De esta manera es necesario seleccionar un pedazo de esta poblacin o mejor llamado muestra. Muestra: es un subconjunto representativo seleccionado de la poblacin. El concepto de representativo es muy importante ya que una buena muestra es aquella que refleje las caractersticas esenciales de la poblacin de la cual se obtuvo. Nota: Un parmetro es cualquier caracterstica medible de la poblacin, y un estadstico o estadgrafo es cualquier caracterstica medible de una muestra. 1.2. Variables y atributos: Tipo de datos Unidad: es el objeto que observamos. Cuando el objeto es una persona, lo referimos como sujeto. Observacin: es la informacin o caracterstica que registramos de cada unidad. Una caracterstica que puede variar de unidad en unidad es llamada variable. Una coleccin de observaciones con una o ms variables se llama base de datos. Los datos estadsticos generalmente se obtienen contando o midiendo objetos. Algunos ejemplos de medidas son el promedio de notas, la tasa de desempleo, las ventas mensuales de un supermercado, la tasa de accidentes vehiculares, etc. Estas medidas se llaman variables, porque pueden tomar muchos valores diferentes. Una variable es un elemento de inters que pude tomar muchos valores numricos diferentes. Una constante tiene un valor fijo. Las variables se pueden clasificar en dos tipos: cuantitativas o cualitativas. Una variable cuantitativa es aquella que posee valores numricos que representan medidas (largo, peso, etc.) o frecuencias (nmero de accidentes). Tiene sentido realizar operaciones numricas con estas variables. Adems estas variables se subdividen en discretas y continuas. Una variable cuantitativa discreta se dice de la cual se puede contar el nmero posible de valores (por ejemplo: nmero de accidentes en el metro, cantidad de ilesos, etc). Una variable cuantitativa continua puede tomar cualquier valor en un intervalo dado y est sujeto a la precisin de los instrumentos de medicin (por ejemplo: el tiempo en que un trabajador realiza una tarea, el cual depende de la precisin del cronmetro usado). Una variable cualitativa es aquella que clasifica las unidades en categoras. Las categoras pueden tener un orden natural (ordinales) o no (nominales), de esta manera las variables cualitativas se dividen en ordinales y nominales. Las variables cualitativas tambin se llaman variables categricas. Con estas variables podemos contar nmero de casos, comparar entre categoras, pero no podemos realizar operaciones numricas. Un ejemplo de variable categrica ordinal podra ser el nivel de accidentacin del trabajador (nunca sucede, la

Apunte 1 de Estadstica para la carrera Ingeniera en Construccin Profesor: Jorge Gmez M.

mitad de las veces sucede o siempre sucede) y para una variable categrica nominal podra ser el sexo del individuo (femenino o masculino). Lo anterior se mostrar como la siguiente tabla:

Ejemplo 1: Determine qu tipo son las siguientes variables. Si son variables cualitativas (nominal u ordinal) o cuantitativas (discretas o continuas). a) Marca de automvil variable cualitativa nominal b) Duracin de un compacto (segundos) variable cuantitativa continua c) Nmero de temas de un compacto variable cuantitativa discreta d) Nivel educacional (bsica, media, universitaria) variable cualitativa ordinal e) Temperatura al medioda en Talca (grados Celcius) variable cuantitativa continua f) Estado civil (soltero, casado, divorciado, viudo) variable cualitativa nominal g) Cantidad de lluvia en un ao en Talca (mm3) variable cuantitativa continua

Apunte 1 de Estadstica para la carrera Ingeniera en Construccin Profesor: Jorge Gmez M.

2. Recoleccin y presentacin de datos: Distribucin de frecuencias Una vez que se hayan reunido los datos, deben procesarse de tal manera que pueda observarse cualquier patrn significativo. En esta etapa se debe estudiar algunas tcnicas que permitan convertir los datos brutos en informacin relevante en la toma de decisiones. En este tem se darn las tcnicas bsicas ms usadas para presentar el conjunto de datos en forma resumida. Estas tcnicas son importantes tanto para datos cuantitativos como para los cualitativos. Una forma comn y muy til para resumir el conjunto de datos es la distribucin de frecuencias o tabla de frecuencias. Este mtodo de presentacin de datos muestra la frecuencia (nmero de ocurrencias) para cada una de las categoras. Ejemplo 2 (Variable cualitativa o atributo): Los resultados obtenidos al observar el estado de 80 artculos que componen un lote, dio origen a los siguientes datos: A A D R A A R R A AADAAARAAAARRAADAAAARAAARAAAARARAAAAAAA A R A A A D A A A A A A A A A R R A A A A A A A A A A A R A R D. Solucin: La tabla de distribucin de frecuencias est dada por: Categoras Piezas aceptadas (A) Piezas rechazadas (R) Piezas dudosas (D) Total Frecuencia absoluta ( n i ) 60 15 5 n = 80 Frecuencia relativa ( f i ) 0.75 (60/80) 0.19 (15/80) 0.06 (5/80) 1.00 (80/80)

Ejemplo 3 (Variable cuantitativa discreta): Para estimar el nmero de alumnos ausentes en las clases de Estadstica, un profesor decide seleccionar 25 clases al azar (muestra) y contar el nmero de alumnos que faltan por clase (variable). Los datos son los siguientes: 7,10,8,6,8,9,9,9,8,6,3,9,8,7,9,10,4,5,10,2,7,8,7,8 y 6.

Apunte 1 de Estadstica para la carrera Ingeniera en Construccin Profesor: Jorge Gmez M.

Solucin: La tabla de distribucin de frecuencias est dada por: i Categoras(xi) 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 Total Donde: n i : Es la frecuencia absoluta (nmero de coincidencias en la categora). Por ejemplo en la categora 5 hay 3 coincidencias o sea n 5 = 3 . fi = ni 1 1 1 1 3 4 6 5 3 n = 25 fi 0.04 0.04 0.04 0.04 0.12 0.16 0.24 0.20 0.12 1.00 N i 1 2 3 4 7 11 17 22 25 Fi
1/25 = 0.04 2/25 = 0.08 3/25 = 0.12 4/25 = 0.16 7/25 = 0.28 11/25 = 0.44 17/25 = 0.68 22/25 = 0.88 25/25 = 1

ni se llama frecuencia relativa de la i-sima categora (se acostumbra expresarla n en porcentaje). Por ejemplo para la categora 5 f 5 = 0 . 1 2 indica que el 12% de las veces faltaron 6 alumnos a clases. N Adems de las frecuencias relativas es conveniente indicar las frecuencias absolutas acumuladas ( N i ) y las frecuencias relativas acumuladas ( F i ), donde por ejemplo:
5

= n1 + n2 + n3 + n4 + n5 = 7 N 5 7 = = 0 .2 n 2 5 8 o l o

y s q lu o e m e F 5i =s fm1 + fo 2 + f 3 + f 4 + f 5 = 0 . 2 8

F5 =

N 5 = 7 indica que con siete clases se tiene a lo ms 6 alumnos ausentes. F 5 = 0 . 2 8indica que el 28% de las veces faltaron 6 alumnos o menos, mientras que el 72% restante faltaron ms de 6 alumnos. Cuando el nmero de valores posibles de una variable cuantitativa discreta o continua sea grande, conviene agrupar en intervalos de clase. Los intervalos pueden ser de amplitud variable o constante. La seleccin del nmero de intervalos o clases (k), depende de cada caso. Es aconsejable que haya menos de 15 clases (para un fcil manejo y con el fin de asegurar una compactacin suficiente de informacin) y por lo menos 5 (para evitar la prdida de informacin que se producira al reunir en un grupo

Apunte 1 de Estadstica para la carrera Ingeniera en Construccin Profesor: Jorge Gmez M.

datos muy diferentes). Por lo general, las clases se eligen de modo que la amplitud de cada una de ellas sea igual para todas las categoras o intervalos de clase. Pasos para la construccin de una distribucin de frecuencias: 1er Paso Determinar k, nmero de clases. Se utiliza la regla de Sturge que dice: k 1 + 3 . 3 l o n g) ( 2do Paso Determinar A, el tamao o amplitud de cada clase. Para ello se determina la diferencia entre el valor ms grande del conjunto de datos y el ms pequeo, y luego se divide por el nmero de clases (k). O sea: A = 3er Paso 4to Paso 5to Paso X
m ia m x

o X k

i i mn

Determinar el punto inicial de la primera clase. Contar el nmero de valores que ocurren en cada clase. Preparar la tabla de frecuencia utilizando las frecuencias absolutas y/o relativas.

Observaciones: Si existe un nmero grande de elementos u observaciones, digamos ms de 1000, por lo general se usa un nmero relativamente grande de clases (11 o ms). Si el conjunto de datos es pequeo, por ejemplo, menos de 60 observaciones, se usa un nmero pequeo de clases (5 6).

Apunte 1 de Estadstica para la carrera Ingeniera en Construccin Profesor: Jorge Gmez M.

Ejemplo 4: (Variable cuantitativa continua) Los siguientes datos representan las duraciones, en aos, de 40 bateras de autos similares. Las bateras estaban garantizadas para durar tres aos. Construyamos una tabla de frecuencias para lo siguientes datos:
2.2 3. 2.5 3.3 4. 4. 1.6 4. 3.1 3.8 3.5 3.1 3. 3.7 3.2 4. 3.3 3.6 4. 4 7 1 3 4 5 4 3.2 3.8 2.9 3.2 3.9 3.7 3.1 3.3 4. 3.0 3.0 4. 3.9 1.9 4.2 2.6 3.7 3.1 3. 1 7 4 2.6 3.5

Solucin: 9 Como k 1 + 3 . 3 l o 4 g ) 0 (= 6 . 2 , podramos considerar entre 6 7 intervalos. En este caso vamos a tomar 7 intervalos, lo que nos dara una amplitud de intervalo de: A = 4 .7 1 .6 = 0 .4 7 4 30 . 5

Para tomar el punto inicial de la primera clase consideraremos el valor mnimo del conjunto de datos o sea 1.6, de esta forma la tabla de frecuencias estara definida por:
Intervalos de clase [1.6 2.0] [2.1 2.5] [2.6 3.0] [3.1 3.5] [3.6 4.0] [4.1 4.5] [4.6 5.0]

Lmites Exactos
[1.55 2.05] [2.05 2.55] [2.55 3.05] [3.05 3.55] [3.55 4.05] [4.05 4.55] [4.55 5.05]

Marca de Clase1 ( m i )
1.8 2.3 2.8 3.3 3.8 4.3 4.8

ni
2 2 5 15 8 6 2 n = 40

fi
0.05 0.05 0.125 0.375 0.2 0.15 0.05 1.0

Fi
0.05 0.1 0.225 0.6 0.8 0.95 1

2 4 9 24 32 38 40

Marca de Clase ( m i ): es el promedio de cada intervalo de clase o Lmite Exacto.

Apunte 1 de Estadstica para la carrera Ingeniera en Construccin Profesor: Jorge Gmez M.

3. Representacin Grfica Es muy til clasificar los datos en categoras (o intervalos de clase) y determinar sus frecuencias pero muchos analistas prefieren una representacin grfica. El grfico ms comn es aquel donde las clases o categoras se representan en el eje horizontal y las frecuencias en el eje vertical. Los grficos ms utilizados son: Grfico circular o diagrama de torta Diagrama de barras Histograma Polgono de frecuencias Ojiva o polgono de frecuencias acumuladas 3.1. Grfico circular o diagrama de torta Este grfico consiste en desplegar las frecuencias absolutas ( n i ) o relativas ( f i ) en un crculo completo. Se aplica a datos cualitativos. El tamao de las porciones del crculo (ngulo) es proporcional a la frecuencia en cada categora. Ejemplo 5: Graficaremos los datos de la tabla del ejemplo 2 donde usaremos las frecuencias relativas, quedando el grfico como:
Estado de los artculos

6% 19% Piezas aceptadas Piezas rechazadas Piezas dudosas 75%

Apunte 1 de Estadstica para la carrera Ingeniera en Construccin Profesor: Jorge Gmez M.

3.2. Diagrama de barras Un diagrama de barras es un mtodo habitual de presentar en forma grfica datos cualitativos. Cada barra representa la frecuencia (o conteo) de una categora. La altura de la barra es proporcional al nmero de elementos en esa categora. En general las barras se ponen en posicin vertical con la base en el eje horizontal de la grfica. Las barras pueden ir separadas, donde la separacin deja de manifiesto que se estn dibujando frecuencias de categoras distintas. Ejemplo 6.1: Usaremos el ejemplo 2, donde las categoras sern el estado de los artculos. El grfico de barras queda dado por:
Estado de los artculos 70 60 50 40 30 20 10 0 Piezas aceptadas Piezas rechazadas Piezas dudosas 15 5 Estado de los artculos 60

Ejemplo 6.2: La ciudad de procedencia de 36 alumnos de la Universidad de Talca se puede graficar como:

Apunte 1 de Estadstica para la carrera Ingeniera en Construccin Profesor: Jorge Gmez M.

3.3. Histograma El histograma es la representacin grfica ms utilizada para datos agrupados en intervalos (se aplica solamente para datos cuantitativos). Un histograma es un conjunto de rectngulos, cada uno de los cuales representa un intervalo de agrupacin o clase. Sus bases son iguales a la amplitud del intervalo y las alturas se determinan de manera que su rea sea proporcional a la frecuencia de cada clase. Ejemplo 7: Utilizaremos al ejemplo 4, de modo que la grfica es:
Duracin de las bateras de los autos frecuencia relativa 0,4 0,3 0,2 0,1 0 [1.55 2.05] [2.05 2.55] [2.55 3.05] [3.05 3.55] [3.55 4.05] [4.05 4.55] [4.55 5.05] Duracin (aos) 0,05 0,05 0,125 0,375 0,2

0,15 0,05

(En el eje x van los lmites exactos o reales) 3.4. Polgono de frecuencias El polgono de frecuencias es otro mtodo usual de presentar grficamente datos agrupados en intervalos (se aplica solamente para datos cuantitativos). Para construir el polgono de frecuencias se marcan las frecuencias sobre el eje vertical y los valores de la variable en el eje horizontal. Despus se representa la frecuencia de cada clase dibujando un punto sobre el punto medio m i de la clase y se conectan los puntos sucesivos con lneas rectas para formar un polgono. En los extremos de la escala horizontal se agregan dos nuevas clases con frecuencia cero. Esto permite que el polgono llegue al eje horizontal en los extremos de la distribucin.

10

Apunte 1 de Estadstica para la carrera Ingeniera en Construccin Profesor: Jorge Gmez M.

Ejemplo 8: Vamos a emplear el ejemplo 4, donde el grfico de polgonos de frecuencias sera:


Duracin de las bateras de los autos 16 14 12 10 8 6 4 2 0 15

Frecuencia

8 5 2 0 y=0 1,8 2 2,3 2,8 3,3 3,8 4,3 6 2 4,8 0 y=0

POLIGONO DE FRECUENCIAS

Duracin de bateras (aos)

3.5. Ojiva o polgono de frecuencias acumuladas El polgono de frecuencias acumuladas se usa para determinar cuntas observaciones o datos hay menores que un valor determinado en una distribucin. Se aplica solamente para datos cuantitativos. Ejemplo 9: De nuevo emplearemos el ejemplo 4, donde el grfico ojiva sera:
Duracin de las bateras de los autos Frecuencia Acumulada 50 40 30 20 10 0 0 2 4 9 24 32 OJIVA 38 40

1,55

2,05

2,55

3,05

3,55

4,05

4,55

5,05

Duracin de bateras(aos)

La Ojiva nos dice, por ejemplo, que hay alrededor de 38 autos donde sus bateras duran menos o igual a 4,55 aos.

11

Apunte 1 de Estadstica para la carrera Ingeniera en Construccin Profesor: Jorge Gmez M.

4. Medidas de Tendencia Central Hasta aqu nos hemos preocupado de la descripcin de un conjunto de observaciones, ya sea grficamente o por medio de una distribucin de frecuencias. Sin embargo, en muchos casos, en vez de trabajar con todas las observaciones es preferible disponer de una o ms medidas descriptivas que resuman los datos en forma cuantitativa. Tales medidas reciben el nombre de Estadstica o estadgrafos. Al calcular valores descriptivos que resuman un conjunto de datos, la primera consideracin es encontrar un valor central o representativo de los datos. El trmino valor central puede referirse a la moda, a la mediana o a la media aritmtica, entre otras. Cada una de estas medidas es apropiada para ciertos propsitos descriptivos, pero puede resultar completamente inadecuada para otros.

Moda (Mo)
La moda de un conjunto de datos es el valor que ocurre con ms frecuencia. Caractersticas de la moda: Algunos conjuntos de datos no tienen moda Algunos conjuntos de datos tienen ms de una moda La moda no tiene propiedades matemticas valiosas para usarlas en otros clculos

Ejemplo 10.1: Si un conjunto de datos consiste en los valores de las notas de ciertos alumnos y son 4, 5, 6, 2, 2, 3, 4, 4, 6 y 7, la moda aqu sera 4. Ejemplo 10.2: Si un conjunto de datos posee los siguientes valores: 12, 14, 15, 16, 15, 18, 19, 20 y 14, los valores 14 y 15 ocurren con una frecuencia de dos. Por tanto, se puede decir que es un conjunto bimodal, con modas 14 y 15. Si ningn valor hubiera aparecido ms de una vez, los datos no tendran moda.

Mediana (Me)
En los casos que se requiere de un valor central que no sufra los efectos de distorsin de los valores extremos, se usa la mediana. La mediana de un conjunto de datos, ordenados de menor a mayor, es un valor tal que la mitad de las observaciones son menores que tal valor y la otra mitad de las observaciones son mayores que ese valor.

12

Apunte 1 de Estadstica para la carrera Ingeniera en Construccin Profesor: Jorge Gmez M.

Pasos para encontrar la mediana: 1. Ordenar los datos de menor a mayor 2. Calcular la posicin de la mediana: ( n + 1 ) 2 , donde n es el nmero de observaciones 3. a) Si el nmero de observaciones es impar, la mediana es un nico trmino central. b) Si el nmero de observaciones es par, la mediana es el promedio de los dos trminos centrales. Caractersticas de la mediana: Todo conjunto de datos cuantitativo o cualitativo a nivel ordinal tiene una mediana La mediana no es sensible a los valores extremos La mediana no tiene propiedades matemticas valiosas para usarlas en otros clculos

Ejemplo 11.1: El nmero de personas atendidas por da en una sala de emergencia de un hospital en una semana son: 25, 35, 26, 52, 78, 30 y 45; la mediana es 35. Ejemplo 11.2: Si las edades de 20 sujetos son: 32, 37, 39, 40, 41, 41, 41, 42, 42, 43, 44, 45, 45, 45, 46, 47, 47, 49, 50 y 51. Como n = 20 es par calculamos (n+1)/2 y obtenemos (20+1)/2 = 10,5, es decir, la mediana se encuentra entre la dcima y undcima observacin (43 y 44). Por lo tanto la mediana es el promedio de stos dos trminos, o sea es igual a (43+44)/2 = 43,5 aos.

Media aritmtica ( x )
La media aritmtica o tambin llamada promedio (o simplemente media) es la medida de tendencia central ms utilizada y ms prctica. La media aritmtica se calcula sumando todos los valores numricos y dividiendo por el nmero de valores. El smbolo que se usa para la media de una poblacin es la letra griega , y el smbolo para la media de la muestra es x (x barra). Con frecuencia las medidas de un conjunto de datos referidos a una muestra se representan por: x 1 , x 2 , x 3 , . . . , x n donde x 1 es la primera medida en el conjunto de datos, x 2 es la segunda medida y as sucesivamente hasta x n la ltima.

13

Apunte 1 de Estadstica para la carrera Ingeniera en Construccin Profesor: Jorge Gmez M.

La ecuacin siguiente se usa para calcular la media de una muestra

x = donde

i=1

xi

i=1

x i representa la suma de todos los valores de la muestra y n el tamao de la

muestra. Caractersticas de la media: Todo conjunto de datos derivado de una variable cuantitativa tiene una media. La media tiene propiedades matemticas valiosas que hacen que sea conveniente usarla en otros clculos La media es sensible a valores extremos

Observacin importante: A veces a los valores x 1 , x 2 , x 3 , . . . , x n de una variable se les asocia ciertos factores o pesos w 1 , w 2 , w 3 , . . . , w n que dependen de la importancia de cada uno de los valores. En este caso la media aritmtica se llama media aritmtica ponderada y se determina de la siguiente manera:

x =

i=1

xiw
n

x1 w 1 + x2 w w1 + w

2 2

+ x 3 w 3 + . . .+ x n w + w 3 + . . .+ w n
i

i=1

donde x i son los valores de los datos a promediar, y w aplicados a los valores x i .

son los pesos o ponderaciones

Ejemplo 12.1: Un grupo de 20 dueas de casa gasta en promedio $200.000 mensuales en supermercado. Otro grupo de 50 dueas de casa gasta un promedio de $60.000 mensuales en supermercado. Cul es el gasto promedio mensual en supermercado de las 70 dueas de casa?. Solucin: Aqu n = 20 + 50 = 70 x 1 : es el gasto mensual en supermercado de un grupo de 20 dueas de casa x 1 = $200.000 : es el gasto promedio mensual en supermercado del grupo de 20 dueas de casa x 2 : es el gasto mensual en supermercado de un grupo de 50 dueas de casa x 2 = $60.000 : es el gasto promedio mensual en supermercado del grupo de 50 dueas de casa

14

Apunte 1 de Estadstica para la carrera Ingeniera en Construccin Profesor: Jorge Gmez M.

Por lo tanto el gasto promedio mensual en supermercado de las 70 dueas de casa est dado por:

x =

i=1

xiw
2

x1 w 1 + x2 w w1 + w 2

0 20 +0 6 0 0 0 2 + 5 0 0

0 5 0 0 0 = 1

i=1

De esta manera el gasto promedio mensual en supermercado de las 70 dueas de casa es de $100.000 . Propiedades de la media aritmtica: Si cada valor x 1 , x 2 , x 3 , . . . , x n de un conjunto de nmeros se aumentan en b unidades, entonces la media aritmtica de la nueva variable es igual a: x + b Si cada valor x 1 , x 2 , x 3 , . . . , x n de un conjunto de nmeros se multiplica por a, entonces la media aritmtica de la nueva variable es igual a: a x

Ejemplo 12.2: a) Los sueldos de cuatro personas son: $350.000, $250.000, $300.000 y $300.000, lo que da un sueldo promedio de $300.000 . Si a cada una de estas personas se les aumenta el sueldo en $15.000, entonces el sueldo promedio es ahora: $300.000 + $15.000 = $315.000 . b) Si las notas de los test de un estudiante son: 5, 5, 4 y 6, y se decide aumentar en un 20% cada una de ellas, cul va ser la nota promedio del estudiante despus del aumento del 20%?.

15

Apunte 1 de Estadstica para la carrera Ingeniera en Construccin Profesor: Jorge Gmez M.

5. Medidas de Dispersin Se llama dispersin o variacin de los datos, al grado en que los datos tienden a extenderse alrededor de un valor medio. Las medidas de tendencia central no proporcionan suficiente informacin para una adecuada descripcin de los datos, porque no toman en cuenta la variabilidad o dispersin de stos. Para evitar falsas interpretaciones de las medidas de tendencia central, por ejemplo de la media aritmtica, es necesario acompaar este valor con un coeficiente que mida el grado de dispersin de la distribucin de la variable. Las medidas de dispersin ms usadas son el Rango o Recorrido, la Varianza, la Desviacin Estndar y el Coeficiente de Variacin.

Rango
El Rango o Recorrido se define como el valor absoluto de la diferencia entre los valores mximo y mnimo de un conjunto de observaciones. Rango = Mximo Mnimo Las ventajas del rango son su independencia respecto a las medidas de tendencia central y su facilidad de clculo. Su desventaja es que para su clculo se atizan slo dos valores del conjunto de datos. Ejemplo 13: El nmero de personas atendidas por da en una sala de emergencia de un hospital en una semana son: 25, 35, 26, 52, 78, 30 y 45; el rango o recorrido va ser igual a la diferencia entre 78 y 25, es decir, 78 25 = 63 .

16

Apunte 1 de Estadstica para la carrera Ingeniera en Construccin Profesor: Jorge Gmez M.

Varianza y Desviacin Estndar


Estas dos medidas de dispersin son las ms importantes y las de mayor utilidad prctica y terica. Se define la varianza muestral de un conjunto de valores x 1 , x 2 , x 3 , . . . , x n (muestra) como el promedio de los cuadrados de las desviaciones2, y se denota por S . Es decir:

(x
i=1

n 1

Para describir la variabilidad de los datos, en vez de usar la varianza muestral se usa la raz cuadrada de esta, denotada por S y se llama desviacin estndar muestral. La desviacin estndar muestral es, por lo general, ms conveniente que la varianza muestral para interpretar la variabilidad de un conjunto de datos, ya que S est expresada en unidades al cuadrado, en tanto que S tiene las mismas unidades que los datos originales. La desviacin estndar muestral se define como:

S =

(x
i=1

n 1

Importante: Cuando estamos interesados en obtener la varianza y la desviacin estndar de una poblacin ocupamos las siguientes frmulas:

V (X ) =

(x
i=1

(x
i=1

Ejemplo 14: Para ilustrar el clculo de la varianza y la desviacin estndar muestrales, supondremos que los valores de X en la tabla siguiente representan el nmero de grabadoras ensambladas por 10 trabajadores diferentes en una fbrica el pasado mes. Esto es, el primer trabajador ensambl x 1 = 1 1 grabadoras, el segundo x 5
2 1

= 1
0

2 , etc. 2

El promedio de grabadoras ensambladas por trabajador es: (grabadoras)

x =

i=1

xi 0

1 1

2 0

0 0 = 1 2

Desviaciones: son las diferencias entre la observacin y su promedio.

17

Apunte 1 de Estadstica para la carrera Ingeniera en Construccin Profesor: Jorge Gmez M.

xi x1 = 1 x x
2

d i = (x i x 1 2 2 1 1 2 3 2 1 1 2 5 2 9 3 9 4 2 0 0 6 0 d1 = x1 x = 1 d d d d d d d d d
1 2 3 4 5 6 7 8 9 1 0

)
d d d d d d 2 d d 0 d d
2 1 2 2 2 3 2 4 2 5 2 6 2 7 2 8 2 9 2 1 0 1 0

2 i

1 15 2 = 0 5 2 12 2 = 02 2 19 2 = 09 1 13 2 = 0 7 1 19 2 = 0 1 2 14 2 = 04 3 12 2 = 01 2 10 2 = 0 1 10 2 = 0 1 1 16 2 = 0 4 di = 0
0

= (x i x 5 1 9 6 4
2

= (5)2 = 2 = (2 ) = 4 = (9 )2 = 8 = (7 )2 = 4 = ( 1) = 1
2

= 1 = 1

= x2 x = 1 = x3 x = 1 = x4 x = 1 = x5 x = 1 = x6 x = 1 = x7 x = 1 = x8 x = 1 = x9 x = 1
0

x3 = 1
4

x5 = 1 x6 = 1 x x
7

= (4 )2 = 1 = ( 1 )2 = 1
2

= 1 = 1

4 0 6 0

x8 = 1
9

= (0) = 0
2

= ( 1 ) 02 = 1 = (4) = 1
2 i

x 1 0= 1 SUMA

= x 1 0 x = 1
i

i=1

xi = 1

i=1

(x

x)=

i=1

(x
i=1

2 i

= 4

i=1

En la segunda columna estn las desviaciones respecto a la media. Observar que la suma de estas desviaciones es igual a cero. En la tercera columna estn los cuadrados de las desviaciones respecto a la media, cuya suma es 436. Entonces, la varianza muestral es:

1 0 1 y la desviacin estndar muestral es: S =

(x
i=1

4 9

6 = 4 . 48 ( g

r a

a) 2 d

r a

4 . 48 = 6 . 9

(6 g

r a

a)

r a

Interpretacin de la desviacin estndar muestral: La variacin de grabadoras ensambladas por 10 trabajadores es de aproximadamente 7 grabadoras con respecto a su media.

18

Apunte 1 de Estadstica para la carrera Ingeniera en Construccin Profesor: Jorge Gmez M.

Observaciones: En muchos casos se hace difcil realizar una interpretacin precisa de los valores de S y S, en razn que la variabilidad depende en gran medida de la unidad que se esta midiendo. Por ejemplo, la variabilidad de los ingresos en Chile es ciertamente mayor cuando se mide en pesos que cuando se mide en miles de pesos. En todo estos casos, cuando crece la dispersin de una poblacin, tambin crecen los valores de S y S. Por otra, si S = S = 0, significa que no existe ninguna variabilidad entre los datos (todos los valores de X son iguales entre s, es decir, X es una constante). Una regla prctica o regla emprica, que a menudo proporciona una buena aproximacin al grado de dispersin de un conjunto de observaciones establece que: Alrededor del 68% de todos los valores caern dentro de una desviacin estndar a ambos lados de la media; que ms o menos el 95% de todos los valores caern dentro de dos desviaciones estndar a ambos lados de la media y que casi todos ( 100%) de los datos estarn dentro de tres desviaciones estndar a ambos lados de la media. Esta regla prctica se basa en el supuesto que la poblacin tenga una distribucin simtrica o casi simtrica de forma acampanada. En el ejemplo anterior (Ejemplo 14) x = 1 2 y0 S = 6 . 9 .6 En el caso de que se cumpliera la regla emprica (distribucin simtrica de forma acampanada), el intervalo ( x S ) ( x S ; x + S ) = ( 1 1. 0 3; 14 2. 9 6) 6 contiene aproximadamente el 68% de los datos; el intervalo ( x 2 S ) ( x 2 S ; x + 2 S ) = ( 1 0. 0 6; 18 3. 9 3) 2 contiene aproximadamente el 95% de los datos y el intervalo ( x 3 S ) ( x 3 S ; x + 3 S ) = ( 9 . 19 ; 12 4. 8 0) 8 contiene aproximadamente el 100% de todos los datos. Si la mayor parte de los valores estn a la izquierda, se dice que la distribucin es sesgada a la derecha o que tiene sesgo positivo y en tal caso M o < d M a e d < i x a . En a n el caso de que la mayora de los valores estn a la derecha, se dice que la distribucin es sesgada a la izquierda o que tiene sesgo negativo y en tal caso x < M e d < i Ma n o .a d a

Propiedades de la varianza: La varianza de una constante es cero, es decir, la varianza de X es cero si x 1 = x 2 = x 3 = . . . = x n = c , y se escribe V(c) = 0 Si cada valor x 1 , x 2 , x 3 , . . . , x n de un conjunto de nmeros se aumentan en a unidades, entonces la varianza de la nueva variable es igual a: V ( X + a ) = V ( X ) Si cada valor x 1 , x 2 , x 3 , . . . , x n de un conjunto de nmeros se multiplica por a, entonces la varianza de la nueva variable es igual a: V ( a X ) = a 2 V ( X )

19

Apunte 1 de Estadstica para la carrera Ingeniera en Construccin Profesor: Jorge Gmez M.

Coeficiente de Variacin
Para comparar el grado de dispersin entre dos o ms distribuciones expresadas en distintas unidades de medida, no podemos comparar simplemente las varianzas o a las desviaciones estndar respectivas. En este caso se define el llamado Coeficiente de Variacin o Coeficiente de Dispersin Relativa que est dado por: C V = S x

El coeficiente de variacin (CV) es independiente de las unidades de medida utilizadas y est generalmente expresado en porcentaje. Un inconveniente de este coeficiente es que deja de ser til cuando la media aritmtica es prxima a cero. Ejemplo 15: Para el ejemplo anterior, el coeficiente de variacin sera: C V = 6 .9 6 = 0 .0 1 2 0 5 ( 5 8. 8 % )

El coeficiente de variacin se interpretara como: existe una variacin de un 5.8% en las grabadoras ensambladas por los 10 trabajadores, respecto a su promedio.

Nota: Una Estadstica es una medida descriptiva numrica calculada a partir de datos de una muestra. Un Parmetro es una medida descriptiva numrica que usa la totalidad de las unidades de una poblacin.

20

Apunte 1 de Estadstica para la carrera Ingeniera en Construccin Profesor: Jorge Gmez M.

6. Medidas de Posicin: Percentiles, Deciles y Cuartiles Cada una de las medidas presentadas anteriormente nos permiten describir ciertas caractersticas de una variable X. Sin embargo, en algunas circunstancias puede ser til usar otras medidas descriptivas que puedan dar mayor utilizacin prctica para exponer un conjunto de datos. Por ejemplo, una persona encargada de solicitar personal para una empresa X, que est de visita en la UBB, puede tener inters en algo ms que la nota promedio o mediana de los alumnos de ltimo ao, a esta persona le puede interesar el promedio de los alumnos de ltimo ao que estn en el 10% o en el 20% superior de su clase, y as sucesivamente. En este caso los percentiles, deciles y cuartiles juegan un rol muy importante cuando se necesita dividir un conjunto de datos en determinados nmero de grupos, de modo que cada uno de ellos contenga el mismo nmero de valores. Cuando se divide el conjunto de datos ordenado en cuatro partes iguales, los puntos de divisin se conocen como cuartiles. El primer cuartil ( q 1 ), es un valor que tiene aproximadamente la cuarta parte (25%) de las observaciones por debajo de l, y el 75% restante, por encima de l. El segundo cuartil ( q 2 ), tiene aproximadamente la mitad (50%) de las observaciones por debajo de l. El segundo cuartil es exactamente igual a la mediana. El tercer cuartil ( q 3 ), tiene aproximadamente las tres cuartas partes (75%) de las observaciones por debajo de l, y el 25% restante, por encima de l. Por simplicidad, si ms de una observacin satisface la definicin de un cuartil, entonces se utiliza el promedio de ellas como cuartil. 1/4 1/4 (25%) (25%) 25% q 1 q 50% 75% 1/4 1/4 (25%) (25%) 75% 50% q 3 25%

Ejemplo 16: A continuacin se presentan 20 observaciones en orden del tiempo de falla, en horas, de un material aislante elctrico:
1 2 3 4 5 6 7 8 9 10

204
11

228
12

252
13

300
14

324
15

444
16

624
17

720
18

816
19

912
20

1176

1296

1392

1488

1512

2520

2856

3192

3528

3710

21

Apunte 1 de Estadstica para la carrera Ingeniera en Construccin Profesor: Jorge Gmez M.

Solucin: Antes de calcular los cuartiles primero determinemos las partes: 2 /0 4 = 5 es la cuarta parte o 25% de las observaciones, el 50% son 10 observaciones y el 75% son 15 observaciones. El primer cuartil ( q 1 ) de este conjunto de datos es: La posicin del primer cuartil se encuentra entre la quinta y sexta observacin. Es decir:
1 2 3 4 5 6 7 8 9 10

204
11

228
12

252
13

300
14

324
15

444
16

624
17

720
18

816
19

912
20

1176

1296

1392

1488 q1 =

1512 (3 2+ 4 2

2520 4) 4 = 3 8

2856 4

3192

3528

3710

Interpretacin: Aproximadamente el 25% de las observaciones tienen un tiempo inferior a 384 horas, y el 75% restante, superior a este valor. El tercer cuartil ( q 3 ) de este conjunto de datos es: La posicin del tercer cuartil se encuentra entre la observacin 15 y 16. Es decir:
1 2 3 4 5 6 7 8 9 10

204
11

228
12

252
13

300
14

324
15

444
16

624
17

720
18

816
19

912
20

1176

1296

1392

1488 q =

1512 (1

2520

2856 1 6

3192

3528

3710

5 +1 2 2 5 ) 2 0 = 2 0 2

Interpretacin: Aproximadamente el 75% de las observaciones tienen un tiempo inferior a 2016 horas, y el 25% restante, superior a este valor. Los percentiles dividen al conjunto de datos ordenado en 100 partes iguales, donde cada una equivale al 1% del total. Por ejemplo, el percentil 90 es un valor tal que el 90% de todos los valores son menores y el 10% son mayores que l. As, de un estudiante que tiene calificaciones mayores al 95% y menores al 5% de todos los estudiantes, se dice que est en el percentil 95. Los deciles dividen al conjunto de datos ordenado en 10 partes iguales, cada una representa el 10% del total. El quinto decil es equivalente a la mediana. Por ejemplo, el primer decil es un valor tal que el 10% de todos los valores son menores, y el 90% restante, son mayores l.

22

Apunte 1 de Estadstica para la carrera Ingeniera en Construccin Profesor: Jorge Gmez M.

7. DATOS AGRUPADOS3 Utilizaremos el siguiente ejemplo para mostrar las formas de clculo: Ejemplo: Los siguientes datos representan las duraciones, en aos, de 40 bateras de automviles similares. Las bateras estaban garantizadas para durar tres aos. Construyamos una tabla de frecuencias para lo siguientes datos:
2.2 3. 2.5 3.3 4. 4. 1.6 4. 3.1 3.8 3.5 3.1 3. 3.7 3.2 4. 3.3 3.6 4. 4 7 1 3 4 5 4 3.2 3.8 2.9 3.2 3.9 3.7 3.1 3.3 4. 3.0 3.0 4. 3.9 1.9 4.2 2.6 3.7 3.1 3. 1 7 4 2.6 3.5

La tabla de frecuencias de estos datos es (con k = 7 y A = 0.5):


Intervalos de clase [1.6 2.0] [2.1 2.5] [2.6 3.0] [3.1 3.5] [3.6 4.0] [4.1 4.5] [4.6 5.0]

Lmites Exactos
[1.55 2.05] [2.05 2.55] [2.55 3.05] [3.05 3.55] [3.55 4.05] [4.05 4.55] [4.55 5.05]

Marca de Clase ( m i )
1.8 2.3 2.8 3.3 3.8 4.3 4.8

ni
2 2 5 15 8 6 2 n = 40

fi
0.05 0.05 0.125 0.375 0.2 0.15 0.05 1.0

Fi
0.05 0.1 0.225 0.6 0.8 0.95 1

2 4 9 24 32 38 40

7.1. MEDIDAS DE TENDENCIA CENTRAL

Moda (Mo)
Cuando se trata de datos agrupados para hallar la moda debemos determinar antes que todo la clase modal en la cual se halla sta. La clase modal corresponde a aquella clase que presente mayor frecuencia absoluta. Una vez localizada la clase modal, procedemos por interpolacin para determinarla. Esta interpolacin nos conduce a la siguiente frmula para la moda: M o = dL m a + d1 d1 + d A
2

donde: Lm = Lmite Exacto inferior de la clase modal (la clase de mayor frecuencia absoluta) d1 = Diferencia entre la frecuencia absoluta de la clase modal y la de la clase que la antecede d2 = Diferencia entre la frecuencia absoluta de la clase modal y la de la clase que le sigue A = Amplitud del intervalo
3

Datos agrupados en intervalos de clase.

23

Apunte 1 de Estadstica para la carrera Ingeniera en Construccin Profesor: Jorge Gmez M.

Para nuestro ejemplo la moda se calcula como: La clase modal corresponde a la cuarta clase (o cuarto intervalo de clase), ya que la frecuencia absoluta es 15 y es mayor que el resto. De aqu podemos obtener lo siguiente: L
m

= 3 . 0 , 5 d 1 = 1 5 5 = 1 , 0 d

= 1 5 8 = 7

A = 0 .5

De esta manera la moda es: M o = d3 . 0 a +5 0 0 .5 = 3 . 3 1 +0 7 1 4

Interpretacin: La duracin de las bateras mas frecuente en los automviles es de aproximadamente 3.3 aos.

Mediana (Me)
Cuando se trata de datos agrupados, la mediana se obtiene mediante interpolacin. La interpolacin se basa en el supuesto de que los datos en cada intervalo estn igualmente distribuidos. Para ilustrar el mtodo, vamos ocupar el ejemplo para determinar la mediana. Pasos: 1er Paso: Determinar la clase mediana, que es aquella en donde est situada la mediana. Esta se halla al efectuar el cuociente n/2. 2do Paso: Ubicar la clase mediana, que es donde la frecuencia absoluta acumulada es igual o superior a n/2. 3er Paso: Una vez hallada la clase mediana, determinamos la mediana como sigue: n N 2 e d = i L a m +n a nm

m 1

donde: Lm = Lmite Exacto inferior de la clase mediana n = Nmero de datos N m 1 = Frecuencia Absoluta Acumulada de la clase que antecede a la clase mediana nm = Frecuencia Absoluta de la clase mediana A = Amplitud del intervalo

24

Apunte 1 de Estadstica para la carrera Ingeniera en Construccin Profesor: Jorge Gmez M.

Para nuestro ejemplo la mediana se calcula como: n 4 0 = = 2 .0 Esto quiere decir que la clase mediana corresponde a la cuarta clase (o cuarto 2 2 intervalo), ya que la frecuencia absoluta acumulada es 24. De aqu podemos obtener lo siguiente: L = 3 .0 , 5 n = 2 ,0 N 2
m 1

= 9,

= 1

5 y

A = 0 .5

De esta manera la mediana es: 4 0 9 2 e d = i 3 a. 0 n+5 a 0 .5 = 3 . 4 1 5

Interpretacin: Aproximadamente el 50% de las bateras de los automviles tienen una duracin por debajo de 3.4 aos, y el 50% restante, superior a este valor.

Media aritmtica ( x )
Cuando se trata de datos agrupados en intervalos (tablas de frecuencias) la media est dada por:

x =

n 1 m 1 + n 2 m

+ n 3 m 3 + . . .+ n k m n

i=1

ni m n

donde n 1 , n 2 , n 3 , . . . , n k son las frecuencias absolutas de las clases y m 1 , m 2 , m 3 , . . . , m k son las marcas de clase y por ltimo n es el nmero de datos. Para nuestro ejemplo, la media es: + n 3 m 3 + . . .+ n 7 m 7 = 4 0 2 1 . 8 + 2 2 . 3 + 5 2 . 8 + 1 5 3 . 3 + 8 3 . 8 + 6 4 . 3 + 2 4 . 8 1 3 . 5 7 x = = = 3 .4 4 0 4 0 x =
2

n1 m 1 + n2 m

Interpretacin: El promedio de duracin de las bateras de los automviles es de aproximadamente 3.4 aos.

25

Apunte 1 de Estadstica para la carrera Ingeniera en Construccin Profesor: Jorge Gmez M.

7.2. MEDIDAS DE DISPERSIN

Varianza y Desviacin Estndar


Para datos agrupados la varianza muestral y desviacin estndar muestral se calcula como:

i=1

n i (m i x n 1 n i (m i x n 1

) )

S =

i=1

donde n 1 , n 2 , n 3 , . . . , n k son las frecuencias absolutas de las clases y m 1 , m 2 , m 3 , . . . , m k son las marcas de clase y por ltimo n es el nmero de datos. Importante: Cuando estamos interesados en obtener la varianza y la desviacin estndar de una poblacin, para datos agrupados, ocupamos las siguientes frmulas:

V (X ) =

i=1

n i (m i x N

i=1

n i (m i x N

donde n 1 , n 2 , n 3 , . . . , n k son las frecuencias absolutas de las clases y m 1 , m 2 , m 3 , . . . , m k son las marcas de clase y por ltimo N es el nmero de datos. Para nuestro ejemplo sera lo siguiente:

S S S

i=1

n i (m i x

2 2

n 1 2 2 2 2 2 2 2 2 ( 1 . 8 3 . 4 ) 4 + 2 ( 2 . 3 3 . 4 ) 4 + 5 ( 2 . 8 3 . 4 ) 4 + 1 5 ( 3 . 3 3 . 4 ) 4 + 8 ( 3 . 8 3 . 4 ) 4 + 6 ( 4 . 3 3 . 4 ) 4 + 2 ( 4 . 8 3 . 4 ) 4 = 3 9 = 0 .4 9 9 0 .4 9 = 90 . 7 0 7

S =

Interpretacin: La variacin de las duraciones de las bateras de los automviles es de aproximadamente 0.71 aos, con respecto a su media.

26

Apunte 1 de Estadstica para la carrera Ingeniera en Construccin Profesor: Jorge Gmez M.

7.3. MEDIDAS DE POSICIN

Cuartiles
Pasos: 1er Paso: Determinar la clase del cuartil k, que es aquella en donde se sita el cuartil k. Esta n se halla al efectuar el producto k . 4 2do Paso: Ubicar la clase del cuartil k, que es donde la frecuencia absoluta acumulada es n igual o superior a k . 4 3er Paso: Una vez hallada la clase del cuartil k, determinamos el cuartil k como sigue: C u ak = r L tk i+ l k

( n4 )
n
k

A,

k = 1 ,2 .3

donde: Lk = Lmite Exacto inferior de la clase del cuartil k (se determina de manera similar que en el caso de la mediana) n = Nmero de datos N k = Frecuencia Absoluta Acumulada de la clase que antecede a la clase del cuartil k nk = Frecuencia Absoluta de la clase del cuartil k A = Amplitud del intervalo Para nuestro ejemplo el cuartil 1 est dado por: n 4 0 k = 1 = 1 .0 Esto quiere decir que la clase del cuartil 1 corresponde a la cuarta 4 4 clase (o cuarto intervalo), ya que la frecuencia absoluta acumulada es 24. De aqu podemos obtener lo siguiente: n L 1 = 3 . 0 , 5 k = 1 , 0 N 1 = 9 , n 1 = 1 5 y A = 0 .5 4 De esta manera el cuartil 1 es: 1 0 9 0 .5 = 3 . 0 8 3 1 5 Interpretacin: Aproximadamente el 25% de las bateras de los automviles tienen una duracin por debajo de 3 aos, y el 75% restante, superior a este valor. C u
1

a = r 3 . 0t i +5 l

Ejercicio: Calcular Cuartil 2 y 3.

27

Apunte 1 de Estadstica para la carrera Ingeniera en Construccin Profesor: Jorge Gmez M.

Deciles
Pasos: 1er Paso: Determinar la clase del decil k, que es aquella en donde se sita el decil k. Esta se n halla al efectuar el producto k . 1 0 2do Paso: Ubicar la clase del decil k, que es donde la frecuencia absoluta acumulada es igual n o superior a k . 1 0 3er Paso: Una vez hallada la clase del decil k, determinamos el decil k como sigue: D e k c= Li k l + k

( 1n )0
n
k

A,

k = 1 , 2 .3 , . . . , 9

donde: Lk = Lmite Exacto inferior de la clase del decil k n = Nmero de datos N k = Frecuencia Absoluta Acumulada de la clase que antecede a la clase del decil k nk = Frecuencia Absoluta de la clase del decil k A = Amplitud del intervalo Para nuestro ejemplo el decil 7 est dado por: n 4 0 k = 7 = 2 .8 Esto quiere decir que la clase del decil 7 corresponde a la quinta 1 0 1 0 clase (o quinto intervalo), ya que la frecuencia absoluta acumulada es 32. De aqu podemos obtener lo siguiente: L n = 3 .5 , 5 k = 2 , 8 N 1 0 = 2 ,4 n = 8 y A = 0 .5

De esta manera el decil 7 es: D e 7 c= 3 i . 5 l +5 2 8 2 8 4 0 .5 = 3 .8 4

Interpretacin: Aproximadamente el 70% de las bateras de los automviles tienen una duracin por debajo de 4 aos, y el 30% restante, superior a este valor. Ejercicio: Calcular Decil 9.

28

Apunte 1 de Estadstica para la carrera Ingeniera en Construccin Profesor: Jorge Gmez M.

Percentiles
Pasos: 1er Paso: Determinar la clase del percentil k, que es aquella en donde se sita el percentil k. n . Esta se halla al efectuar el producto k 1 0 0 2do Paso: Ubicar la clase del percentil k, que es donde la frecuencia absoluta acumulada es n . igual o superior a k 1 0 0 3er Paso: Una vez hallada la clase del percentil k, determinamos el percentil k como sigue: P k e r ck =e L nk + t i l

( 1 n 0 ) 0
n
k

A,

k = 1 , 2 .3 , . . . , 9

donde: Lk = Lmite Exacto inferior de la clase del percentil k n = Nmero de datos N k = Frecuencia Absoluta Acumulada de la clase que antecede a la clase del percentil k nk = Frecuencia Absoluta de la clase del percentil k A = Amplitud del intervalo Para nuestro ejemplo el percentil 80 est dado por: n 4 0 k = 8 0 = 3 .2 Esto quiere decir que la clase del percentil 80 corresponde a 1 0 0 1 0 0 la quinta clase (o quinto intervalo), ya que la frecuencia absoluta acumulada es 32. De aqu podemos obtener lo siguiente: n L 8 0 = 3 .5 , 5 k = 3 , 2 N 1 0 De esta manera el percentil 80 es: P 3 2 2 e r c8 0 e= 3 n. 5 t +5 i l 8 4 0 .5 = 4 . 0 4 5 = 2 ,4 n 8 0= 8 y A = 0 .5

Interpretacin: Aproximadamente el 80% de las bateras de los automviles tienen una duracin por debajo de 4 aos, y el 20% restante, superior a este valor. Ejercicio: Calcular el Percentil 70.

29

You might also like