You are on page 1of 26

ULARE

Est.Tom.Dec.
Apunte I

Introduccin.
La Estadstica y su papel en el conocimiento.
Como la mayora de nosotros sabemos, el papel ms destacado de la Estadstica es la
recopilacin, presentacin, anlisis y uso de datos, a partir de los cuales podemos
obtener
conclusiones y tomar decisiones.
En este sentido, el conocimiento de la Estadstica puede resultar de gran utilidad en
cualquier campo y en particular en la Ingeniera.
Por ejemplo, en el diseo, desarrollo y mejora de los procesos de produccin (control de
la variabilidad en el proceso, control de la calidad, etc...).
Otros mbitos de aplicacin podran ser: el estudio de materiales (duracin, dureza,
elasticidad, etc...), anlisis de rendimientos en procesos qumicos segn su empleo de
catalizadores, anlisis de procesos hidrolgicos (clculo de avenidas, caudales
generados por cuencas hidrogrficas, etc...), anlisis de dimensionamiento de
estructuras y obras basados en el anlisis de riesgo, etc...
La asignatura de Mtodos Estadsticos en la Ingeniera persigue ensear a los alumnos
las herramientas estadsticas bsicas que le puedan ser de utilidad en sus futuros
ejercicios
profesionales.
La asignatura consta de tres partes: Estadstica Descriptiva, Probabilidad e Inferencia
Estadstica.
La Estadstica Descriptiva se encarga de resumir (grfica y numricamente)
la informacin contenida en un conjunto de datos, destacando sus rasgos ms
relevantes.
La Inferencia Estadstica permite obtener conclusiones y tomar decisiones en una
poblacin (no
observable completamente) analizando solamente una parte representativa de ella a la
que llamamos muestra.
La Probabilidad sirve de puente entre ambas ramas, que constituye la base
terica para poder hacer inferencias en la poblacin a partir de lo observado y crear
modelos
para problemas concretos.

Profesor: Ricardo Zapata C.

ULARE
Est.Tom.Dec.
Apunte I

Resumen:
Distribuciones Unidimensionales:
1. Introduccin.
2. Poblacin, elementos y caracteres.
3. Variables y atributos.

Introduccin:
La palabra "estadstica" suele utilizarse bajo dos significados distintos, a saber:
1 Como coleccin de datos numricos.- Esto es el significado ms vulgar de la palabra estadstica. Se
sobrentiende que dichos datos numricos han de estar presentados de manera ordenada y sistemtica. Una
informacin numrica cualquiera puede no constituir una estadstica, para merecer este apelativo, los datos
han de constituir un conjunto coherente, establecido de forma sistemtica y siguiendo un criterio de
ordenacin.
Tenemos muchos ejemplos de este tipo de estadsticas. El Anuario Estadstico publicado por el Instituto
Nacional de Estadstica, El Anuario de Estadsticas del Trabajo,
2 Como ciencia.- En este significado, La Estadstica estudia el comportamiento de los fenmenos de masas.
Como todas las ciencias, busca las caractersticas generales de un colectivo y prescinde de las particulares de
cada elemento. As por ejemplo al investigar el sexo de los nacimientos, iniciaremos el trabajo tomando un
grupo numeroso de nacimientos y obtener despus la proporcin de varones. Es muy frecuente enfrentarnos
con fenmenos en los que es muy difcil predecir el resultado; as, no podemos dar una lista ,con las personas
que van a morir con una cierta edad, o el sexo de un nuevo ser hasta que transcurra un determinado tiempo de
embarazo,
Por tanto, el objetivo de la estadstica es hallar las regularidades que se encuentran en los fenmenos de masa.

Poblacin, elementos y caracteres.


Es obvio que todo estudio estadstico ha de estar referido a un conjunto o coleccin de personas o cosas. Este
conjunto de personas o cosas es lo que denominaremos poblacin.

Profesor: Ricardo Zapata C.

ULARE
Est.Tom.Dec.
Apunte I

Las personas o cosas que forman parte de la poblacin se denominan elementos. En sentido estadstico un
elemento puede ser algo con existencia real, como un automvil o una casa, o algo ms abstracto como la
temperatura, un voto, o un intervalo de tiempo.
A su vez, cada elemento de la poblacin tiene una serie de caractersticas que pueden ser objeto del estudio
estadstico. As por ejemplo si consideramos como elemento a una persona, podemos distinguir en ella los
siguientes caracteres:
Sexo, Edad, Nivel de estudios, Profesin, Peso, Altura, Color de pelo,Etc.
Luego por tanto de cada elemento de la poblacin podremos estudiar uno o ms aspectos cualidades o
caracteres.
La poblacin puede ser segn su tamao de dos tipos:
Poblacin finita: cuando el nmero de elementos que la forman es finito, por ejemplo el nmero de
alumnos de un centro de enseanza, o grupo clase.
Poblacin infinita: cuando el nmero de elementos que la forman es infinito, o tan grande que
pudiesen considerarse infinitos.. Como por ejemplo si se realizase un estudio sobre los productos que
hay en el mercado. Hay tantos y de tantas calidades que esta poblacin podra considerarse infinita.
Ahora bien, normalmente en un estudio estadstico, no se puede trabajar con todos los elementos de la
poblacin sino que se realiza sobre un subconjunto de la misma. Este subconjunto puede ser una muestra,
cuando se toman un determinado nmero de elementos de la poblacin, sin que en principio tengan nada en
comn; o una subpoblacin, que es el subconjunto de la poblacin formado por los elementos de la poblacin
que comparten una determinada caracterstica, por ejemplo de los alumnos del centro la subpoblacin
formada por los alumnos de 3 ESO, o la subpoblacin de los varones.

Variables y atributos.
Como hemos visto, los caracteres de un elemento pueden ser de muy diversos tipos, por lo que los podemos
clasificar en: dos grandes clases:
Variables Cuantitativas.
Variables Cualitativas o Atributos.
Las variables cuantitativas son las que se describen por medio de nmeros, como por ejemplo el peso, Altura,
Edad, Nmero de Suspensos
A su vez este tipo de variables se puede dividir en dos subclases:

Cuantitativas discretas. Aquellas a las que se les puede asociar un nmero


entero, es decir, aquellas que por su naturaleza no admiten un fraccionamiento
de la unidad, por ejemplo nmero de hermanos, pginas de un libro, etc.

Profesor: Ricardo Zapata C.

ULARE
Est.Tom.Dec.
Apunte I

Cuantitativas continuas: Aquellas que no se pueden expresar mediante un


nmero entero, es decir, aquellas que por su naturaleza admiten que entre dos
valores cualesquiera la variable pueda tomar cualquier valor intermedio, por
ejemplo peso, tiempo. etc.

No obstante en muchos casos el tratamiento estadstico hace que a variables discretas las trabajemos como si
fuesen continuas y viceversa.
Los atributos son aquellos caracteres que para su definicin precisan de palabras, es decir, no le podemos
asignar un nmero. Por ejemplo Sexo Profesin, Estado Civil, etc.
A su vez las podemos clasificar en:

Ordenables: Aquellas que sugieren una ordenacin, por ejemplo la graduacin


militar, El nivel de estudios, etc.

No ordenables: Aquellas que slo admiten una mera ordenacin alfabtica,


pero no establece orden por su naturaleza, por ejemplo el color de pelo, sexo,
estado civil, etc.

Tablas Estadsticas:
A partir de este momento nos vamos a ocupar de las estadsticas de una sola variable, "Estadsticas
Unidimensionales".

Las tablas estadsticas segn el nmero de observaciones y segn el recorrido de la variable


estadstica, as tenemos los siguientes tipos de tablas estadsticas:
Tablas tipo I:
Cuando el tamao de la muestra y el recorrido de la variable son pequeos, por ejemplo si tenemos una
muestra de las edades de 5 personas, por lo que no hay que hacer nada especial simplemente anotarlas de
manera ordenada en filas o columnas.
Edad de los 5 miembros de una familia:
5, 8, 16, 38, 45

Tablas tipo II:


Cuando el tamao de la muestra es grande y el recorrido de la variable es pequeo, por lo que hay valores de
la variable que se repiten. Por ejemplo, si preguntamos el nmero de personas activas que hay en 50 familias
obtenemos la siguiente tabla:
Profesor: Ricardo Zapata C.

ULARE
Est.Tom.Dec.
Apunte I

Personas Activas en 50 familias


2

Podemos observar que la variable toma valores comprendidos entre 1 y 4, por lo que precisaremos una tabla
en la que resumamos estos datos quedando la siguiente tabla:
Personas Activas

Nmero de Familias

16

20

Total

50

Tablas tipo III:


Cuando el tamao de la muestra y el recorrido de la variable son grandes, por lo que ser necesario agrupar en
intervalos los valores de la variable. Por ejemplo si a un grupo de 30 alumnos les preguntamos el dinero que
en ese momento llevan encima, nos encontramos con los siguientes datos:

450

1152

250

300

175

80

25

2680

605

785

1595

2300

5000

1200

100

180

200

675

500

375

1500

205

985

185

125

315

425

560

1100

Profesor: Ricardo Zapata C.

ULARE
Est.Tom.Dec.
Apunte I

Evidentemente, la variable estadstica tiene un recorrido muy grande, 4998 pesetas, por lo que s queremos
hacer una tabla con estos datos tendremos que tomar intervalos. Para decidir la amplitud de los intervalos,
necesitaremos decidir cuntos intervalos queremos?. Normalmente se suele trabajar con no ms de 10 o 12
intervalos.
Amplitud =4998/10 = 499,8 Por lo que tomaremos intervalos de amplitud 500
Debemos tener en cuenta las siguientes consideraciones:
Tomar pocos intervalos implica que la "prdida de informacin" sea mayor.
Los intervalos sern siempre Cerrados por la izquierda y Abiertos por la Derecha [ Li-1 , Li )
Procuraremos que en la decisin de intervalos los valores observados no coincidan con los valores de los
extremos del intervalo y si esto ocurre que no sea en ms de un 5% del total de observaciones.
Con estas recomendaciones tendremos la siguiente tabla:

Profesor: Ricardo Zapata C.

[ Li-1 , Li )

Frecuencia

[ 0,500)

16

[ 500, 1000)

[ 1000,1500)

[ 1500, 2000)

[ 2000, 2500)

[ 2500, 3000)

[ 3000, 3500)

[ 3500, 4000)

[ 4000, 4500)

ULARE
Est.Tom.Dec.
Apunte I

[ 4500, 5000)

[ 5000,5500)

1.3. Tcnicas de recuento.


Aunque hoy en da, si se realiza un estudio estadstico importante esta tarea la realiza el ordenador, ya sea por
medio de programas de estadstica especficos BMDP, SPSS, o bien utilizando herramientas informticas de
propsito general como Bases de Datos u Hojas de Clculo
A lo largo del curso, veremos como mediante hojas de clculo o bases de datos podemos realizar este
recuento.
Veamos como realizaramos este proceso manualmente, para ello veremos diversas tcnicas de ir anotando:

Aunque el mtodo ms utilizado o conocido sea el primero, quizs el ms cmodo de utilizar es el 2 en la


mayora de los casos.

Distintos Tipos de Frecuencia:


Una de los primeros pasos que se realizan en cualquier estudio estadstico es la tabulacin de resultados, es
decir, recoger la informacin de la muestra resumida en una tabla en la que a cada valor de la variable se le
asocian determinados nmeros que representan el nmero de veces que ha aparecido, su proporcin con
respecto a otros valores de la variable, etc. Estos nmeros se denominan frecuencias: As tenemos los
siguientes tipos de frecuencia:
1. Frecuencia absoluta
2. Frecuencia relativa
3. Porcentaje
4. Frecuencia absoluta acumulada

Profesor: Ricardo Zapata C.

ULARE
Est.Tom.Dec.
Apunte I

5. Frecuencia relativa acumulada


6. Porcentaje acumulado
7. Ejemplo

Frecuencia absoluta:
La frecuencia absoluta de una variable estadstica es el nmero de veces que aparece en la muestra dicho
valor de la variable, la representaremos por ni

Frecuencia relativa:
La frecuencia absoluta, es una medida que est influida por el tamao de la muestra, al aumentar el tamao de
la muestra aumentar tambin el tamao de la frecuencia absoluta. Esto hace que no sea una medida til para
poder comparar. Para esto es necesario introducir el concepto de frecuencia relativa, que es el cociente entre
la frecuencia absoluta y el tamao de la muestra. La denotaremos por fi

Donde N = Tamao de la muestra

Porcentaje:
La frecuencia relativa es un tanto por uno, sin embargo, hoy da es bastante frecuente hablar siempre en
trminos de tantos por ciento o porcentajes, por lo que esta medida resulta de multiplicar la frecuencia
relativa por 100. La denotaremos por pi.

Frecuencia Absoluta Acunulada:


Para poder calcular este tipo de frecuencias hay que tener en cuenta que la variable estadstica ha de ser
cuantitativa o cualitativa ordenable. En otro caso no tiene mucho sentido el clculo de esta frecuencia. La
frecuencia absoluta acumulada de un valor de la variable, es el nmero de veces que ha aparecido en la
muestra un valor menor o igual que el de la variable y lo representaremos por Ni.
Profesor: Ricardo Zapata C.

ULARE
Est.Tom.Dec.
Apunte I

Frecuencia Relativa Acunulada:


Al igual que en el caso anterior la frecuencia relativa acumulada es la frecuencia absoluta acumulada dividido
por el tamao de la muestra, y la denotaremos por Fi

Porcentaje Acumulado:
Anlogamente se define el Porcentaje Acumulado y lo vamos a denotar por Pi como la frecuencia relativa
acumulada por 100.

Veamos esto con un ejemplo: Tomamos para ello los datos relativos a las personas activas.
Personas Activas

Nmero Familias

Xi

ni

Fi

pi

Ni

Fi

Pi

16

16/50

32%

16

16/50

32%

20

20/50

40%

36

36/50

72%

9/50

18%

45

45/50

90%

5/50

10%

50

50/50

100%

Total

50

En este ejemplo se puede ver fcilmente como se calculan estas frecuencias

Medidas Estadsticas:
1. Introduccin.
2. Tipos de Medida
3. Algunas consideraciones

INTRODUCCIN:
Profesor: Ricardo Zapata C.

ULARE
Est.Tom.Dec.
Apunte I

En el resto del tema nos ocuparemos exclusivamente de las variable cuantitativas, puesto que con los
atributos no se pueden realizar operaciones aritmticas. Como hemos estudiado, las variables estadsticas
cuantitativas se dividen o clasifican en discretas o continuas, por lo que necesitaremos precisar cmo se
calculan dichas medidas en cada caso.
En las variables cuantitativas continuas, dado que la tabulacin de los datos se hace mediante intervalos,
necesitaremos tomar un valor del intervalo para poder operar. Este valor se denomina marca de clase y es el
53-1-u-punto medio del intervalo.
Las medidas estadsticas pretenden "resumir" la informacin de la "muestra" para poder tener as un mejor
conocimiento de la poblacin. Se clasifican en:

TIPOS DE MEDIDA:
1. Medidas de Centralizacin:
o

Que sirven para determinar los valores centrales o medios de la


dsitribucin

2. Medidas de Dispersin:
o

Nos van a dar una idea sobre la representatividad de las medidas


centrales, a mayor dispersin menor representatividad.

3. Medidas de Localizacin:
o

tiles para encontrar determinados valores importantes, para una


"clasificacin" de los elementos de la muestra o poblacin.

4. Medidas de la Simetra:
o

Sirven para ver si la distribucin tiene el mismo comportamiento por


encima y por debajo de los valores centrales.

5. Ejemplo del clculo de los coeficientes de simetra y Curtsis

Medidas de Centralizacin:
1. Media

1. Media aritmtica
2. Media geomtica
3. Media armnica
2. Mediana

Profesor: Ricardo Zapata C.

10

ULARE
Est.Tom.Dec.
Apunte I

1. Variable discreta.
2. Variable contnua.
3. Moda

1. Variable discreta.
2. Variable contnua.

MEDIA: Vamos a estudiar en este apartado los distintos tipos de media que hemos detallado en el apartado
anterior

Media aritmtica:
La media aritmtica de una variable se define como la suma ponderada de los valores de la variable por sus
frecuencias relativas y lo denotaremos por

y se calcula mediante la expresin:

xi representa el valor de la variable o en su caso la marca de clase.

Propiedades:
1. Si multiplicamos o dividimos todas las observaciones por un mismo nmero, la
media queda multiplicada o dividida por dicho numero.
2. Si le sumamos a todas las observaciones un mismo nmero, la media
aumentar en dicha cantidad.
3. Adems de la media aritmtica existen otros conceptos de media, como son la
media geomtrica y la media armnica.

Media geomtrica: La media geomtrica de N observaciones es la raz de ndice N del producto de


todas las observaciones. La representaremos por G.

Solo se puede calcular si no hay observaciones negativas. Es una medida estadstica poco o nada usual.

Profesor: Ricardo Zapata C.

11

ULARE
Est.Tom.Dec.
Apunte I

Media armnica: La media armnica de N observaciones es la inversa de la media de las inversas de las
observaciones y la denotaremos por H

Al igual que en el caso de la media geomtrica su utilizacin es bastante poco frecuente.

Mediana: La mediana es el valor central de la variable, es decir, supuesta la muestra ordenada en orden
creciente o decreciente, el valor que divide en dos partes la muestra. Para calcular la mediana debemos tener
en cuenta si la variable es discreta o continua.
Clculo de la mediana en el caso discreto:
Tendremos en cuenta el tamao de la muestra.

Si N es Impar, hay un trmino central, el trmino

que ser el valor de la mediana.

Si N es Par, hay dos trminos centrales,

la mediana ser la media de esos dos valores

Veamos un ejemplo.
N parN Impar

1,4,6,7,8,9,12,16,20, 24,25,27 N=12

1,4,6,7,8,9,12,16,20, 24,25,27,30 N=13

Trminos Centrales el 6 y 7 9 y 12

Trmino Central el 7 , 12
Me=12

Me=

Clculo de la mediana en el caso continuo:


Profesor: Ricardo Zapata C.

12

ULARE
Est.Tom.Dec.
Apunte I

Si la variable es continua, la tabla vendr en intervalos, por lo que se calcula de la siguiente forma:
Nos vamos a apoyar en un grfico de un histograma de frecuencias acumuladas.

De donde la mediana vale:


intervalo

donde ai es la amplitud del

Vemoslo por medio de un ejemplo.


Supongamos los pesos de un grupo de 50 personas se distribuyen de la siguiente forma:
Li-1

Li

ni

Ni

45

55

55

65

10

16

65

75

19

35

75

85

11

46

85

95

50

Como el tamao de la muestra es N=50, buscamos el intervalo en el que la Frecuencia


acumulada es mayor que 50/2=25, que en este caso es el 3 y aplicamos la frmula
anterior. Luego la Mediana ser

Profesor: Ricardo Zapata C.

Me=

13

ULARE
Est.Tom.Dec.
Apunte I

MODA: La moda es el valor de la variable que tenga mayor frecuencia absoluta, la que ms se repite, es la
nica medida de centralizacin que tiene sentido estudiar en una variable cualitativa, pues no precisa la
realizacin de ningn clculo.
Por su propia definicin, la moda no es nica, pues puede haber dos o ms valores de la variable que tengan la
misma frecuencia siendo esta mxima. En cuyo caso tendremos una distribucin bimodal o polimodal segn
el caso.
Por lo tanto el clculo de la moda en distribuciones discretas o cualitativas no precisa de una explicacin
mayor; sin embargo, debemos detenernos un poco en el clculo de la moda para distribuciones cuantitativas
continuas.

Apoyndonos en el grfico podemos llegar a la determinacin de la expresin para la Moda que es:

Otros autores dan una expresin aproximada para la moda que viene dada por la siguiente expresin:

Veamos su clculo mediante un ejemplo, para ello usaremos los datos del apartado anterior
Li-1

Li

ni

Ni

45

55

Profesor: Ricardo Zapata C.

14

ULARE
Est.Tom.Dec.
Apunte I

55

65

10

16

65

75

19

35
Utilizando la frmula aproximada

75

85

11

46

85

95

50

MEDIDAS DE DISPERSIN:
1. Breve Introduccin
2. Rango
3. Concepto de desviacin
4. Desviacin Media
5. Varianza
6. Desviacin Tpica
7. Cuasivarianza
8. Cuasi Desviacin tpica
9. Coeficiente de Variacin
10. Ejemplo
Breve Introduccin
Hasta el momento hemos estudiado los valores centrales de la distribucin, pero tambin es importante
conocer si los valores en general estn cerca o alejados de estos valores centrales, es por lo que surge la
necesidad de estudiar medidas de dispersin.
Rango: Es la primera medida que vamos a estudiar, se define como la diferencia existente entre el valor
mayor y el menor de la distribucin,. Lo notaremos como R. Realmente no es una medida muy significativa e
la mayora de los casos, pero indudablemente es muy fcil de calcular.
Hemos estudiado varias medidas de centralizacin, por lo que podemos hablar de desviacin con respecto a
cualquiera de ellas, sin embargo, la mas utilizada es con respecto a la media.

Profesor: Ricardo Zapata C.

15

ULARE
Est.Tom.Dec.
Apunte I

Desviacin: Es la diferencia que se observa entre el valor de la variable y la media aritmtica. La


denotaremos por di .No es una medida, son muchas medidas, pues cada valor de la variable lleva asociada su
correspondiente desviacin, por lo que precisaremos una medida que resuma dicha informacin.
La primera solucin puede ser calcular la media de todas las desviaciones, es decir, si consideramos como
muestra la de todas las desviaciones y calculamos su media. Pero esta solucin es mala pues como veremos
siempre va a ser 0.

Luego por lo tanto esta primera idea no es valida, pues las desviaciones positivas se contrarrestan con las
negativas.
Para resolver este problema, tenemos dos caminos:

Tomar el valor absoluto de las desviaciones. Desviacin media

Elevar al cuadrado las desviaciones. Varianza.

Desviacin media:
Es la media de los valores absolutos de las desviaciones, y la denotaremos por dm.

Varianza: Es la media de los cuadrados de las desviaciones, y la denotaremos por

o tambin por

Aunque tambin es posible calcularlo como:

Profesor: Ricardo Zapata C.

16

ULARE
Est.Tom.Dec.
Apunte I

Este estadstico tiene el inconveniente de ser poco significativo, pues se mide en el cuadrado de la unidad de
la variable, por ejemplo, si la variable viene dada en cm. La varianza vendr en cm2.
Desviacin tpica:
Es la raz cuadrada de la varianza, se denota por Sx o x.

Este estadstico se mide en la misma unidad que la variable por lo que se puede interpretar mejor.
Otros dos estadsticos importantes son la cuasivarianza y la cuasidesviacin tpica, que como veremos cuando
estudiemos el tema de estimacin estadstica, son los estimadores de la varianza y desviacin tpica
poblacionales respectivamente.
Cuasivarianza:
Es una medida de dispersin, cuya nica diferencia con la varianza es que dividimos por N-1, la
representaremos por

y la calcularemos de la siguiente forma:

Cuasidesviacin tpica: La raz cuadrada de la cuasivarianza y la denotaremos por SN1 o N-1.

Todas estas medidas de dispersin vienen influidas por la unidad en la que se mide la variable, esto implica
que si cambiamos de unidad de medida, los valores de estos estadsticos se vean a su vez modificados.
Adems, no permite comparar por ejemplo, en un grupo de alumnos si los pesos o las alturas presentan mas
dispersin. Pues no es posible comparar unidades de distinto tipo.
Precisamos por lo tanto, una medida "escalar", es decir, que no lleve asociado ninguna unidad de medida.

Profesor: Ricardo Zapata C.

17

ULARE
Est.Tom.Dec.
Apunte I

Coeficiente de Variacin: Es un estadstico de dispersin que tiene la ventaja de que no lleva asociada
ninguna unidad, por lo que nos permitir decir entre dos muestras, cual es la que presenta mayor dispersin.
La denotaremos por C.V.

Ejemplo
Veamos por ltimo un ejemplo de cmo se calculan todas estas medidas.

45

55

50

300

-19,4

116,4

2258,16

15000

55

65

10

16

60

600

-9,4

94

883,6

36000

65

75

19

35

70

1330

0,6

11,4

6,84

93100

75

85

11

46

80

880

10,6

116,6

1235,96

70400

85

95

50

90

360

20,6

82,4

1697,44

32400

N=

50

420,8

6082

246900

Profesor: Ricardo Zapata C.

3470

18

ULARE
Est.Tom.Dec.
Apunte I

Dm=

C.V.=

Medidas de Localizacin: Cuartiles, Deciles y Percentiles.


Las medidas de localizacin dividen la distribucin en partes iguales, sirven para clasificar a un individuo o
elemento dentro de una determinada poblacin o muestra. As en psicologa los resultados de los test o
pruebas que realizan a un determinado individuo, sirve para clasificar a dicho sujeto en una determinada
categoria en funcin de la 53-1-u-puntuaciMn obtenida.

Profesor: Ricardo Zapata C.

19

ULARE
Est.Tom.Dec.
Apunte I

1. Cuartiles.
2. Deciles.
3. Percentiles.
4. Ejemplos de clculo.
5. Algunas medidas de dispersin asociadas

Cuarteles Medida de localizacin que divide la poblacin o muestra en cuatro partes iguales.

Q1= Valor de la variable que deja a la izquierda el 25% de la distribucin.

Q2= Valor de la variable que deja a la izquierda el 50% de la distribucin =


mediana.

Q3= Valor de la variable que deja a la izquierda el 75% de la distribucin.

Al igual que ocurre con el clculo de la mediana, el clculo de estos estadsticos, depende del tipo de variable.
Caso I: Variable cuantitativa discreta:
En este caso tendremos que observar el tamao de la muestra: N y para
calcular Q1 o Q3 procederemos como si tuvisemos que calcular la mediana de
la correspondiente mitad de la muestra.
Caso II: Variable cuantitativa continua:
En este caso el clculo es ms simple:, sea la distribucin que sigue:
[Li-2 -- Li-1)

ni-1

Ni-1

[Li-1 -- Li)

ni

Ni

Siendo el intervalo coloreado donde se encuentra el Cuartil


correspondiente:

Deciles Medida de localizacin que divide la poblacin o muestra en 10 partes iguales. No tiene mucho
sentido calcularlas para variables cualitativas discretas. Por lo que lo vamos a ver slo para las variables
continuas.
dk = Decil k-simo es aquel valor de la variable que deja a su izquierda el k10 % de la distribucin.
[Li-2 -- Li-1)

ni-1

[L
n
i-1 -- Li)
Profesor:
Ricardo Zapata C.i

Ni-1
Ni

20

ULARE
Est.Tom.Dec.
Apunte I

Intervalo donde se encuentra el Decil correspondiente:

k = 1 .. 9

Percentiles: Medida de localizacin que divide la poblacin o muestra en 100 partes iguales. No tiene
mucho sentido calcularlas para variables cualitativas discretas. Por lo que lo vamos a ver slo para las
variables continuas.
pk = Percentil k-simo es aquel valor de la variable que deja a su izquierda el k % de la distribucin.
[Li-2 -- Li-1)

ni-1

Ni-1

[Li-1 -- Li)

ni

Ni

Intervalo donde se encuentra el percentil corespondiente:

k=1 .. 99

EJEMPLO:Como se puede observar la forma de calcular estas medidas es muy similar a la del clculo de la
mediana.Veamos el clculo de algunas de estas medidas en el ejemplo que estamos estudiando.
Vamos a calcular Q1,Q3, d3, y p45
Li-1

Li

ni

Ni

45

55

55

65

10

16

65

75

19

35

75

85

11

46

85

95

50

Clculo de Q1: Buscamos en la columna de las frecuencias Acumuladas el valor que supere al 25% de N=50,
corresponde al 2 intervalo.(50/4=12.5)

Profesor: Ricardo Zapata C.

21

ULARE
Est.Tom.Dec.
Apunte I

Anlogamente calculemos Q3, Buscamos ahora en la misma columna el correspondiente al 75 %de N que en
este caso es el 4 intervalo (3.50/4=37.5)

Veamos ahora el decil 3. (corresponde al 30 % 3 50 / 10 = 15) sera el 2 intervalo.

Por ltimo veamos el percentil 45 (4550/100 = 22.5) Corresponde al intervalo 3.

Algunas medidas de Dispersin asociadas


Una vez estudiadas las medidas de localizacin surgen dos nuevas medidas de dispersin, que son:

Recorrido intercuartlico:

Semirecorrido intercuartlico:

Recorrido interdeclico:

Recorrido intercentilico:

Profesor: Ricardo Zapata C.

22

ULARE
Est.Tom.Dec.
Apunte I

Medidas de Simetra:

Las medidas de la asimetra, al igual que la curtosis, van a ser medidas de la forma de la distribucin,
es frecuente que los valores de una distribucin tiendan a ser similares a ambos lados de las medidas
de centralizacin. La simetra es importante para saber si los valores de la variable se concentran en
una determinada zona del recorrido de la variable.

As<0

As=0

As>0

Asimetra Negativa a la Izquierda

Simtrica

Asimetra Positiva a la Derecha.

Para medir la asimetra se puede realizar atendiendo bsicamente a dos criterios:

Comparando la Media y la Moda.

Comparando los valores de la variable con la media.

Comparando la Media y la Moda:

Si la diferencia
es positiva, diremos que hay asimetra positiva o a la derecha, en el caso de que
sea negativa diremos que hay asimetra negativa o a la izquierda. No obstante, esta medida es poco operativa

Profesor: Ricardo Zapata C.

23

ULARE
Est.Tom.Dec.
Apunte I

al no ser una medida relativa, ya que esta influida por la unidad en que se mida la variable, por lo que se
define el coeficiente de Asimetra como:

Esta medida es muy fcil de calcular, pero menos precisa que el coeficiente de asimetra de Pearson.
El coeficiente de asimetra de Pearson, se basa en la comparacin con la media de todos los valores de la
variable, as que es una medida que se basar en las diferencias
, como vimos en el caso de la
dispersin si medimos la media de esas desviaciones sera nulas, si las elevamos al cuadrado, seran siempre
positivas por lo que tampoco serviran, por lo tanto precisamos elevar esas diferencias al cubo.
Para evitar el problema de la unidad, y hacer que sea una medida escalar y por lo tanto relativa, dividimos por
el cubo de su desviacin tpica. Con lo que resulta la siguiente expresin:

Medida de a53-1-u-puntamiento, Curtosis:


La curtosis es una medida del a53-1-u-puntamiento, que nos indicar si la distribucin es muy a53-1-upuntada o poco a53-1-u-puntada
Curtosis Negativa

Curtosis nula

Curtosis Positiva

Platicrtica

Mesocrtica

Leptocrtica

Profesor: Ricardo Zapata C.

24

ULARE
Est.Tom.Dec.
Apunte I

Como podemos observar, el coeficiente de curtosis nos mide el grado de a53-1-upuntamiento de la distribucin. Este coeficiente lo vamos a denotar por K y se calcula
segn la siguiente expresin:

Veamos por ltimo el clculo de estos dos ltimos coeficientes en el ejemplo que estamos estudiando.

Profesor: Ricardo Zapata C.

25

ULARE
Est.Tom.Dec.
Apunte I

45

55

50

300

-19,4

-43808,304

849881,098

55

65

10

16

60

600

-9,4

-8305,84

78074,896

65

75

19

35

70

1330

0,6

4,104

2,4624

75

85

11

46

80

880

10,6

13101,176

138872,466

85

95

50

90

360

20,6

34967,264

720325,638

N=

50

-4041,6

1787156,56

3470

Mo=

70.24

As=

Coeficiente de Asimetra de
Pearson As=

K=

Luego es una distribucin asimtrica negativa o a la izquierda y Platicrtica.

Profesor: Ricardo Zapata C.

26

You might also like