You are on page 1of 12

1.

- MEDIANA MODA
La moda es el valor que tiene mayor frecuencia absoluta. Se representa por M o . Se puede hallar la moda para variables cualitativas y cuantitativas. EJEMPLO: Hallar la moda de la distribucin: 2, 3, 3, 4, 4, 4, 5, 5 M o = 4 Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la mxima, la distribucin es bimodal o multimodal, es decir,

tiene varias modas. 1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 M o = 1, 5, 9 Cuando todas las puntuaciones de un grupo tienen la misma

frecuencia, no hay moda. 2, 2, 3, 3, 6, 6, 9, 9 Si dos puntuaciones adyacentes tienen la frecuencia mxima, la moda es

el promedio de las dos puntuaciones adyacentes. 0, 1, 3, 3, 5, 5, 7, 8 Mo = 4 CLCULO DE LA MODA PARA DATOS AGRUPADOS 1 Todos los intervalos tienen la misma amplitud.

L i - 1 es el lmite inferior de la clase modal. f i es la frecuencia absoluta de la clase modal. f i - - 1 es la frecuencia absoluta inmediatamente inferior a la en clase modal. f i - + 1 es la frecuencia absoluta inmediatamente posterior a la clase modal. a i es la amplitud de la clase. Tambin se utiliza otra frmula de la moda que da un valor aproximado de sta:

Ejemplo Calcular la moda de una distribucin estadstica que viene dada por la siguiente tabla:

fi [60, 63) [63, 66) [66, 69) [69, 72) 2 Los intervalos tienen amplitudes distintas. En primer lugar tenemos que hallar las alturas. [72, 75) 5 18 42 27 8 100

La clase modal es la que tiene mayor altura.

La frmula de la moda aproximada cuando existen distintas amplitudes es:

MEDIANA Es el valor que ocupa el lugar central de todos los datos cuando stos

estn ordenados de menor a mayor . La mediana se representa por M e . La mediana se puede hallar slo para variables cuantitativas.

Clculo de la mediana 1 Ordenamos los datos de menor a mayor. 2 Si la serie tiene un nmero impar de medidas la mediana es la puntuacin central de la misma. 2, 3, 4, 4, 5, 5, 5, 6, 6 Me= 5 3 Si la serie tiene un nmero par de puntuaciones la mediana es la media entre las dos puntuaciones centrales. 7, 8, 9, 10, 11, 12 Me= 9.5 Clculo de la mediana para datos agrupados La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas.

Es decir tenemos que buscar el intervalo en el que se encuentre

L i - 1 es el lmite inferior de la clase donde se encuentra la mediana. es la semisuma de las frecuencias absolutas. F i - 1 es la frecuencia acumulada anterior a la clase mediana. a es la amplitud de la clase.

La mediana es independiente de las amplitudes de los intervalos. EJEMPLO Calcular la mediana de una distribucin estadstica que viene dada por la siguiente tabla: fi 100 / 2 = 50 Clase modal: [66, 69) [60, 63) [63, 66) [66, 69) [69, 72) [72, 75) 5 18 42 27 8 100 Fi 5 23 65 92 100

2.- COMPARACIN:
Composicin consistente en establecer una relacin de semejanza entre dos partes. Para ello intentamos descubrir sus relaciones o estimar sus diferencias o semejanzas, con la idea de dar una idea viva y eficaz de una de ellas. Desde el punto de vista retrico, la comparacin es la suma de dos encomios o de un encomio y un vituperio para hacer prevalecer a uno sobre el otro.

3.- CUARTILES:
Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales. Q 1 , Q 2 y Q 3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos. Q 2 coincide con la mediana.

CLCULO DE LOS CUARTILES


Ordenamos los datos de menor a mayor . Buscamos el lugar que ocupa cada cuartil mediante la

expresin.

Nmero impar de datos

2, 5, 3, 6, 7, 4, 9

Nmero par de datos

2, 5, 3, 4, 6, 7, 1, 9

CLCULO DE LOS CUARTILES PARA DATOS AGRUPADOS


En primer lugar buscamos la clase donde se encuentra, en la tabla de las frecuencias acumuladas .

L i es el lmite inferior de la clase donde se encuentra el cuartil. N es la suma de las frecuencias absolutas. F i - 1 es la frecuencia acumulada anterior a la clase del cuartil.

a i es la amplitud de la clase.

Ejercicio de cuartiles Calcular los cuartiles de la distribucin de la tabla: fi [50, 60) [60, 70) [70, 80) [80, 90) [90, 100) [100, 110) [110, 120) 8 10 16 14 10 5 2 65 Fi 8 18 34 48 58 63 65

Clculo del primer cuartil

Clculo del segundo cuartil

Clculo del tercer cuartil

FRACTILES:
En una distribucin de frecuencias, una proporcin o fraccin dada de los datos cae en un fractil o por debajo de ste. Los fractiles tienen nombres especiales, dependiendo del nmero de partes iguales en que se dividen los datos: - Cuartiles (Q) - Deciles (D) - Percentiles (P)

4.- DESVIACIN MEDIA


Equivale a la divisin de la sumatoria del valor absoluto de las distancias existentes entre cada dato y su media aritmtica y el nmero total de datos. Para conocer con un solo indicador que tan disperso se encuentran un conjunto de datos a un punto de concentracin, debemos como primera medida, calcular la distancia de cada dato respecto a una medida de tendencia central. Por ejemplo: 4 5 2 3 4 5 3 2 5 1 3 2 2 1 4

Tenemos que la media aritmtica es de aproximadamente 3,0667 (indicador de tendencia central por excelencia). El primer dato (4), se aleja de la media en 0,9333 hacia la derecha. Grficamente tendramos: Para el segundo dato (5) la distancia es de 1,9333 respecto a la media aritmtica: Note que el tercer dato (3) posee una distancia de 0,0667 hacia la izquierda de la media. Para indicar las distancias de estos puntos, agregaremos el signo negativo, por tanto, la distancia del tercer dato sera 0,0667. La representacin grfica de todos los puntos quedara: El total de las distancias de los puntos que estn a la izquierda respecto a la media es de -8,6 (empleando todos los decimales), que es igual a la sumatoria de las distancias de los puntos que estn a la derecha respecto a la media 8,6. Concluimos que la sumatoria de todas las distancias de cada punto respecto a la media aritmtica es igual a cero (las distancias se anulan): Para responder a la pregunta de qu tan disperso estn los datos respecto a la media aritmtica?, recurriremos nuevamente al promedio simple. Para llegar a una frmula bsica de dispersin, en que las distancias positivas y negativas no se eliminen, modificaremos la frmula anterior para trabajar solo con distancias positivas mediante el valor absoluto: La distancia promedio sera de aproximadamente 1,15 (resultado de la divisin entre la distancia total absoluta y el total de datos). A esta distancia promedio se le conoce con el nombre de desviacin media y significa que en promedio, los datos se separan de la media en 1,15.

5.- VARIANZA, DESVIACIN ESTNDAR, COEFICIENTE DE VARIACIN:


La desviacin estndar (o desviacin tpica) es una medida de dispersin para variables de razn (ratio o cociente) y de intervalo, de gran utilidad en la estadstica descriptiva. Es una medida (cuadrtica) que informa de la media de distancias que tienen los datos respecto de su media aritmtica, expresada en las mismas unidades que la variable. Para abordar las cuestiones que comentbamos en el prrafo anterior, nos valemos de herramientas como la varianza y la desviacin estndar. Ambas medidas estn estrechamente relacionadas ya que definimos una a partir de la otra. Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de tendencia central, sino que necesitamos conocer tambin la desviacin que representan los datos en su distribucin respecto de la media aritmtica de dicha distribucin, con objeto de tener una visin de los mismos ms acorde con la realidad a la hora de describirlos e interpretarlos para la toma de decisiones

VARIANZA En teora de probabilidad y estadstica, la varianza es una medida de la dispersin de una variable aleatoria respecto a su esperanza. Se define como la esperanza de la transformacin COEFICIENTE DE VARIACIN (CV): Equivale a la razn entre la media aritmtica y la desviacin tpica o estndar. Si envs de la media aritmtica se emplea la mediana, obtendremos el coeficiente de variacin mediana. El coeficiente de asimetra, representado por 1, se define como: donde 3 es el tercer momento en torno a la media y es la desviacin estndar. La asimetra resulta til en muchos campos. Muchos modelos simplistas asumen una distribucin normal, esto es simtrica en torno a la media. La distribucin normal tiene una asimetra cero. Pero en realidad, los valores no son nunca perfectamente simtricos y la asimetra de la distribucin proporciona una idea sobre si las desviaciones de la media son positivas o negativas

6.- MEDIDAS DE ASIMETRIA:

Las medidas de asimetra son indicadores que permiten establecer el grado de simetra (o asimetra) que presenta una distribucin de probabilidad de una variable aleatoria sin tener que hacer su representacin grfica.

Como eje de simetra consideramos una recta paralela al eje de ordenadas que pasa por la media de la distribucin. Si una distribucin es simtrica, existe el mismo nmero de valores a

la derecha que a la izquierda de la media, por tanto, el mismo nmero de desviaciones con signo positivo que con signo negativo. Decimos que hay asimetra positiva (o a la derecha) si la "cola" a la derecha de la media es ms larga que la de la izquierda, es decir, si hay valores ms separados de la media a la derecha. Diremos que hay asimetra negativa (o a la izquierda) si la "cola" a la izquierda de la media es ms larga que la de la derecha, es decir, si hay valores ms separados de la media a la izquierda.

7.- MEDIDAS DE CURTUCIS :

Dependiendo del nmero de observaciones que haya en la zona central de la distribucin y del que haya en las zonas alejadas dos distribuciones con la misma varianza pueden tener dos perfiles distintos, con mayor o menor forma " de punta ".Al mayor o menor "apuntamiento" que puede tener una distribucin con independencia del valor que tome su varianza se le llama CURTOSIS (o APUNTAMIENTO). [ver grfico] (EJEMPLO)

Como nos interesa comparar (ponderadamente) el nmero de observaciones cercanas a la media con el nmero de observaciones lejanas (con independencia del signo de su distancia a la media), para medir la curtosis, deberemos considerar un momento central de orden par; pero como la curtosis es el mayor o menor apuntamiento con independencia de la varianza, deberemos considerar el momento central de orden 4:

Pero si queremos disponer de una medida vlida para la comparacin universal, el hecho de que m4 dependa de las unidades (de la cuarta potencia de las unidades) es un inconveniente, por lo que deberemos considerar como indicador de la curtosis el momento de cuarto orden la variable tipificada: m4(t)

Por ltimo suele considerarse el coeficiente de curtosis "relativizado" para permitir la comparacin del apuntamiento de la distribucin con el apuntamiento "patrn" que es el que tiene (el modelo Normal) la DISTRIBUCIN NORMAL DE PROBABILIDAD (campana de Gauss), cuyo momento de cuarto orden tipificado es tres.Por ello se define el coeficiente de curtosis como el momento central de cuarto orden de la variable tipificada menos tres unidades:

8.- COVARIANZA, CORRELACIN LINEAL

Si dos carcteres cuantitativos

son medidos en puntos en

individuos, podemos considerar a . Diferentes carctersticas e denotan a las

la muestra bidimensional como una nube de

estadsticas permiten resumir la informacin contenida en su forma. Si medias empricas de los dos carcteres, el punto

es el centro de gravedad de la nube.

Las varianzas empricas y evidencian la dispersin de abscisas y de ordenadas. Para ir ms all en la descripcin, hay que calcular la covarianza. Definicin 3.1 Llamamos covarianza de e , y denotamos por , a la cantidad:

Esta definicin extiende la de la varianza en la medida en que simtrica ( nmeros reales y ) y bilineal: si y

. La covarianza es , y dos

son dos muestras de tamao

denotamos

, entonces:

Como consecuencia de la bilinealidad tenemos:

En la prctica, para el clculo, se emplea la siguiente frmula:

Proposicin 3.2 La covarianza de

se escribe:

La covarianza es la media de los productos menos el producto de las medias. Demostracin: Basta desarrollar los productos:

La covarianza se compara al producto de las desviaciones estndar empleando la desigualdad de Cauchy-Schwarz.

Proposicin 3.3 Tenemos:

Demostracin: Sea

un nmero real arbitrario. Calculemos la varianza de :

Este valor es positivo o nulo para todo como un trinomio en

. Por tanto el discriminante de la expresin de , visto

, es necesariamente negativo. Su valor es:

de aqu se obtiene la desigualdad buscada. Observemos que el discriminante es nulo si y slo si se anula, es decir si existe un tal que es constante. Por tanto la . expresin 3.1 no es una igualdad a menos que exista una relacin afn entre

A partir de la desigualdad 3.1, parece natural dividir la covarianza por el producto de las desviaciones estndar, para as definir el coeficiente de correlacin (las desviaciones estndar se suponen no nulas). Definicin 3.4 Llamamos coeficiente de correlacin de e , y denotamos e y , a la , el e . Expresa

cantidad: Cualesquiera que sean las unidades y los rdenes de magnitud de coeficiente de correlacin es un nmero sin unidades, comprendido entre la puntos. mayor Hemos o visto menor que la con o, geomtricamente, el mayor o menor igualdad salvo si es constante o si dependencia lineal entre

aplastamiento de la nube de desigualdad 3.1 no poda ser una es de la forma es igual a . Si es positivo, el si es , es igual a

coeficiente de correlacin de

negativo. Un coeficiente de correlacin nulo o cercano a 0 significa que no hay relacin lineal entre los caracteres, pero no conlleva ninguna nocin de independencia ms general. Consideremos, por ejemplo, las dos muestras:

Su coeficiente de correlacin es nulo y sin embargo

estn ligados por una relacin o , los carcteres se dicen que

funcional Cuando el coeficiente de correlacin est cerca de

estn ''fuertemente correlados''. Hay que tener cuidado con la confusin frecuente entre correlacin y causalidad. Que dos fenmenos estn correlados no implica, de ninguna manera, que uno sea causa del otro. Es muy frecuente que una correlacin fuerte indica que los dos carcteres dependen de un tercero que no ha sido medido. Este tercer carcter se llama ''factor de confusin''. Que exista una fuerte correlacin entre la recaudacin de impuestos en Inglaterra y la criminalidad en el Japn, indica que ambos estn ligados al aumento global de la poblacin. El precio del trigo y la poblacin de roedores estn negativamente correlados, porque ambos dependen del nivel de la cosecha de trigo. Puede ser que una fuerte correlacin exprese una verdadera causalidad, como entre el nmero de cigarrillos que se fuma al da y la aparicin de un cncer de pulmn. Pero no es la estadstica la que demuestra la causalidad, ella permite solamente detectarla. La influencia del consumo del tabaco en la aparicin de un cncer de pulmn ha sido cientficamente demostrada en la medida en que se pudieron analizar los mecanismos fisiolgicos y bioqumicos que hacen que el alquitrn y la nicotina induzcan errores en la reproduccin del cdigo gentico de las clulas.

9.- DISTRIBUCIN BIDIMENSIONAL Y REGRESIN LINEAL:

Distribuciones bidimensionales

Son aquellas en las que a cada individuo le corresponden los valores de dos variables, las representamos por el par (xi, yi). Si representamos cada par de valores como las coordenadas de un punto, el conjunto de todos ellos se llama nube de puntos o diagrama de dispersin. Sobre la nube de puntos puede trazarse una recta que se ajuste a ellos lo mejor posible, llamada recta de regresin. Ejemplo Las notas de 12 alumnos de una clase en Matemticas y Fsica son las siguientes

Matemticas Fsica

2 1

3 3

4 2

4 4

5 4

6 4

6 6

7 4

7 6

8 7

10 9

10 10

REGRESIN LINEAL:

La regresin es un mtodo de anlisis de los datos de la realidad econmica que sirve para poner en evidencia las relaciones que existen entre diversas variables.

En estadstica la regresin lineal o ajuste lineal es un mtodo matemtico que modeliza la relacin entre una variable dependiente Y, las variables independientes Xi y un trmino aleatorio . Este modelo puede ser expresado como:

donde 0 es la interseccin o trmino "constante", las

son los parmetros

respectivos a cada variable independiente, y p es el nmero de parmetros independientes a tener en cuenta en la regresin. La regresin lineal puede ser contrastada con la regresin no lineal.

You might also like