Professional Documents
Culture Documents
Medidas
De Posicin
De Dispersin
M. De Posicin Central
M. De Posicin no Central
Desviacin estndar
Varianza
Media o Promedio
Mediana
Moda
Cuartiles
Percentiles
Medidas de Posicin:
Son aquellas medidas que nos ayudan a saber donde estn los datos pero sin indicar como se distribuyen.
m1
,
p1 ,
x1
2 s1
m2
,
p2 ,
x2 22 s
s2
ESTADSTICOS Caractersticas medibles de una MUESTRA, usadas para estimar parmetros poblacionales. Representadas por letras latinas. VARIABLE para la poblacin, fija para la muestra dada.
La Media o Promedio
Se define como la suma de los valores de todas las
observaciones divididas por el nmero total de datos. Se representa por x o por la letra segn se calcule en una muestra o en la poblacin, respectivamente.
POBLACIN MUESTRA
x
i 1
N
k
x
i
DATOS
AGRUPADOS
xi fi
i 1
x
i 1
fi
x
i 1 k i 1
fi
i
Ejemplo 1: las notas de Juan el ao pasado fueron: 5, 6, 4, 7, 8, 4, 6 La nota media de Juan es:
Mediana
Busca determinar el valor que tiene aquella observacin que divide
debido a ello, es necesario, antes que nada, ordenar los datos de menor a mayor (o viceversa).
n Mn Li
2 Fa h f
21 18
14 1 108
75 93
107 108
Moda
Es aquel valor de la variable que ms se repite; es decir,
aquel valor de la variable con una frecuencia mayor. El dato modal puede no ser nico.
Ejemplo 1:
Moda 6
1 Mo Li h 1 2
56,1 64,1
64,1 72,1 72,1 80,1 80,1 88,1 88,1 96,1 96,1 104,0 totales
11
32 21 18 14 1 108
1
2
Mo 64,1 (32 11) 8 (32 11) (32 21)
Mo 69,3
Son valores de la variable que dividen a la distribucin en 4 partes, cada una de las cuales engloba el 25 % de las mismas. Se denotan de la siguiente forma: Q1 , Q2 y Q3
b) Deciles ( Di )
Son los valores de la variable que dividen a la distribucin en las partes iguales, cada una de las cuales engloba el 10 % de los datos. En total habr 9 deciles. ( D1 , D2 ... D9 )
c) Percentiles ( Pi )
Son los valores que dividen a la distribucin en 100 partes iguales, cada una de las cuales engloba el 1 % de las observaciones. En total habr 99 percentiles. ( P ) 1, P 2 ... P 99
kN Fi 1 Qk Li 4 h fi
2 108 22 Q 2 64,1 4 8 32 Q 2 72,1
11 32
21 18 14 1 108
22 54
75 93 107 108
kN Fi 1 10 Dk Li h fi
7 108 75 D7 80,1 10 8 18 D7 80,4
11 32
21 18 14 1 108
22 54
75 93 107 108
kN Fi 1 100 Pk Li h fi
90 108 93 P90 88,1 100 8 14 P90 90,5
11 32
21 18 14 1 108
22 54
75 93 107 108
Medidas de Dispersin: Las medidas de dispersin tratan de medir el grado de dispersin que tiene una variable estadstica en torno a una medida de posicin.
Medidas de Dispersin
El desviacin estndar Es posible identificar conjuntos de datos que a pesar de ser muy distintos en trminos de valores absolutos, poseen la misma media. Una medida diferencial para identificar esos conjuntos de datos es la concentracin o dispersin alrededor de la media.
Una manera de evitar que los distintos signos se compensen es elevarlas al cuadrado, de manera que todas las desviaciones sean positivas. La raz cuadrada del promedio de estas cantidades recibe el nombre de desvo estndar, o desviacin tpica y es representada por la siguiente frmula:
A mayor valor del coeficiente del desvo estndar, mayor dispersin de los datos con respecto a su media. Es un valor que representa los promedios de todas las diferencias individuales de las observaciones respecto a un punto de referencia comn, que es la media aritmtica. Se entiende entonces que cuando este valor es ms pequeo, las diferencias de los valores respecto a la media, es decir, los desvos, son menores y, por lo tanto, el grupo de observaciones es ms homogneo que si el valor de la desviacin estndar fuera ms grande. O sea que a menor dispersin mayor homogeneidad y a mayor dispersin, menor homogeneidad. La Varianza
El cuadrado de la desviacin estndar recibe el nombre de varianza y se representa por . La suma de los cuadrados de los desvos de la totalidad de las observaciones, respecto de la media aritmtica de la distribucin, es menor que la suma de los cuadrados de los desvos respecto de cualquier otro valor que no sea la media aritmtica.
Si observamos, veremos que la varianza no es ms que el desvo estndar al cuadrado. Precisamente la manera de simbolizarla es. Por lo mismo, el desvo estndar puede definirse como la raz cuadrada de la varianza
s2
8 cms.
Aqu tenemos 9 rectngulos cuya altura es de 8 centmetros (y todos tienen la misma base). Existe alguna variacin respecto de su altura entre estos rectngulos? Cul es el promedio de la altura de estos rectngulos? 8+8+8+8+8+8+8+8+8 9 = 72 =8 9
El quinto rectngulo y el octavo rectngulo en un acto de rebelda cambiaron su altura. El quinto rectngulo, ahora de color rojo, mide 10 centmetros, y el octavo rectngulo, de color azul, mide 6 centmetros? Cul es el nuevo promedio de estos 9 rectngulos? 8 + 8 + 8 + 8 + 10 + 8 + 8 + 6 + 8 9
72 =8 9
10 cms 6 cms
8 cms.
El rectngulo rojo tiene +2 centmetros sobre el promedio, y el rectngulo azul tiene 2 centmetros bajo el promedio. Los otros rectngulos tienen cero diferencia respecto del promedio. Si sumamos estas diferencias de la altura respecto del promedio, tenemos 0+0+0+0+2+0+02+0 =0 Este valor nos parece indicar que no ha habido variabilidad! Y sin embargo, ante nuestros ojos, sabemos que hay variacin.
Una forma de eliminar los signos menos de aquellas diferencias que sean negativas, esto es de aquellos mediciones que estn bajo el promedio, es elevar al cuadrado todas las diferencias, y luego sumar... 02 + 02 + 02 + 02 + 22 + 02 + 02 + ( 2)2 + 02 = 8 Y este resultado repartirlo entre todos los rectngulos, es decir lo dividimos por el nmero de rectngulos que es 9 02 + 02 + 02 + 02 + 22 + 02 + 02 + ( 2)2 + 02 = 9 8 = 0,89 9
Se dice entonces que la varianza fue de 0,89 Observemos que las unidades involucradas en el clculo de la varianza estn al cuadrado. En rigor la varianza es de 0,89 centmetros cuadrados. De manera que se define
0,89 0,943
La raz cuadrada de la varianza se llama desviacin estndar
Que la desviacin estndar haya sido de 0,943 significa que en promedio la altura de los rectngulos variaron (ya sea aumentando, ya sea disminuyendo) en 0,943 centmetros. Es claro que esta situacin es en promedio, puesto que sabemos que los causantes de la variacin fueron los rectngulos quinto y octavo. Esta variacin hace repartir la culpa a todos los dems rectngulos que se portaron bien. La desviacin estndar mide la dispersin de los datos respecto del promedio
10 cms
8 cms. 4 cms 8 cms. 8 cms. 8 cms. 7 cms. 8 cms. 6 cms
0,56
2,56
0,56 -0,44
-1,44 0,56
7,44 Promedio 0,562 + (-3,44)2 + 0,562 + 0,562 + 2,562 + 0,562 + (-0,44)2 + (-1,44)2 + 0,562 22,2224 = 9 9 Este es el valor de la varianza = 2,469
10 cms
8 cms. 4 cms 8 cms. 8 cms. 8 cms. 7 cms. 8 cms. 6 cms
7,44
Promedio
Si la varianza fue de 2,469, entonces la desviacin estndar es de...
2, 469 1,57
Lo que significa que, en promedio, los rectngulos se desviaron ms o menos (ms arriba o ms abajo) en 1,57 centmetros.
Multiplicar
Dividir Potencia de orden 2 Raz cuadrada Y es claro que esto no es suficiente (salvo que queramos que aprenda de memoria los clculos). Necesitamos estimular su imaginacin para que vea la variabilidad existente en la naturaleza. Entregue una lista de fenmenos en que un mismo atributo tenga variabilidad si se mide este atributo a un nmero de individuos u objetos.