Professional Documents
Culture Documents
net
PARMETROS ESTADSTICOS
1. PARMETROS DE CENTRALIZACIN
La informacin recogida en una tabla o grfica estadstica suele resumirse en unos pocos valores que nos informan del comportamiento de todos los individuos del colectivo estudiado. Estos valores, representativos de todos los de una distribucin, se llaman parmetros o medidas de centralizacin. Estos parmetros tienden a situarse hacia el centro del conjunto de datos ordenados.
x=
xi
N
Para datos con frecuencias. Si la variable toma los valores o marcas de clase x1, x2, , xk, con frecuencias absolutas n1, n2, , nk, la media aritmtica se calcula mediante la expresin:
x= n1 x1 + n2 x 2 + K + nk x k = N
i =1
ni x i
N
Ejemplo.-
Calcula la media aritmtica de la superficie de los Parques Nacionales. Parques Nacionales Picos de Europa Ordesa y Monte Perdido El Teide La Caldera Taburiente Timanfaya Doana La Tablas de Daimiel El Archipilago de Cabrera Garajonay Total ha 16.925 15.608 13.571 4.690 5.107 50.720 1.928 10.025 3.984 122.558
Los datos aparecen sin frecuencias. Debemos sumar todas las superficies y dividir esta suma por el nmero de Parques Nacionales.
x=
i =1
xi
N
Parmetros estadsticos
www.matesxronda.net
Ejemplo.-
Las edades de los alumnos de una clase son las que se reflejan en la tabla. Hallamos la edad media de los alumnos. Edad (xi) 13 14 15 16 Total ni 6 7 4 3 20 nixi 78 98 60 48 284 La variable es discreta. Para hallar la media debemos sumar todos los datos, lo que equivale a multiplicar cada valor por su frecuencia absoluta y sumar todos los productos.
i =1
x=
ni xi
N
Ejemplo.-
Hemos tallado los treinta alumnos de una clase. Con los datos obtenidos y agrupando las tallas por intervalos hemos calculado la talla media de stos. La variable es continua y los datos estn agrupados en clases. La media de una variable continua se obtiene sumando los productos de las marcas de clase de los intervalos por su frecuencia absoluta y dividiendo ese producto entre el nmero total de datos. Talla (cm) [150, 155) [155, 160) [160, 165) [165, 170) [170, 175] Total Marcas de clase (xi) 1525 1575 1625 1675 1725 ni 1 3 10 12 4 30 nixi 1525 4725 1.625 2.010 690 4.950
x=
i =1
ni xi
N
4.950 = 165 cm 30
1.2. Moda
Moda de una variable estadstica es el valor de dicha variable que tiene mayor frecuencia absoluta (es decir, el valor de la variable que ms se repite). Se representa por Mo. Ejemplo.Para las edades de los alumnos del ejemplo anterior, la moda es Mo = 14, ya que 14 es la edad que tienen un mayor nmero de alumnos. Esta distribucin, como slo tiene una moda, se dice que es una distribucin unimodal. Dada una distribucin de frecuencias, su tabla es la siguiente. xi ni 1 6 2 7 3 14 4 10 5 14 6 9
Ejemplo.-
Las modas son Mo = 3 y Mo = 5, por ser estos dos valores de la variable los que tienen mayor frecuencia. Diremos en estos casos que se trata de una distribucin bimodal. En el caso de que los datos estn agrupados en intervalos llamamos clase o intervalo modal a la clase que presenta mayor frecuencia absoluta. Si no necesitamos mucha precisin en el clculo de la moda, podemos tomar como valor aproximado de la misma la marca de clase del intervalo modal. Cuando es necesaria mayor precisin en el clculo recurrimos a la siguiente expresin que nos da su valor exacto.
n Mo n Mo 1 Mo = e i + a ( n Mo n Mo 1 ) + ( n Mo n Mo +1 )
ei = extremo inferior del intervalo modal a = amplitud del intervalo modal nMo, nMo1, nMo+1 = frecuencias absolutas del intervalo modal, del intervalo anterior y del posterior, respectivamente
Parmetros estadsticos
www.matesxronda.net
Ejemplo.-
En la distribucin estadstica vista con anterioridad que nos proporciona la talla de los treinta alumnos de una clase, el mayor valor de la frecuencia absoluta 12 da como intervalo modal [165, 170). El valor aproximado de la moda es 1675 cm. No obstante, el valor exacto de est es:
Mo = 165 + 12 10 2 5 = 165 + 5 = 165 + 1 = 166 cm (12 10) + (12 4) 2+8
Por tanto, la talla moda de esta clase es Mo = 166 cm, que como podemos ver se aproxima mucho a la marca de clase del intervalo modal, 1675 cm. Observa como grficamente, a travs del histograma, tambin se puede calcular la moda.
Mo = ei +
nMo nMo 1 1 2 a = ei + a = 165 + 5 = 165 + 1 = 166 cm (nMo nMo 1 ) + (nMo nMo +1 ) 1 + 2 2+8
1.3. Mediana
Las calificaciones que han obtenido 7 alumnos en Matemticas y 8 alumnos en Lengua han sido las siguientes: Matemticas: 2 4 5 6 6 7 7 ; Lengua: 2 2 4 4 6 8 8 8
Observamos que en Matemticas la nota 6 deja tres alumnos a su izquierda y tres a su derecha. En las de Lengua, como no hay una nota central, tomamos la media aritmtica de las dos notas centrales: (4 + 6)/2 = 5. Decimos que la nota mediana en Matemticas es 6 y en Lengua 5. Mediana de una variable estadstica es el valor (no es siempre un valor de la variable) que, tras ordenar los datos de forma creciente, deja a su izquierda un nmero de datos iguales a los que deja a su derecha; es decir, es el valor tal que la mitad de los datos son menores o iguales que l y la otra mitad iguales o mayores. Se denota por Me. Ejemplo.Dada la serie estadstica 11, 3, 5, 9, 12, 2, 6, calcula la mediana. Ordenamos los datos: 2, 3, 5, 6, 9, 11, 12 la mediana es Me = 6, por ser ste el valor central. Ejemplo.Dada la serie estadstica 12, 5, 3, 9, 11, 13, 2, 6, calcula la mediana. Ordenamos los datos: 2, 3, 5, 6, 9, 11, 12, 13 en este caso hay dos valores centrales, que son 6 y 9; la mediana es Me = (6 + 9)/2 = 75.
Parmetros estadsticos
www.matesxronda.net
El proceso anterior, para calcular la mediana, es til cuando disponemos de pocos datos, pero cuando el nmero de stos es grande este procedimiento resulta muy laborioso, siendo necesario construir una tabla estadstica con frecuencias absolutas acumuladas. De esta forma, para el clculo de la mediana de una variable estadstica discreta debemos distinguir dos casos: Que no exista ningn valor de la variable, xi, cuya frecuencia absoluta acumulada, Ni, sea igual que la mitad del nmero de individuos, N/2. E este caso, la mediana es el primer valor de la variable cuya frecuencia absoluta acumulada sea mayor que la mitad del nmero de individuos. Ejemplo.Las calificaciones (xi) que obtuvieron los 32 alumnos de una clase en la asignatura de Ingls fueron las que proporciona la siguiente tabla. Halla la calificacin mediana. xi 1 2 3 4 5 6 7 8 9 10 Total ni 2 2 3 5 7 5 3 2 2 1 32 Ni 2 4 7 12 19 24 27 29 31 32
La mitad del nmero total de individuos es N/2 = 16 La calificacin mediana es Me = 5, dado que es el primer valor de la variable cuya frecuencia absoluta acumulada, 19, excede a la mitad del nmero de datos, 16.
En el caso de que exista un valor de la variable, xi, cuya frecuencia absoluta acumulada sea igual que la mitad del nmero de individuos, es decir, Ni = N/2, la mediana ha de ser la media aritmtica entre dicho valor de la variable y el siguiente. Ejemplo.En el examen de evaluacin, las calificaciones que obtuvieron fueron muy parecidas. Hallemos nuevamente la calificacin mediana. xi 1 2 3 4 5 6 7 8 9 10 Total ni 2 2 3 5 4 7 3 2 3 1 32 Ni 2 4 7 12 16 23 26 28 31 32
En este caso, el valor x = 5 tiene por frecuencia absoluta acumulada 16, que es precisamente la mitad del nmero total de individuos: N/2 = 16. La calificacin mediana es ahora Me = (5 + 6)/2 = 55
En el caso de que los datos estn agrupados en intervalos, llamamos intervalo o clase mediana a la primera clase o intervalo cuya frecuencia absoluta acumulada sobrepase estrictamente a la mitad del nmero de individuos. Si no necesitamos mucha precisin podemos tomar como valor aproximado de la mediana la marca de clase correspondiente a la clase mediana. Cuando es necesaria mayor precisin en el clculo de la mediana, para variables agrupadas en intervalos, utilizamos la siguiente expresin que nos da su valor exacto.
Parmetros estadsticos
www.matesxronda.net
N N Me 1 Me = e i + 2 a n Me
ei = extremo inferior de la clase mediana a = amplitud de la clase mediana nMe = frecuencia absoluta de la clase mediana NMe1 = frecuencia absoluta acumulada de la clase anterior a la clase mediana
Ejemplo.-
Encuentra la talla mediana en la distribucin estadstica vista en el ejemplo del epgrafe 1.1. Talla (cm) [150, 155) [155, 160) [160, 165) [165, 170) [170, 175] Total xi 1525 1555 1625 1675 1725 ni 1 3 10 12 4 30 Ni 1 4 14 26 30 El intervalo o clase mediana es [165, 170) ya que es el primer intervalo cuya frecuencia absoluta acumulada, 26, sobrepasa a la mitad del nmero de individuos, N/2 = 15. El valor aproximado de la mediana es entonces 1675 cm. Para obtener la mediana exacta utilizamos la expresin indicada anteriormente: 30 14 5 1.985 Me = 165 + 2 5 = 165 + = 165'42 cm 12 12 12
Cuando los datos estn agrupados en intervalos, la mediana puede interpretarse geomtricamente como el punto del eje de abscisas que permite dividir el histograma de frecuencias absolutas en dos partes de igual rea. Lo comprobamos a continuacin con el ejemplo anterior.
5 1 + 5 3 + 5 10 +
5 12 = 5 + 15 + 50 + 5 = 75 12
55 12 + 5 4 = 55 + 20 = 75 12
Ejemplo.-
En este ejemplo puedes ver que no se presenta ningn problema cuando se encuentra un intervalo cuya frecuencia absoluta acumulada es igual que la mitad del nmero total de individuos. Calculamos la talla mediana de esta distribucin (ligeramente modificada de la anterior). Talla (cm) [150, 155) [155, 160) [160, 165) [165, 170) [170, 175] Total xi 1525 1555 1625 1675 1725 ni 1 3 11 10 5 30 Ni 1 4 15 25 30 El intervalo o clase mediana es el mismo, [165, 170), pues es el primero cuya frecuencia absoluta acumulada, 25, sobrepasa a la mitad del nmero de individuos, N/2 = 15. El valor aproximado de la mediana es 1675 cm. Obtenemos el valor exacto:
30 15 Me = 165 + 2 5 = 165 + 0 = 165 cm; lgicamente Me = ei. 10
Parmetros estadsticos
www.matesxronda.net
2. CUARTILES
Hemos visto anteriormente que la mediana separa los datos, ordenados de menor a mayor, en dos partes con el mismo nmero de datos. Pero en ocasiones necesitamos saber ms acerca de la distribucin de los datos, por lo que se hace necesario introducir otras medidas como son los cuartiles. As como la mediana separa los datos en dos grupos, los cuartiles separan los datos en cuatro grupos de la siguiente manera: 2 2 3 3 Q1 = 3 3 3 4 4 6 5 Q2 = Me = 5 5 6 7 8 7 Q3 = 7 7
Q3 =
3 3+3 Q1 = =3 2
6 6 5+6 Q2 = Me = = 5'5 2
7+8 = 7'5 2
Primer cuartil Q1: es el menor valor que supera a la cuarta parte de los datos. Segundo cuartil Q2: es el menor valor que supera a la mitad de los datos, es decir, la mediana. Tercer cuartil Q3: es el menor valor que supera las tres cuartas partes de los datos.
El proceso para hallar estos parmetros es anlogo al clculo de la mediana. Veamos, a travs de los siguientes ejemplos, cmo se hallan los cuartiles de una distribucin estadstica discreta o continua. Variable estadstica discreta xi 1 2 3 4 5 6 7 8 9 10 Total ni 2 2 3 5 7 5 3 2 2 1 32 Ni 2 4 7 12 19 24 27 29 31 32 La cuarta parte del nmero total de datos es N/4 = 8. El primer cuartil es Q1 = 4, dado que es el primer valor de la variable cuya frecuencia absoluta acumulada, 12, excede a la cuarta parte del nmero de datos, 8. La mitad del nmero total de datos es N/2 = 16. E segundo cuartil o mediana es, por tanto, Q2 = Me = 5, dado que es el primer valor de la variable cuya frecuencia absoluta acumulada, 19, excede a la mitad del nmero de datos, 16. En este caso, el valor x = 6 tiene por frecuencia absoluta acumulada 24, que es precisamente las tres cuartas partes del nmero total de datos: 3N/4 = 24. El tercer cuartil es ahora Q3 = (6 + 7)/2 = 65
Variable estadstica continua En el caso de que los datos estn agrupados en intervalos, consideraremos el intervalo o clase cuya frecuencia absoluta acumulada sobrepase estrictamente al nmero de datos en cuestin. Podemos tomar como valor aproximado de los distintos cuartiles las marcas de clases correspondientes; cuando es necesaria mayor precisin en sus clculos, usaremos las siguientes expresiones que nos proporcionan los valores exactos.
N N Q1 1 Q1 = e i + 4 a nQ1 N N Me 1 Q2 = Me = e i + 2 a n Me
3N N Q3 1 Q3 = e i + 4 a nQ3
Parmetros estadsticos
www.matesxronda.net
Hallemos los cuartiles de la distribucin estadstica continua correspondiente a los datos obtenidos de las alturas de 32 personas. Talla (cm) [150, 155) [155, 160) [160, 165) [165, 170) [170, 175] Total xi 1525 1555 1625 1675 1725 ni 2 3 10 12 5 32 Ni 2 5 15 37 32
N/4 = 8, luego el intervalo correspondiente al primer cuartil es [160, 165) ya que es el primer intervalo cuya frecuencia absoluta acumulada, 15, sobrepasa a la cuarta parte del nmero de individuos. El valor aproximado del primer cuartil es entonces 1625 cm. Obtengamos su valor exacto: N 32 N Q1 1 5 4 Q1 = ei + a = 160 + 4 5 = 160 + 1'5 = 161'5 cm nQ1 10 N/2 = 16, con lo que el intervalo [165, 170) es el intervalo mediano o intervalo correspondiente al segundo cuartil, ya que es el primero cuya frecuencia absoluta acumulada, 37, sobrepasa a la mitad del nmero de individuos. El valor aproximado del segundo cuartil o mediana es 1675 cm. Hallamos su valor exacto: N 32 N Me 1 15 Q2 = Me = ei + 2 a = 165 + 2 5 = 165 + 0'42 = 165'42 cm nMe 12 3N/4 = 24, por lo que [165, 170) es tambin el intervalo correspondiente al tercer cuartil, pues es el primer intervalo cuya frecuencia absoluta acumulada, 37, sobrepasa a las tres cuartas partes del nmero de individuos. Consecuentemente, el valor aproximado del tercer cuartil es tambin 1675 cm. Calculamos su valor exacto:
3N 3 32 N Q3 1 15 Q3 = ei + 4 a = 165 + 4 5 = 165 + 3'75 = 168'75 cm, valor bastante superior a la mediana nQ3 12
EJERCICIOS
1. La temperatura que ha marcado un termmetro en los diferentes das de la semana, ha sido (en grados centgrados) los que pueden verse en la tabla. Lunes Mnima Mxima 4 19 Martes 2 18 Mircoles 3 21 Jueves 1 13 Viernes 4 12 Sbado 0 14 Domingo 3 22
a) Calcula la temperatura media mnima. b) Calcula la temperatura media mxima. c) Calcula la media de las oscilaciones extremas diarias. 2. Dada la distribucin estadstica siguiente: 3, 2, 5, 7, 6, 4, 2, 1, 9, 5, 7, 6, 4. Calcula la media aritmtica, la moda, la mediana y los cuartiles. 3. Halla la media, la mediana, la moda y los cuartiles de la distribucin cuya tabla de frecuencias es la siguiente. xi ni 3 6 6 9 7 7 8 8 10 17 12 13
Parmetros estadsticos
www.matesxronda.net
4. Las edades de los componentes de una pea de aficionados al ftbol son: 18, 16, 21, 20, 18, 16, 21, 18, 21, 18, 20, 19, 36, 24, 18, 20, 18, 19, 20 a) Calcula la edad media, la edad moda y la edad mediana, as como los cuartiles. b) Representa grficamente los datos de esta distribucin. 5. La siguiente tabla muestra la distribucin, a lo largo de un mes, del nmero de camiones que circulan diariamente por un cruce de carreteras. N de camiones por da N de das [350, 400) 2 [400, 450) 5 [450, 500) 11 [500, 550) 9 [550, 600] 4
Calcula la media, la moda, la mediana y los cuartiles de esta distribucin. 6. Las respuestas correctas a un test de 80 preguntas realizado por 600 personas son las que se recogen a continuacin. Respuestas N de personas [0, 10) 40 [10, 20) 60 [20, 30) 75 [30, 40) 90 [40, 50) 105 [50, 60) 85 [60, 70) 80 [70, 80] 65
Calcula el nmero medio de respuestas correctas, la moda y la mediana. Halla los cuartiles. Interpreta grficamente el clculo de la moda y de la mediana, y comprueba que la mediana es el punto del eje de abscisas que divide el histograma de frecuencias absolutas en dos partes de igual rea. 7. La media de x, 4x 3, x + 4, 16, 9 y x 5 es 4. Cunto vale la mediana de esta serie de nmeros? 8. La siguiente serie de datos: 18, 21, 24, a, 36, 37, b, est ordenada y tiene de mediana 30 y de media 32. Encuentra el valor de a y b.
3. PARMETROS DE DISPERSIN
Este ao hay dos cursos muy desiguales en cuanto al rendimiento en Matemticas. Observa sus calificaciones.
Poca dispersin! En 3 A hay pocas notas bajas, pocas altas y casi todas se sitan en torno al 5.
Mucha dispersin! En 3 B hay bastantes alumnos con muy bajo rendimiento, bastantes con muy buen rendimiento y pocas calificaciones en torno al 5.
Parmetros estadsticos
www.matesxronda.net
Aunque estas distribuciones de notas tienen aspecto diferente, sus medias son parecidas, xA = 503 y xB = 51; es decir, lo que diferencia a ambos cursos es su comportamiento respecto a la media. Es necesario, pues, conocer en qu medida los datos numricos estn agrupados o no alrededor de los valores centrales. A esto es a lo que se llama dispersin, y los parmetros que nos informan de cmo se separan los datos se llaman parmetros o medidas de dispersin. Los parmetros de dispersin son valores numricos que nos informan de las desviaciones que sufren los datos de una distribucin estadstica respecto de los parmetros centrales, en particular respecto a la media aritmtica.
d m=
| xi x |
N
Si la variable toma los valores o marcas de clase x1, x2, , xk, con frecuencias absolutas n1, n2, , nk, la desviacin media se calcula con la expresin siguiente: n1 | x1 x | + n2 | x 2 x | + K + nk | x k x | = N
i =1
dm =
ni | x i x |
N
Parmetros estadsticos
www.matesxronda.net
Ejemplo.-
Los siguientes datos corresponden al nmero de faltas de ortografa cometidas por dos alumnos en siete dictados. Alumno A: 1, 2, 5, 5, 5, 8, 9
N
Alumno B: 4, 4, 5, 5, 5, 6, 6
xA =
xi
N
N
1 + 2 + 5 + 5 + 5 + 8 + 9 35 = = 5 faltas 7 7
dm A =
i =1
| xi x |
N
| 1 5 | + | 2 5 | + | 5 5 | + | 5 5 | + | 5 5 | + | 8 5 | + | 9 5 | 14 = = 2 faltas 7 7
nixi 8 15 12 35
| xi x |
ni | x i x |
1 0 1
2 0 2 4
4 = 0' 5714 faltas 7
xB =
i =1
ni xi
N
35 = 5 faltas d m B = 7
i =1
ni | xi x |
N
Observamos que, aunque ambos tienen igual media aritmtica, el nmero de faltas de ortografa est menos disperso en el segundo alumno (es decir, el alumno B es mucho ms regular que el alumno A).
2 =
( x i x )2
N
2 o bien mediante =
2 x2
+ K+ N
2 xN
x2 =
i =1
x i2
N
x2
Si la variable toma los valores o marcas de clase x1, x2, , xk, con frecuencias absolutas n1, n2, , nk, la varianza se calcula mediante las expresiones siguientes:
n1 ( x1 x ) + n2 ( x 2 x ) + K + nk ( x k x ) = N
2 2 2 i =1
2 =
ni ( x i x ) 2
N
Parmetros estadsticos
10
www.matesxronda.net
2 o bien mediante =
2 n1 x1
2 n2 x 2
+ K+ N
2 nk x k
x2 =
i =1
ni x i2
N
x2
Desviacin tpica de una variable estadstica es la raz cuadrada positiva de la varianza. Se denota por .
= 2
La media x , as como la desviacin tpica se expresan en la misma unidad que la variable X. El coeficiente de variacin es una cantidad sin dimensin, independientemente de las unidades elegidas.
Ejemplo.-
Hallamos la media y la desviacin tpica de ambas series para calcular sus coeficientes de variacin:
i =1
Serie A:
xA =
xi
N
=
2 i
1 + 3 + 5 + 7 + 9 25 = =5 5 5
2 A =
x
i =1
x2 =
12 + 32 + 5 2 + 7 2 + 9 2 165 52 = 25 = 8 ; 5 5
luego A = 8 2'8284
Serie B:
xB =
i =1
xi
N
=
2 i
1 + 4 + 8 + 8 21 = = 5' 25 4 4
2 B =
x
i =1
x2 =
con lo que B = 8'6875 2'9475 Con los datos anteriores, los coeficientes de variacin de las respectivas series son:
C var A = A 2'8284 = 100 = 56'57 % 5 xA C var B = B 2'9475 = 100 = 56'14 % 5'25 xB
Por tanto, la segunda serie es algo menos dispersa que la primera (aunque tenga mayor desviacin tpica).
Matemticas 4o ESO (Opcin B) Parmetros estadsticos
11
www.matesxronda.net
Ejemplo.-
Analicemos los parmetros de dispersin de las distribuciones estadsticas vistas anteriormente relativas a las calificaciones de los cursos 3 A y 3 B.
Distribucin estadstica de 3 B
xi 0 1 2 3 4 5 6 7 8 9 10 Total
k
ni 4 3 4 1 1 3 3 1 1 3 6 30
nixi 0 3 8 3 4 15 18 7 8 27 60 153
| xi x |
ni | x i x |
( xi x )2
ni ( x i x ) 2
51 41 31 21 11 01 09 19 29 39 49
2601 1681 961 441 121 001 081 361 841 1521 2401
10404 5043 3844 441 121 003 243 361 841 4563 14406 4027
xB =
i =1
ni xi
N
k
2 B =
i =1
ni ( xi x )
N
2
402' 7 = 13' 42 30
RB = 10 0 = 10 puntos
dm B =
i =1
ni | xi x |
N
Distribucin estadstica de 3 A
xi 1 2 3 4 5 6 7 8 9 Total
k
ni 1 2 3 4 10 4 2 3 1 30
nixi 1 4 9 16 50 24 14 24 9 151
| xi x |
ni | x i x |
ni x i2
403 606 609 412 030 388 394 891 397 4130
xA =
i =1
ni xi
N
k
2 A =
n x
i =1
2 i i
N
2
x2 =
RA = 9 1 = 8 puntos
dm A =
i =1
ni | x i x |
N
www.matesxronda.net
Conclusiones: Parmetros de dispersin Rango Desviacin media Desviacin tpica Coeficiente de variacin 8 138 189 3757 % 3 A 3 B 10 324 366 7176 %
Como podemos apreciar, todos los parmetros de dispersin del grupo 3 A son menores que los del grupo 3 B, incluido el coeficiente de variacin. Por tanto, podemos afirmar rotundamente que la distribucin estadstica del grupo 3 A es menos dispersa que la de 3 B.
EJERCICIOS
9. Las calificaciones de Juan en seis pruebas fueron: 87, 64, 92, 86, 69 y 71. Halla la media, la mediana y todos los parmetros de dispersin. 10. Fjate que para hallar la varianza hay que elevar al cuadrado las desviaciones respecto a la media; por ello, la varianza no se expresa en las mismas unidades que los datos. De manera que si los datos se expresan en metros, en qu unidades se expresar la varianza? Y la desviacin tpica y el coeficiente de variacin? 11. Los siguientes datos son calificaciones obtenidas en cierto examen de Lengua. 2, 5, 3, 4, 7, 9, 5, 2, 7, 4, 8, 3, 5, 8, 7, 9, 3, 2, 4, 1, 10, 9, 4, 8, 6, 9, 3, 3, 7, 1, 2, 8, 6, 7, 3, 6, 4, 7, 4, 8, 2, 3, 7, 5, 4, 6, 7, 5, 6, 7, 8, 4, 3, 7, 5, 6, 9, 5, 7, 2 a) Elabora una tabla en la que aparezcan las diferentes frecuencias simples. b) Calcula los parmetros de centralizacin de las calificaciones. c) Calcula todos los parmetros de dispersin. 12. En la fabricacin de cierto tipo de bombillas se han detectado algunas defectuosas. Se han estudiado 200 lotes de 500 piezas cada uno, obtenindose los datos de la tabla adjunta. Defectuosas N de lotes 1 5 2 15 3 38 4 42 5 49 6 32 7 17 8 2
Calcula los parmetros de centralizacin y de dispersin. 13. En un hospital se quiere estimar el peso de los nios recin nacidos. Para ello se seleccionan, de forma aleatoria, 100 de stos, obtenindose los siguientes resultados. Peso (kg) N de nios [1, 15) 1 [15, 2) 2 [2, 25) 5 [25, 3) 20 [3, 35) 40 [35, 4) 26 [4, 45) 5 [45, 5] 1
a) Calcula los pesos medio, mediano y moda de la distribucin anterior. b) Determina el rango, la desviacin media y la desviacin tpica de la variable. 14. Si has realizado los ejercicios 12 y 13 anteriores podrs comprobar que las desviaciones tpicas son, respectivamente, 15254 y 05679. Cul de las dos distribuciones es menos dispersa? 15. Si a los nmeros 10, 12, 14, 16, 18 y 20, los multiplicamos por 4 se obtiene 40, 48, 56, 64, 72 y 80. Qu puedes decir de las medias, las varianzas y las desviaciones tpicas de ambas series estadsticas? 16. Si a los nmeros 10, 12, 14, 16, 18 y 20, les sumamos 9 se obtiene 19, 21, 23, 25, 27 y 29. Compara las medias, las varianzas y las desviaciones tpicas de ambas series estadsticas.
Parmetros estadsticos
13
www.matesxronda.net
Histograma simtrico
La representacin grfica simtrica ms conocida es la campana de Gauss, que corresponde a una distribucin normal llamada as porque muchos fenmenos se distribuyen de esta manera. El punto ms alto corresponde a la media aritmtica, siendo los valores centrales ms frecuentes que los alejados, cuya frecuencia disminuye. La media aritmtica y la desviacin tpica son los parmetros estadsticos ms utilizados. En toda distribucin estadstica, el estudio del comportamiento conjunto de estos parmetros nos aporta numerosa informacin sobre la distribucin de frecuencias estudiada. Que la campana se encuentre ms o menos aplastada depende del valor de la desviacin tpica . Cuando la campana es muy puntiaguda es porque hay poca dispersin, y cuando est muy aplastada la dispersin es mucho mayor. Teorema de Chebyshev En una distribucin normal se considera que el 100 % de los datos es el rea comprendida en la campana.
En el intervalo ( x , x + ) se encuentra el 6826 % del total de los datos. En el intervalo ( x 2, x + 2) se encuentra el 9544 % del total de los datos. En el intervalo ( x 3, x + 3) se encuentra el 9973 % del total de los datos.
Ejemplo.-
La siguiente tabla refleja la estatura, en centmetros, de 33 alumnos. Talla (cm) [151, 157) [157, 163) [163, 169) [169, 175) [175, 181] Total xi 154 160 166 172 178 ni 2 5 13 9 4 33 nixi 308 800 2.158 1.548 712 5.526
ni x i2
Parmetros estadsticos
14
www.matesxronda.net
Observando el histograma y polgono de frecuencias observamos que la distribucin es unimodal y bastante simtrica. Calculamos la media y la desviacin tpica:
i =1
x=
ni xi
N
k
=
2
=
2
i =1
ni xi
N
x2 =
En el intervalo ( x , x + ) = (16118, 17372) hay 13 + 9 = 22 individuos, que representan al 6667 % de los datos. En el intervalo ( x 2, x + 2) = (15491, 17999) hay 5 + 13 + 9 + 4 = 31 individuos, que representan al 9394 % de los datos. En el intervalo ( x 3, x + 3) = (14864, 18626) estn los 33 individuos, que representan lgicamente al 100 % de los datos.
Los resultados del ejemplo anterior se dan de forma parecida en distribuciones estadsticas bastante simtricas respecto de un valor central de la variable estadstica. Decimos que estas distribuciones tienen un comportamiento normal.
Ejemplo.-
Cierto Ayuntamiento va a construir un parque y quiere contar con la opinin de los vecinos. A una muestra de stos se les ha preguntado sobre el grado de aceptacin del proyecto y los resultados han sido: Aceptacin (xi) Frecuencia (ni) 1 1 2 3 3 15 4 25 5 30 6 24 7 16 8 2 9 1
El ayuntamiento se pregunta por el comportamiento normal de las respuestas, por lo que debemos hallar el nmero de casos que hay en cada intervalo ( x , x + ), ( x 2, x + 2) y ( x 3, x + 3). xi 1 2 3 4 5 6 7 8 9 Total ni 1 3 15 25 30 24 16 2 1 117 nixi 1 6 45 100 150 144 112 16 9 583
ni x i2
x=
n x
i =1
i i
N
k
n x
i =1
2 i i
x2 =
En el primer intervalo (3521, 6445) hay 25 + 30 + 24 = 79 casos, que suponen el 6752 % del total. En el segundo intervalo (2059, 7907) hay 15 + 25 + 30 + 24 + 16 = 110 casos, esto es, el 9402 % del total. En el tercer intervalo (0597, 9369) hay 117 casos, que suponen el 100 % del total.
Se observa que los porcentajes obtenidos se corresponden, aproximadamente, con lo que hemos denominado como comportamiento normal.
Parmetros estadsticos
15
www.matesxronda.net
Ejemplo.-
En una consulta mdica se ha medido durante una jornada la frecuencia cardiaca de 80 personas, en latidos por minuto, y se han obtenido los resultados recogidos en la tabla. Estudia el comportamiento normal de esta distribucin estadstica. Intervalo xi ni [40, 55) 475 2 [55, 70) 625 11 [70, 85) 775 25 [85, 100) 925 27 [100, 115) 1075 12 [115, 130] 1225 3
Representamos el polgono de frecuencias correspondiente a la distribucin estadstica latidos por minuto, el cual presenta bastante simetra.
En el intervalo ( x , x + ) = (6954, 10234) hay 25 + 27 = 52 individuos, que representan al 65 % del total. En el intervalo ( x 2, x + 2) = (5314, 11874) hay 11 + 25 + 27 + 12 = 75 individuos, que representan al 9375 % del total. Por ltimo, en el intervalo ( x 3, x + 3) = (3674, 13514) se encuentran 80 que, lgicamente, son el 100 %.
Los porcentajes obtenidos nos indican que esta distribucin estadstica tiene, en buena medida, un comportamiento normal.
Parmetros estadsticos
16
www.matesxronda.net
EJERCICIOS
17. En una distribucin intervienen 600 personas. Se sabe que es unimodal y bastante simtrica. Se tiene que la media aritmtica es 50 y la desviacin tpica es 7. Cuntas personas se distribuirn en el intervalo (43, 57)? 18. En el grfico estn representadas las distribuciones de la variable estadstica talla (en centmetros) de dos equipos A y B de baloncesto. Uno de los equipos tiene xA = 199 y A = 4; el otro xB = 1935 y B = 45.
a) Asocia cada uno de estos grficos al equipo correspondiente. Raznalo. b) Un nuevo jugador con una talla de 205 cm, en cul de los dos equipos sera ms alto?
19. Se desea comparar la duracin de dos marcas de lmparas halgenas. Para ello, elegimos dos muestras, compuestas por 10 lmparas de cada una de las marcas. La duracin en semanas de cada una de ellas se refleja a continuacin. Marca A Marca B 23 22 26 29 24 24 32 27 28 30 26 29 22 25 25 27 20 22 21 30
a) Calcula la media y la desviacin tpica de las duraciones de cada marca de lmparas. b) Qu marca sera aconsejable elegir? Cul de las dos distribuciones tiene menor dispersin? 20. Una fbrica de yogures empaqueta stos en cajas de cien unidades cada una. Para probar la eficacia de la produccin se han analizado 80 cajas comprobando los yogures defectuosos que contiene cada una y se han obtenido los resultados de la tabla. N de yogures defectuosos N de cajas 0 40 1 15 2 10 3 9 4 3 5 2 6 1
Define cules son los individuos de esta muestra y la variable estadstica. Despus calcula para esta distribucin estadstica los parmetros de centralizacin y los parmetros de dispersin. Por ltimo, representa grficamente la distribucin y halla el nmero de cajas que estn en los intervalos ( x , x + ), ( x 2, x + 2) y ( x 3, x + 3). A la vista de los resultados, puede calificarse la distribucin de normal? 21. El presupuesto del Insalud, por Comunidades Autnomas y en miles de millones de pesetas, del ao 1992 fue el siguiente. Comunidad Presupuesto Catalua 379 Navarra 29 Andaluca 417 Galicia 146 C. Valenciana 243 Pas Vasco 132 Gestin directa 1.040
a) Construye el diagrama de sectores correspondiente a esta distribucin de frecuencias. b) Qu datos de los anteriores se encuentran en el intervalo ( x , x + )? 22. Durante el mes de julio, en una determinada ciudad, se han registrado las siguientes temperaturas mximas. 32, 31, 28, 29, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33 a) Halla los parmetros de centralizacin. b) Calcula el rango y la desviacin tpica. c) Comprueba si en el intervalo ( x 2, x + 2) se encuentra aproximadamente el 9544 % de los datos. 23. De una muestra de 75 pilas elctricas, se han obtenido los datos de la tabla adjunta sobre su duracin en horas. Duracin (horas) N de pilas [25, 30) 3 [30, 35) 5 [35, 40) 21 [40, 45) 28 [45, 50) 12 [50 ,55] 6
a) Realiza la representacin grfica de la distribucin. b) Calcula la media y la desviacin tpica. c) Qu porcentaje de pilas tienen su duracin comprendida en los intervalos ( x , x + ), ( x 2, x + 2) y ( x 3, x + 3)? Puede considerarse que la distribucin tiene un comportamiento normal?
Matemticas 4o ESO (Opcin B) Parmetros estadsticos
17
www.matesxronda.net
5. CLCULO ESTADSTICO
5.1. Estadstica y calculadora
Recordamos, una vez ms, que cada modelo de calculadora tiene una forma particular de actuacin, tanto en la introduccin de datos y operaciones como en la realizacin de los clculos. Por ello, se debe consultar y leer con atencin el manual de instrucciones. La mayora de las calculadoras tiene funciones estadsticas y en estos casos en el teclado figuran los smbolos:
D
n
i
E
n x
i i i
F
|x x |
i
G
n |x x |
i
H
x2
i i
I
n x2
i
Puntuaciones 38 44 50 56 62 68 74 44 50 56 62 68 74 80
41 47 53 59 65 71 77 Total
59,1364 42 7,2614
puntos
Parmetros estadsticos
18
www.matesxronda.net
1. La temperatura que ha marcado un termmetro en los diferentes das de la semana, ha sido (en grados centgrados) los que pueden verse en la tabla. Lunes Mnima Mxima 4 19 Martes Mircoles Jueves 1 13 Viernes 4 12 Sbado 0 14 Domingo 3 22
2 18
3 21
a) Calcula la temperatura media mnima. b) Calcula la temperatura media mxima. c) Calcula la media de las oscilaciones extremas diarias. Solucin.i =1 N N
a) xmnima =
xi
N
i =1
b) xmxima =
xi
N
c) Hallemos las oscilaciones extremas diarias, es decir, la diferencia entre la mxima y la mnima diaria. Lunes Oscilaciones 15 Martes 20 Mircoles 24 Jueves 12 Viernes 8 Sbado 14 Domingo 19
15 + 20 + 24 + 12 + 8 + 14 + 19 112 = = 16 grados centgrados. 7 7 Observa que xoscilaciones = xmxima xmnima = 17 1 = 16 grados centgrados. xoscilaciones =
i =1
xi
N
2. Dada la distribucin estadstica siguiente: 3, 2, 5, 7, 6, 4, 2, 1, 9, 5, 7, 6, 4. Calcula la media aritmtica, la moda, la mediana y los cuartiles. Solucin.Ordenemos los 13 datos de forma creciente: 1, 2, 2, 3, 4, 4, 5, 5, 6, 6, 7, 7, 9. Tenemos entonces:
i =1 N
x=
xi
N
1 + 2 + 2 + 3 + 4 + 4 + 5 + 5 + 6 + 6 + 7 + 7 + 9 61 = = 4'6923 13 13
Parmetros estadsticos
19
www.matesxronda.net
3. Halla la media, la mediana, la moda y los cuartiles de la distribucin cuya tabla de frecuencias es la siguiente. xi ni Solucin.xi 3 6 7 8 10 12 Total ni 6 9 7 8 17 13 60 Ni 6 15 22 30 47 60 nixi 18 54 49 64 170 156 511
x=
3 6
6 9
7 7
8 8
10 17
12 13
n x
i =1
i i
511 = 8'52 60
Se trata de una distribucin unimodal, siendo Mo = 10 N/4 = 15; precisamente el valor x = 6 de la variable tiene por frecuencia absoluta acumulada 15, por lo que el primer cuartil es Q1 = (6 + 7)/2 = 65 De forma anloga, N/2 = 30 Me = Q2 = (8 + 10)/2 = 9 3N/4 = 45 luego Q3 =10, por ser ste el primer valor de la variable cuya frecuencia absoluta acumulada, 47, es mayor que las tres cuartas partes del nmero total de datos.
4. Las edades de los componentes de una pea de aficionados al ftbol son: 18, 16, 21, 20, 18, 16, 21, 18, 21, 18, 20, 19, 36, 24, 18, 20, 18, 19, 20 a) Calcula la edad media, la edad moda y la edad mediana, as como los cuartiles. b) Representa grficamente los datos de esta distribucin. Solucin.a) Construyamos la correspondiente tabla de frecuencias: xi 16 18 19 20 21 24 36 Total ni 2 6 2 4 3 1 1 19 Ni 2 8 10 14 17 18 19 nixi 32 108 38 80 63 24 36 381
x=
i =1
ni xi
N
La edad moda es Mo = 18 (distribucin unimodal) ya que es la edad que tienen un mayor nmero de componentes. N/2 = 95 la edad mediana es Me = Q2 = 19 (primer valor de la variable cuya frecuencia absoluta acumulada, 10, es mayor que la mitad del nmero de individuos). N/4 = 475 Q1 = 18 ; 3N/4 = 1425 Q3 = 21
Parmetros estadsticos
20
www.matesxronda.net
5. La siguiente tabla muestra la distribucin, a lo largo de un mes, del nmero de camiones que circulan diariamente por un cruce de carreteras. N de camiones por da N de das [350, 400) 2 [400, 450) 5 [450, 500) 11 [500, 550) 9 [550, 600] 4
Calcula la media, la moda, la mediana y los cuartiles de esta distribucin. Solucin.N de camiones [350, 400) [400, 450) [450, 500) [500, 550) [550, 600] Total xi 375 425 475 525 575 ni 2 5 11 9 4 31 Ni 2 7 18 27 31 nixi 750 2.125 5.225 4.725 2.300 15.125
El valor de la media es x =
i =1
ni xi
N
El intervalo modal es [450, 500), siendo 475 camiones por da el valor aproximado de la moda. Su valor exacto es:
Mo = ei + nMo nMo 1 11 5 50 = 450 + 37'5 = 487'5 camiones por da. a = 450 + (11 5) + (11 9) (nMo nMo 1 ) + (nMo nMo +1 )
N/4 = 775, luego el intervalo correspondiente al primer cuartil es [450, 500); el valor aproximado del primer cuartil es 475 camiones por da. Hallamos su valor exacto:
N 31 N Q1 1 7 Q1 = ei + 4 a = 450 + 4 50 = 450 + 3'41 = 453'41 camiones por da. nQ1 11
Tambin [450, 500) es el intervalo o clase mediana, ya que es el primer intervalo cuya frecuencia absoluta acumulada, 18, sobrepasa a la mitad del nmero de individuos, N/2 = 155; el valor aproximado de la mediana es 475 camiones por da. Hallamos, no obstante, la mediana exacta de la distribucin:
N 31 N Me 1 7 2 Me = Q2 = ei + a = 450 + 2 50 = 450 + 38'64 = 488'64 camiones por da. nMe 11
3N/4 = 2325, luego [500, 550) es el intervalo correspondiente al tercer cuartil; el valor aproximado de ste es 525 camiones por da. Hallamos su valor exacto:
3N 3 31 N Q3 1 18 Q3 = ei + 4 a = 500 + 4 50 = 500 + 29'17 = 529'17 camiones por da. nQ3 9
Parmetros estadsticos
21
www.matesxronda.net
6. Las respuestas correctas a un test de 80 preguntas realizado por 600 personas son las que se recogen a continuacin. Respuestas N de personas [0, 10) 40 [10, 20) 60 [20, 30) 75 [30, 40) 90 [40, 50) 105 [50, 60) 85 [60, 70) 80 [70, 80] 65
Calcula el nmero medio de respuestas correctas, la moda y la mediana. Halla los cuartiles. Interpreta grficamente el clculo de la moda y de la mediana, y comprueba que la mediana es el punto del eje de abscisas que divide el histograma de frecuencias absolutas en dos partes de igual rea. Solucin.Respuestas [0, 10) [10, 20) [20, 30) [30, 40) [40, 50) [50, 60) [60, 70) [70, 80] Total xi 5 15 25 35 45 55 65 75 ni 40 60 75 90 105 85 80 65 600 Ni 40 100 175 265 370 455 535 600 nixi 200 900 1.875 3.150 4.725 4.675 5.200 4.875 25.600
i =1
ni xi
N
El intervalo modal es [40, 50) y 45 respuestas el valor aproximado de la moda. El valor exacto de la misma es:
Mo = ei + nMo nMo 1 150 105 90 10 = 40 + = 44'29 respuestas. a = 40 + 35 (105 90) + (105 85) (nMo nMo 1 ) + (nMo nMo +1 )
N/4 = 150, con lo que [20, 30) es el intervalo correspondiente al primer cuartil; el valor aproximado de ste es 25 respuestas. Hallamos su valor exacto:
600 N N Q1 1 100 500 4 Q1 = ei + a = 20 + 4 10 = 20 + = 26'67 respuestas. 75 nQ1 75
La clase mediana e [40, 50) pues es el primer intervalo cuya frecuencia absoluta acumulada, 370, sobrepasa a la mitad del nmero de individuos, N/2 = 300; el valor aproximado de la mediana es 45 respuestas, y el valor exacto es:
600 N N Me 1 265 350 Me = Q2 = ei + 2 a = 40 + 2 10 = 40 + = 43'33 respuestas. 105 nMe 105
3N/4 = 450, luego [50, 60) es el intervalo correspondiente al tercer cuartil; el valor aproximado de ste es 55 respuestas. Hallamos su valor exacto:
3 N 3 600 N Q3 1 370 800 4 Q3 = ei + a = 50 + 4 10 = 50 + = 59'41 respuestas. 85 nQ3 85
Parmetros estadsticos
22
www.matesxronda.net
Por ltimo, comprobemos que ambas zonas en que la mediana divide al histograma tienen igual rea: rea de la izquierda: rea de la derecha:
10 40 + 10 60 + 10 75 + 10 90 + 10 105 = 400 + 600 + 750 + 900 + 350 = 3.000 3
7. La media de x, 4x 3, x + 4, 16, 9 y x 5 es 4. Cunto vale la mediana de esta serie de nmeros? Solucin.A travs de la media hallamos el valor de x:
x= x + (4 x 3) + ( x + 4) + (16) + 9 + ( x 5) 7 x 11 =4 =4 x=5 6 6
La serie estadstica obtenida es: 5, 17, 9, 16, 9, 0. Para hallar la mediana ordenamos los datos: 16, 0, 5, 9, 9, 17 como hay dos valores centrales, 5 y 9, la mediana es Me = (5 + 9)/2 = 7. 8. La siguiente serie de datos: 18, 21, 24, a, 36, 37, b, est ordenada y tiene de mediana 30 y de media 32. Encuentra el valor de a y b. Solucin.El valor central a es la mediana 30, por tanto, a = Me = 30. Como la media es 32, obtenemos as el valor de b:
x = 32
166 + b 18 + 21 + 24 + 30 + 36 + 37 + b = 32 = 32 b = 58 7 7
Parmetros estadsticos
23
www.matesxronda.net
9. Las calificaciones de Juan en seis pruebas fueron: 87, 64, 92, 86, 69 y 71. Halla la media, la mediana y todos los parmetros de dispersin.
Solucin.-
Observa que son datos sin frecuencia o, equivalentemente, con frecuencia absoluta 1. Primeramente ordenamos los datos: 64, 69, 71, 86, 87, 92. Media: x =
i =1
xi
N
Como hay dos valores centrales, la mediana resulta ser Me = (71 + 86)/2 = 785 puntos Fcilmente, el rango es R = 92 64 = 28 puntos Calculamos la desviacin media:
N
dm = =
| x x |
i i =1
61 = 10'17 puntos 6
N
2 =
(x x)
i i =1
N 666'8334 = = 111'14 6
(64 78'17) 2 + (69 78'17) 2 + (71 78'17) 2 + (86 78'17) 2 + (87 78'17) 2 + (92 78'17) 2 = 6
2 =
x
i =1
2 i
x2 =
Hallamos la desviacin tpica: = 2 = 111'14 = 10'54 puntos Por ltimo, calculamos el coeficiente de variacin: Cvar =
10' 54 = 100 = 13'48 % x 78'17
No obstante, si te resulta muy engorrosa esta notacin, siempre puedes recurrir a organizar los datos en una tabla:
xi
| xi x |
( xi x )2
x i2
De esta forma:
i =1
64 69 71 86 87 92
Total
N
x=
xi
N
N
dm =
i =1
| xi x |
N
469
2
=
2
i =1
( xi x )
N
xi
Parmetros estadsticos
24
www.matesxronda.net
10. Fjate que para hallar la varianza hay que elevar al cuadrado las desviaciones respecto a la media; por ello, la varianza no se expresa en las mismas unidades que los datos. De manera que si los datos se expresan en metros, en qu unidades se expresar la varianza? Y la desviacin tpica y el coeficiente de variacin?
Solucin.-
Si los datos se expresan en metros, entonces la varianza se expresar en metros cuadrados. La desviacin tpica es la raz cuadrada de la varianza, por ello, sta vendr expresada en metros. La media aritmtica se expresa tambin en metros, al igual que la desviacin tpica, pero el coeficiente de variacin no se expresa en ninguna medida. 11. Los siguientes datos son calificaciones obtenidas en cierto examen de Lengua. 2, 5, 3, 4, 7, 9, 5, 2, 7, 4, 8, 3, 5, 8, 7, 9, 3, 2, 4, 1, 10, 9, 4, 8, 6, 9, 3, 3, 7, 1, 2, 8, 6, 7, 3, 6, 4, 7, 4, 8, 2, 3, 7, 5, 4, 6, 7, 5, 6, 7, 8, 4, 3, 7, 5, 6, 9, 5, 7, 2 a) Elabora una tabla en la que aparezcan las diferentes frecuencias simples. b) Calcula los parmetros de centralizacin de las calificaciones. c) Calcula todos los parmetros de dispersin.
Solucin.-
1 2 00333 333
2 6 01 10
3 8 01333 1333
4 8 01333 1333
5 7 01167 1167
6 6 01 10
7 11 01833 1833
8 6 01 10
9 5 00833 833
10 1 00167 167
Total 60 1 100
b) Aprovechamos la siguiente tabla, en la que aparecen tambin los clculos necesarios para el siguiente apartado. Nota: Hemos hallado los datos necesarios para calcular la varianza usando las dos expresiones estudiadas.
xi ni Ni nixi | x i x |
ni | x i x | ( x i x ) 2 ni ( x i x ) 2 x i2 ni x i2
1 2 3 4 5 6 7 8 9 10
2 6 8 8 7 6 11 6 5 1
2 8 16 24 31 37 48 54 59 60
2 12 24 32 35 36 77 48 45 10
321
4,35 3,35 2,35 1,35 0,35 0,65 1,65 2,65 3,65 4,65
870 2010 1880 1080 245 390 1815 1590 1825 465
12170
189225 112225 55225 18225 01225 04225 27225 70225 133225 216225
378450 673350 441800 145800 08575 25350 299475 421350 666125 216225
3276500
1 4 9 16 25 36 49 64 81 100
Total 60
Media: x =
i =1
ni xi
N
Moda: Mo = 7 puntos ;
Desviacin media: d m =
ni | xi x |
N
Parmetros estadsticos
25
www.matesxronda.net
Varianza: 2 =
i =1
ni ( xi x )
N
i =1
ni xi
N
x2 =
12. En la fabricacin de cierto tipo de bombillas se han detectado algunas defectuosas. Se han estudiado 200 lotes de 500 piezas cada uno, obtenindose los datos de la tabla adjunta.
Defectuosas N de lotes
1 5
2 15
3 38
4 42
5 49
6 32
7 17
8 2
1 2 3 4 5 6 7 8
5 15 38 42 49 32 17 2
Total 200
k
x=
i =1
ni xi
N
Desviacin media:
dm =
ni | xi x |
N
=
2
i =1
ni xi
N
x2 =
Cvar =
Parmetros estadsticos
26
www.matesxronda.net
13. En un hospital se quiere estimar el peso de los nios recin nacidos. Para ello se seleccionan, de forma aleatoria, 100 de stos, obtenindose los siguientes resultados.
Peso (kg) N de nios
[1, 15) 1
[15, 2) 2
[2, 25) 5
[25, 3) 20
[3, 35) 40
[35, 4) 26
[4, 45) 5
[45, 5] 1
a) Calcula los pesos medio, mediano y moda de la distribucin anterior. b) Determina el rango, la desviacin media y la desviacin tpica de la variable.
Solucin.Peso (kg) xi ni Ni nixi
ni | x i x | ni x i2
[1, 15) [15, 2) [2, 25) [25, 3) [3, 35) [35, 4) [4, 45) [45, 5]
1 1 2 3 5 8 20 28 40 68 26 94 5 99 1 100
Total 100
a) x =
i =1
ni xi
N
N/2 = 50 [3, 35) es el intervalo mediano, siendo 325 el peso mediano aproximado. El valor exacto del peso mediano es: 100 N N Me 1 28 11 Me = ei + 2 a = 3+ 2 0'5 = 3 + = 3'275 kg. nMe 40 40 [3, 35) es tambin el intervalo modal, y 325 el valor aproximado de la moda. Su valor exacto es:
Mo = ei + nMo nMo 1 40 20 10 a = 3+ 0'5 = 3 + = 3'294 kg. (nMo nMo 1 ) + (nMo nMo +1 ) (40 20) + (40 26) 34
b) R = 5 1 = 4 kg.
i =1
dm =
ni | xi x |
N
2 =
i =1
ni xi
N
x2 =
14. Si has realizado los ejercicios 12 y 13 anteriores podrs comprobar que las desviaciones tpicas son, respectivamente, 15254 y 05679. Cul de las dos distribuciones es menos dispersa?
Solucin.-
Para comparar las dispersiones de dos variables estadsticas de diferente media o de diferente naturaleza se utiliza el coeficiente de variacin. En los ejercicios anteriores tenemos que: Cvar(12) = 3432 % y Cvar(13) = 1750 %, por lo que la distribucin del ejercicio 13 es menos dispersa.
Parmetros estadsticos
27
www.matesxronda.net
15. Si a los nmeros 10, 12, 14, 16, 18 y 20, los multiplicamos por 4 se obtiene 40, 48, 56, 64, 72 y 80. Qu puedes decir de las medias, las varianzas y las desviaciones tpicas de ambas series estadsticas?
Solucin.-
Serie B xi
x i2
10 12 14 16 18 20
Total 90
40 48 56 64 72 80
360
Serie A:
90 xA = i =1 = = 15 N 6 360 xB = i =1 = = 60 N 6
xi
2 A
i =1
xi
N
2 2 xA =
A = 2 A =
35 3
560 3
xi
Serie B:
2 B
i =1
xi
N
2 2 xB =
B = 2 B =
xB = 60 = 4 15 = 4 xA xB = 4 xA
2 B = B =
560 35 35 2 2 2 = 16 = 42 = 42 2 A B = 4 A 3 3 3
560 = 3 4 2 35 35 =4 = 4 A B = 4 A 3 3
16. Si a los nmeros 10, 12, 14, 16, 18 y 20, les sumamos 9 se obtiene 19, 21, 23, 25, 27 y 29. Compara las medias, las varianzas y las desviaciones tpicas de ambas series estadsticas.
Solucin.-
Calculamos los parmetros de la segunda serie (los de la primera figuran en el ejercicio anterior):
Serie C xi
x i2
N
19 21 23 25 27 29
Total 144
xC =
i =1
xi
N
=
2
144 = 24 6 3.526 35 24 2 = 6 3
2 C
i =1
xi
N
2 xC =
2 C = C =
35 3
Parmetros estadsticos
28
www.matesxronda.net
17. En una distribucin intervienen 600 personas. Se sabe que es unimodal y bastante simtrica. Se tiene que la media aritmtica es 50 y la desviacin tpica es 7. Cuntas personas se distribuirn en el intervalo (43, 57)?
Solucin.-
Por ser la distribucin unimodal y bastante simtrica tendr un comportamiento normal, de ah que en el intervalo (43, 57) = ( x , x + ) se encuentre aproximadamente el 6826 % del total de individuos, esto es, unas 410 personas. 18. En el grfico estn representadas las distribuciones de la variable estadstica talla (en centmetros) de dos equipos A y B de baloncesto. Uno de los equipos tiene xA = 199 y A = 4; el otro xB = 1935 y B = 45.
a) Asocia cada uno de estos grficos al equipo correspondiente. Raznalo. b) Un nuevo jugador con una talla de 205 cm, en cul de los dos equipos sera ms alto?
Solucin.-
a) El primer histograma se asocia al equipo A, pues los datos estn ms agrupados en torno al intervalo (198, 204) que contiene a la media xA = 199 y la desviacin tpica A = 4 es menor. b) Para hacer la comparacin debemos normalizar la altura del jugador en ambos equipos; as, para x = 205 cm tenemos: 205 193'5 205 199 zB = = 2'55 zA = = 1'5 4'5 4 Por tanto, este jugador se considerara ms alto en el equipo B. 19. Se desea comparar la duracin de dos marcas de lmparas halgenas. Para ello, elegimos dos muestras, compuestas por 10 lmparas de cada una de las marcas. La duracin en semanas de cada una de ellas se refleja a continuacin.
Marca A Marca B
23 22
26 29
24 24
32 27
28 30
26 29
22 25
25 27
20 22
21 30
a) Calcula la media y la desviacin tpica de las duraciones de cada marca de lmparas. b) Qu marca sera aconsejable elegir? Cul de los dos distribuciones tiene menor dispersin?
Solucin.-
Marca B xi
x i2
23 26 24 32 28 26 22 25 20 21
Total 247
529 676 576 1.024 784 676 484 625 400 441
6.215 Total
22 29 24 27 30 29 25 27 22 30
265
484 841 576 729 900 841 625 729 484 900
7.109
Parmetros estadsticos
29
www.matesxronda.net
Marca A:
xi
A =
i =1
xi
N
2 2 xA =
Marca B:
xi
B =
i =1
xi
N
2 2 xA =
b) Lgicamente es aconsejable elegir la marca B, pues tiene una duracin media mayor (265 semanas) y menor desviacin tpica variabilidad respecto de la media (294 semanas). Para comparar la dispersin de las distribuciones hallamos sus coeficientes de variacin:
C var A = A 3'38 = 100 = 13'68 % x A 24'7 C var B = B 2'94 = 100 = 11'09 % x B 26'5
Como vemos, segn los coeficientes de variacin, la distribucin de la marca B tiene menor dispersin. 20. Una fbrica de yogures empaqueta stos en cajas de cien unidades cada una. Para probar la eficacia de la produccin se han analizado 80 cajas comprobando los yogures defectuosos que contiene cada una y se han obtenido los resultados de la tabla.
N de yogures defectuosos N de cajas
0 40
1 15
2 10
3 9
4 3
5 2
6 1
Define cules son los individuos de esta muestra y la variable estadstica. Despus calcula para esta distribucin estadstica los parmetros de centralizacin y los parmetros de dispersin. Por ltimo, representa grficamente la distribucin y halla el nmero de cajas que estn en los intervalos ( x , x + ), ( x 2, x + 2) y ( x 3, x + 3). A la vista de los resultados, puede calificarse la distribucin de normal?
Solucin.-
Los individuos de esta muestra son cajas de cien unidades de yogures, siendo la variable estadstica el nmero de yogures defectuosos que contiene cada caja. Hallemos los parmetros de centralizacin y de dispersin:
xi ni Ni nixi ni | x i x |
ni x i2
Parmetros de centralizacin:
i =1
0 1 2 3 4 5 6
40 15 10 9 3 2 1
40 55 65 74 77 79 80
0 15 20 27 12 10 6
90
0 15 40 81 48 50 36
270
x=
ni xi
N
90 = 1'125 yogures 80
Total 80
Parmetros de dispersin:
R = 6 0 = 6 yogures;
dm =
i =1
ni | xi x |
N
=
2
i =1
ni xi
N
x2 =
Cvar =
Parmetros estadsticos
30
www.matesxronda.net
En el intervalo ( x , x + ) = (0325, 2575) hay 40 + 15 + 10 = 65 cajas, el 8125 % del total. En el intervalo ( x 2, x + 2) = (1775, 4025) hay 40 + 15 + 10 + 9 + 3 = 77 cajas, el 9625 % del total. En el intervalo ( x 3, x + 3) = (3225, 5475) hay 40 + 15 + 10 + 9 + 3 + 2 = 79 cajas, el 9875 % del total. En base a los porcentajes obtenidos, principalmente en el intervalo ( x , x + ), no se puede decir que la distribucin tenga un comportamiento normal. Observa tambin que la distribucin no es, en absoluto, simtrica respecto de ningn valor central de la variable estadstica ( x = 1125, Mo = 0 y Me = 05). 21. El presupuesto del Insalud, por Comunidades Autnomas y en miles de millones de pesetas, del ao 1992 fue el siguiente.
Comunidad Presupuesto
Catalua 379
Navarra 29
Andaluca 417
Galicia 146
C. Valenciana 243
a) Construye el diagrama de sectores correspondiente a esta distribucin de frecuencias. b) Qu datos de los anteriores se encuentran en el intervalo ( x , x + )?
Solucin.-
a) Calculamos la amplitud y el porcentaje sobre el total para cada Comunidad Autnoma y completamos la tabla con los datos para el clculo de los parmetros del apartado b.
Comunidad Presupuesto Amplitud %
x i2
x=
xi
N
31
www.matesxronda.net
i =1
xi
N
x2 =
En el intervalo ( x , x + ) = (2816, 65356) se encuentran los presupuestos de todas las Comunidades Autnomas anteriores, lo que supone un total de 379 + 29 + 417 + 146 + 243 + 132 = 1.346 miles de millones de pesetas, esto es, un 5641 % del presupuesto total. 22. Durante el mes de julio, en una determinada ciudad, se han registrado las siguientes temperaturas mximas. 32, 31, 28, 29, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33 a) Halla los parmetros de centralizacin. b) Calcula el rango y la desviacin tpica. c) Comprueba si en el intervalo ( x 2, x + 2) se encuentra aproximadamente el 9544 % de los datos.
Solucin.-
27 28 29 30 31 32 33 34
1 2 6 7 8 3 3 1
1 27 729 3 56 784 9 174 841 16 210 900 24 248 961 27 96 1.024 30 99 1.089 31 34 1.156
944
Total 31
i =1
ni xi
N
944 = 30'45 C 31
Desviacin tpica: =
i =1
ni xi
N
x2 =
c) En el intervalo ( x 2, x + 2) = (2725, 3365) hay 2 + 6 + 7 + 8 + 3 + 3 = 29 datos, esto supone un 9355 % del total de los datos.
Parmetros estadsticos
32
www.matesxronda.net
23. De una muestra de 75 pilas elctricas, se han obtenido los datos de la tabla adjunta sobre su duracin en horas.
Duracin (horas) N de pilas
[25, 30) 3
[30, 35) 5
[35, 40) 21
[40, 45) 28
[45, 50) 12
[50 ,55] 6
a) Realiza la representacin grfica de la distribucin. b) Calcula la media y la desviacin tpica. c) Qu porcentaje de pilas tienen su duracin comprendida en los intervalos ( x , x + ), ( x 2, x + 2) y ( x 3, x + 3)? Puede considerarse que la distribucin tiene un comportamiento normal?
Solucin.-
[25, 30) [30, 35) [35, 40) [40, 45) [45, 50) [50, 55]
Total
275 3 825 325 5 1625 375 21 7875 425 28 1.190 475 12 570 525 6 315
75 3.1075
x=
i =1
ni xi
N
i =1
ni xi
N
x2 =
c) En el intervalo ( x , x + ) = (3554, 4712) hay 21 + 28 = 49 pilas, un 6533 % del total. En el intervalo ( x 2, x + 2) = (2975, 5291) hay 5 + 21 + 28 + 12 + 6 = 72 pilas, un 96 % del total. En el intervalo ( x 3, x + 3) = (2396, 587) hay 75 pilas, lgicamente el 100 % del total. Teniendo en cuenta los anteriores porcentajes, si podemos afirmar que la distribucin tiene un comportamiento normal. Observa tambin en la representacin grfica anterior, que la distribucin es unimodal y el polgono de frecuencias es bastante simtrico respecto de la media (4143 horas).
Parmetros estadsticos
33