Apuntes de Estadistica - 2012

Calzada Benza, Jos (1982): Mtodos Estadsticos para la Investigacin, 5ta edicin.
APUNTES SOBRE ESTADISTICA APLICADA

4.7 COEFICIENTE DE VARIABILIDAD. No es posible comparar fcilmente las desviaciones estndar de diferentes poblaciones o muestras, siendo esto tanto ms difcil, si difieren por su naturaleza y la unidad de medida empleada (alturas, pesos, porcentajes. etc.). Es por esto, que para fines comparativos se acostumbra a expresar la desviacin estndar en porcentajes de sus respectivos promedios, en la forma siguiente:
CV =
s x 100 x
Aplicando esta ecuacin a la muestra del primer ejemplo de la seccin 4.5, (vase pgina 61) tenemos:
CV =
3 .3 x 100 = 13.8 % 24
Para saber si en una particular caracterstica o variable el valor obtenido del CV es muy alto, est dentro de lo normal o muy bajo, se requiere experiencia dentro de las condiciones del lugar en que se trabaja. El coeficiente de variabilidad es especialmente til cuando se desea comparar variabilidades de diferentes poblaciones o muestras. En tales casos, las desviaciones estndar no resultan un buen medio de comparacin, pues puede suceder que una muestra que tiene menos valor numrico en su s que otra, sea la de mayor coeficiente de variabilidad relativa. As por ejemplo, dos muestras de medidas de largo de mazorca de dos variedades de maz pueden dar los siguientes resultados:
x = 7 cm. x = 12 cm.
s = 2.10 cm. s = 2.40 cm.
CV = 30 % CV = 20 %
En los experimentos de rendimientos agronmicos y ganaderos los coeficientes de variabilidad varan generalmente entre 9 y 29%, valores que exceden estos lmites pueden considerarse extremos. En cambio en las investigaciones de qumica los coeficientes son bastante ms bajos debido a que no estn afectados por tantos factores de variabilidad como los anteriores. Por igual razn los experimentos en los que se analizan datos de calidad o de caractersticas son bajos (4 a 8%), por ejemplo largo de mazorca, porcentaje de fibra en algodn, etc. Critica contra el coeficiente de variabilidad: Pongamos un ejemplo, supongamos que hemos sometido a un grupo de estudiantes de ingls a una prueba de vocabulario con 40 preguntas, obteniendo un promedio de respuestas de 25 con s = 5, el CV = 20. Pero supongamos que agregamos al examen 10 palabras muy fciles y por consiguiente muy conocidas por todos los estudiantes. El promedio de respuestas por alumno subir de 25 a 35, pero la s seguir siendo 5, esto hace caer el CV de 20 a 14, sin embargo los estudiantes son los mismos.
1 de 59
4.8
MODELO ADICTIVO LINEAL
4.9
DESVIACION ESTANDAR DE LOS PROMEDIOS ( x s)
De una poblacin infinita o finita pero muy grande es posible sacar un sinnmero de muestras diferentes, todas de igual tamao, y cada una con su propio promedio. Estos promedios ( x s) formaran una distribucin de frecuencia con la forma de una curva normal. Esta curva normal sera ms homognea que la curva normal de la poblacin de X's de donde provienen las muestras; tanto ms homognea (curva ms angosta y parada), cuanto mayor sea n de las muestras. Como ejemplo consideremos que tenemos una poblacin hipottica de N = 5, de la cual extraemos todas las muestras diferentes posibles de n = 2. El nmero de tales muestras, es el nmero de combinaciones de N elementos tomados de 2 en 2, este nmero est dado por:
NC n
N! n!( N n)!
5! 5 x4 x3 x 2 x1 = = 10 2!(5 2)! 2 x1(3 x 2 x1)
A continuacin se da la poblacin original (hipottica), las 10 muestras y los promedios de estas muestras: Poblacin original (Xi) A: 1 B: 30 C: 32 D: 12 E: 29 Diez muestras diferentes de n=2 A, B 1, 30 A, C A, D A, E B, C B, D B, E C, D C, E D, E 1, 32 1, 12 1, 29 30, 32 30, 12 30, 29 32, 12 32, 29 12, 29 Poblacin de promedios de las muestras de n = 2 15.5 16.5 6.5 15.0 31.0 21.0 29.5 22.0 30.5 20.5
= 104
= 20.8
= 208.0
= 20.8
Ntese en primer lugar que el promedio de la poblacin original y el de la poblacin derivada son iguales, esto = = 20.8. Ntese tambin que la variabilidad de la poblacin derivada es menor que la de la poblacin original. Hallemos el valor de de la poblacin original, esto es:
=
12 + 30 2 + ..... + 29 2 (104) 2 / 5 = 12.221 5
2 de 59
A continuacin con la misma formula calcularemos de la poblacin de promedios, a la que por ser de promedios representamos por x ; esto es:
15.5 2 + 16.5 2 + ..... + 20.5 2 (208) 2 / 10 = 7.48 10
Esta desviacin estndar de los promedios tambin puede ser deducida a base de de la poblacin original con la formula que se da a continuacin, que se emplea para poblaciones finitas relativamente pequeas.
N n N 1 52 = (8.64) (0.866) = 7.48 51
(4.9.1)
As sustituyendo valores en la formula con los de nuestro ejemplo, tenemos:
12.221 2
Ntese que es el mismo resultado que hemos tenido anteriormente para x El factor de
( N n) /( N 1) de la formula anterior se denomina fraccin de muestreo, y
slo tiene importancia cuando el tamao de la poblacin original es relativamente pequeo y el tamao de la muestra es relativamente grande (caso de nuestro ejemplo), pero en los casos frecuentes de poblaciones grandes y muestras chicas, este factor prcticamente se convierte en uno; as por ejemplo, si N = 100,000 y n = 100, tenemos
(100,000 100) /(100,00 1) = 0.998
Es por esto que la formula anterior usualmente se simplifica, tal como se ve a continuacin:
2
n
(4.9.2)
Como regla general de trabajo diremos que la fraccin de muestreo debe omitirse de la formula, cuando el tamao de muestra (n) es menor del 10% del tamao de la poblacin (N). Como en la prctica de la poblacin original es estimada por s de la muestra, entonces las formulas (4.9.1) y (4.9.2) se transforman en las formulas siguientes:
sx = sx =
s n s n
N n N 1 s2 n
(4.9.3)
(4.9.4)
4.10 DESVIACION ESTANDAR DE LAS DIFERENCIAS DE LOS PROMEDIOS ( d s)
Consideremos que tenemos dos poblaciones originales A y B y que extraemos una muestra n1 y n2, si hallamos la diferencia entre los promedios x 1 y x 2 y la representamos por d , tenemos que este valor es una estimacin de la diferencia entre los promedios de las dos
poblaciones o sea A B = d . Si repetimos esta operacin de extraer pares de muestras,

3 de 59
encontraremos que hay diferencias entre las d s, lo que quiere decir que hay variabilidad
entre las d s. Siendo siempre n1 y n2 constantes, tendramos tal cantidad de valores de d que podramos considerar una distribucin de diferencias de promedios de muestras, cuya forma sera la de una curva normal si es que las poblaciones de A y B se ajustan a la curva normal.
Toda distribucin de diferencias tiene como promedio la diferencia entre los promedios de las poblaciones de donde provienen. A esta diferencia es a la que hemos representado por
d y como desviacin estndar d , a sta la denominamos desviacin estndar de

diferencias. El parmetro d es estimado por la medida estadstica s d , y su valor est basado en dos muestras extradas al azar de las poblaciones originales. La forma de calcular su valor cambia, dependiendo de: 1.- Si los tamaos de las muestras son iguales o no. 2.- Si las variancias de las poblaciones son homogneas o no ( 1 ) Segn esto se pueden presentar los casos A, B, C y D, siguientes: (A) Cuando las variancias son homogneas y n1 y n2 = n
sd =
s + s2 s2 2 ; siendo s2 = 1 n 2
2
= Variancia Comn
(B) Cuando las variancias son homogneas y n1 n2
sd =
(n 1) s1 + (n 2 1) s 2 s2 s2 ; siendo s2 = 1 + (n1 1) + (n 2 1) n1 n 2
2
= Variancia Comn
(C) Cuando las variancias no son homogneas y n1 y n2 = n
sd =
s1 s + 2 n n
(D) Cuando las variancias no son homogneas y n1 n2
sd =
s1 s + 2 n1 n2
4.11 CARACTERISTICAS DE LA DESVIACION ESTANDAR () 1.- La desviacin estndar es siempre un valor positivo. 2.- La desviacin estndar es influenciada por todos los valores de la muestra. 3.- Mayor influencia ejercen los valores extremos que los que estn prximos al promedio. Esto se debe a que todos los valores son elevados al cuadrado en la computacin de la desviacin estndar. 4.- Si en una distribucin de frecuencia ajustada a la curva normal de valores de X's, se
( 1 ) La prueba de homogeneidad de variancias se vera al tratar de la Distribucin de F. 4 de 59
levanta una ordenada a uno y otro lado de a una distancia igual a (desviacin estndar de la poblacin original), esto es , el 68.26 % de los valores de Xi quedan encerrados entre estos lmites. Entre 2, el 95.46 % quedan encerrados entre estos limites. Entre 3, el 99.73% quedan encerrados entre estos lmites.
Dib. (4.11.1) Limites y porcentajes del total de las Xs que quedan encerrados
5.- En forma similar sucede de que en una distribucin de frecuencia ajustada a la curva normal de valores de x s, si se levanta una ordenada a una y otro lado de x a una distancia igual a x (desviacin estndar de la poblacin de promedios de muestras), esto es x x , el 68.26 % de los valores de x i quedan encerrados entre estos lmites. Recurdese que x = Entre x 2 x , el 95.46 % quedan encerrados entre estos lmites. Entre x 3 x , el 99.73 % quedan encerrados entre estos lmites. 6.- Igualmente sucede que en una distribucin de frecuencia ajustada a la curva normal de valores de d's, si se levanta una ordenada a uno y otro lado de d a una distancia igual a d , (desviacin estndar de la poblacin de diferencias entre promedio de muestras), esto es d d , el 68.26 % de los valores de d i quedan encerrados entre estos
lmites. 4.12 DISTRIBUCION DE
PARA VALORES DE PROMEDIOS ( x s)
Si de una distribucin de valores de x 's se conoce y x se puede deducir un valor para cada valor x de esta distribucin, mediante la formula siguiente:
z= z
Aplicando esta frmula a cada valor de x , resultara una distribucin de valores de forma de la curva de la distribucin de distribucin de x de donde proviene. Ejemplo:
z' s. La
es igual a la forma de la curva normal de la
Si una distribucin de x est formada por promedios de muestras de alturas de alumnos de n = 9, con = 1.60 y = 0.10 m, resulta que x =
n = 0.10
9 = 0.033
Si en la distribucin de x 's hay digamos 2,000 muestras con promedios iguales a , esto
5 de 59
es iguales a 1.60 m., al aplicarles la frmula de iguales a
z , estos promedios cuyos darn 2,000 valores de z = 0. Esto es z = (1.60 -1.60) / 0.033 = 0.
valores son
Los valores de x que sean iguales a + x = 1.60 + 0.033 = 1.633, al transformarlos en valores de z todos dan z = 1. Esto es (1.633 - 1.600) / 0.033 = 1. Igualmente los valores de
x que sean iguales a x = 1.60 - 0.033 = 1.567, darn valores de z = 1.

De aqu que cualquiera que sea la distribucin de x (promedios de muestras de altura de alumnos o promedios de muestras de lechones, etc.), puede transformarse en la correspondiente distribucin de comunes: 1.- El promedio de cada una de estas distribuciones de z es z = 0 2.- La desviacin estndar de cada una de estas distribuciones de z es z = 1 3.- Entre
, todas las cuales tienen las siguientes caractersticas
= 0 1, se encuentra el 68.26 % de todos los valores de
de esta
distribucin. Entre z 2z = 0 2 se encuentra el 95.46 % de todos los valores de valores de z de esta distribucin. 4.13 DISTRIBUCION DE t PARA VALORES DE x s
de esta distribucin. Entre z 3z = 0 3 se encuentra el 99.73 % de todos los
En la prctica, de las distribuciones de x se desconoce x , por lo que este parmetro tiene que ser estimado en base de los datos de la muestra generalmente de tamao pequeo (n menor de 30), de la que se obtiene s , y de aqu se deduce s x = s valor que no es z sino t, luego la formula de la distribucin de t es: t =
n . El estadstico s x si
bien es un estimador de x , sin embargo no es igual. Es por esto que ( x ) / s x da un
x sx
En la misma forma que hemos visto anteriormente, aplicando esta frmula a cada valor de una distribucin x , resultan los valores de la distribucin de t correspondiente. La forma de la curva de la distribucin de t no es igual a la forma de la distribucin de x de donde proviene, (tal como hemos visto que sucede con la distribucin de la z). Es tanto ms baja y explayada cuanto menor es el tamao n de la muestra. Sin embargo, el promedio de cada una de estas distribuciones de t es 0 (esto es t = 0), pero en todas ellas 0 2 no encierran el 95.46 % de los valores de t. Para que quede encerrado este porcentaje, es preciso sustituir el 2 por un valor tabular que hay que buscar en la Tabla de t con los grados de libertad de la muestra, as si (n - 1) = 8, el valor tabular que le corresponde es 2.306, por consiguiente 0 2.306 da dos ordenadas dentro de las que se encuentra el 95.46 % de los valores de t de esta distribucin. La Tabla de t est al final del libro.
6 de 59
A continuacin se da el dibujo que incluye la distribucin normal de las x s y la curva de la distribucin de t que corresponde a muestras de (n - 1) = 8, y la curva de la distribucin de t que corresponde a (n - 1) = 4. A (n - 1) lo representamos en el Dibujo (4.13.1) por v.
Dib. (4.13.1) Curvas de las distribuciones de t que corresponden a (n - 1) = 8 y (n - 1) = 4.
Hemos visto que 2.306 es el valor de la ordenada de la distribucin de t para (n - 1) = 8 para encerrar 95.46 % o 0.9546 por uno, redondeando 0.95. En la prctica se acostumbra a indicar el porcentaje o tanto por uno que queda fuera de las ordenadas. As fuera de 0 2.306 queda 0.05 de la distribucin. Este valor que queda fuera se representa en forma general por la letra griega alfa (). 4.14 LIMITES DE CONFIANZA PARA
Teniendo en cuenta lo que hemos visto para la distribucin de t, sabemos que: Si extraemos una muestra de n = 9, o sea con 8 grados de libertad, de cualquier poblacin (altura de alumnos, dimetro de troncos, produccin de leche, etc.), hay 0.05 por uno o 5% de probabilidades de que dicha muestra d un valor de tg que est fuera de las ordenadas - t0.05 = - 2.306 y t0.05 = 2.306. Esto lo representamos simblicamente en la forma siguiente: P ( - t < -2.306; tg > 2.306) = 0.05
As tambin: P ( - 2.306 < tg < 2.306) = 0.95
Si sustituimos tg por su formula, tenemos: P ( - 2.306 < ( x - )/ s x De donde resulta: P ( - 2.306 s x < ( x - )
<
2.306)
0.95
<
2.306 s x ) =
0.95
7 de 59
P P
( - x - 2.306 s x ( x + 2.306 s x
< >
< - x + 2.306 s x ) > x - 2.306 s x )
= =
0.95 0.95
En forma simplificada: P ( l2 >
> l 1 ) = 0.95
De aqu que entre el l2 y l1 (o sea entre estos dos lmites) se encuentra el promedio de la poblacin original con 95 % de probabilidades. Para determinar estos lmites habra que sacar una muestra de n = 9, y deducir su x y su s x y sustituir estos valores en la ecuacin de estos limites. Para otros tamaos de muestra, 2.306 cambia, debiendo ser buscados los nuevos valores en la Tabla de t con los grados de libertad de la muestra en cada caso.
8 de 59
5.4
ANALISIS DEL DISEO COMPLETAMENTE RANDOMIZADO CON MAS DE DOS TRATAMIENTOS
Consideremos que 12 alumnos procedentes de 3 centros de enseanza han sido sometidos a un examen con el fin de determinar si hay diferencia en el grado de preparacin impartido por los centros de enseanza, habindose obtenido los siguientes resultados sobre un mximo de 10 puntos. 1er. Ejemplo: A 2 = x11 6 = x12 4 = x13 8 = x14 20 = x1. 5 = x1. B 7 = x21 3 = x22 8 = x23 6 = x24 24 = x2. 6 = x 2. C 8 = x31 6 = x32 7 = x33 7 = x34 28 = x3. 7 = x 3.
Totales : Promedios : SC dentro de A =
22 + 62 + 4 2 +82 202 = 20, con 3 GL 1 4 72 + 32 + 8 2 +62 242 = 14, con 3 GL 1 4 82 + 62 + 7 2 +7 2 282 = 2, con 3 GL 1 4
SC dentro de B =
SC dentro de B =
Totales de SC y GL dentro de tratamientos = 36 con 9 GL La variancia comn o Error Experimental o Variancia dentro de Tratamiento : sc2 = 1/3 (sA2 + sB2 + sC2) = 1/3 =
SCdeA + SCdeB + SCdeC GL
SCdeA + SCdeB + SCdeC 3(GL)
Total _ de _ la _ SC _ dentro _ de _ Tratamientos 36 = =4 Total _ de _ los _ GL _ dentro _ de _ Tratamientos 4
= Error Experimental Variancia entre Tratamientos : s2 entre tratamientos =
722 SC = 12 GL
202 + 242 + 282 722 /(4 x3) 8 10 = = = 4 (3 1) 2

9 de 59
Variancia Total : s2 Total
22 + 62 + ....... + 7 2 + 7 2 722 SC 1 12 = 44 = 4 = = 11 11 GL
Con las SC y los GL de estas tres variancias confeccionamos a continuacin el cuadro siguiente: Cuadro (5.4.1) Cuadro de Anlisis de Variancia
Fuentes de Variabilidad Entre Tratamientos Dentro de Tratamientos Total SC 8 36 44 GL 2 9 11 CM 4 4 = sc2 -
Los siguientes pasos que se realizan utilizando la sc para someter a prueba la hiptesis nula de A = B = C (en la forma ya conocida), nos conducen a la conclusin de que no se llega a probar que hayan diferencias en el grado de preparacin de los alumnos de los tres centros de enseanza. Ntese que la suma de los GL de Entre Tratamientos y Dentro de Tratamientos es igual a los GL de Total, esto es: 2 + 9 = 11, y sucede lo mismo con las SC, esto es: 8 + 36 = 44. Esto sucede en todos los anlisis de este diseo, razn por la cual, una vez que se ha hallado la SC del Total y Entre Tratamientos por diferencia se puede encontrar la de Dentro de Tratamientos. Ahora a los 4 resultados de A restmosles 1 y a los 4 de C summosle 1, con lo que resulta: 2do. Ejemplo:
A 1 5 3 7 Totales : Promedios : 16 4 B 7 3 8 6 24 6 C 9 7 8 8 32 8
Si se realizan las computaciones en la forma que hemos visto anteriormente, tenemos SC entre Tratamientos" o "SC de Totales de Tratamientos" = (162 + 242 + 322)/4 - 722/12 = 32, con 2 GL SC dentro de A = 12 + 52 + 32 + 72 162 / 4 = 20, con 3 GL SC dentro de B = 72 + 32 + 82 + 62 242 / 4 = 14, con 3 GL SC dentro de C = 92 + 72 + 82 + 82 322 / 4 = SC total dentro de tratamientos 2, con 3 GL
= 36, con 9 GL
SC Total = 12 + 52 + . . . . . + 82 + 82 722 / 12 = 68, con 11 GL
10 de 59
De aqu pasamos al Cuadro de anlisis de Variancia. Cuadro (5.4.2) Cuadro de Anlisis de Variancia
Fuentes de Variabilidad Entre Tratamientos Dentro de Tratamientos Total SC 32 36 68 GL 2 9 11 CM 16 4 -
La fuente de variabilidad dentro de tratamientos corresponde a las repeticiones, por lo que decimos que el factor "repeticiones" es un factor anidado, y el factor tratamientos es un factor cruzado. Una explicacin ms amplia sobre lo que son factores anidados y factores cruzados la tendremos en el captulo sobre experimentos factoriales. Al comparar los dos cuadros anteriores observamos que no ha variado el CM dentro de tratamientos, lo cual se debe a que los datos de las muestras A y C han variado en cantidades constantes, lo cual no influye en la desviacin estndar, pero en cambio el CM entre tratamientos ha pasado de 4 a 16, lo cual se debe a una mayor diferencia entre los promedios de las muestras. En lo sucesivo a la fuente de variabilidad Entre Tratamientos la denominaremos simplemente Tratamientos, y a Dentro de Tratamientos la denominaremos Error Experimental o simplemente Error. La simbolizacin usada para indicar la sumacin de las repeticiones de un tratamiento cualquiera es (los ejemplos que se dan estn relacionados con los datos de las tres muestras dadas al comienzo de la Seccin 5.4): X i j Representa el resultado de una repeticin y tratamiento cualquiera. X 1 j Representa el resultado de una repeticin cualquiera del tratamiento 1 o A. X i 2 Representa el resultado de la segunda repeticin de un tratamiento cualquiera. X i . Representa el tota] de las repeticiones de un tratamiento cualquiera. X . j Representa el total de los tratamientos de una repeticin cualquiera. X . 1 Representa el total de los tratamientos de la primera repeticin, esto es 17. X . . Representa el total de las repeticiones de todos los tratamientos, esto es 72. Al valor X . . le llamamos Gran Total.
X
j =1
ij
= X i. = 2 + 6 + 4 + 8 = 20; 7 + 3 + 8 + 6 = 24; 8 + 6 + 7 + 7 = 28
Si queremos referir a la sumacin de las repeticiones de un tratamiento, por ejemplo el B, la simbolizacin es:
X
j =1 t
2j
= 7 + 3 + 8 + 6 = 24 = X 2.
Si lo que queremos es representar la suma de las sumaciones de las repeticiones de todos los tratamientos, cuyo resultado sera el Gran Total, tenemos:
( X ij ) =
i =1 j =1
X
i j
ij
X
ij
ij
X
i
i.
= X ..
= (2 + 6 + 4 + 8) + (7 + 3 + 8 + 6) + (8 + 6 + 7 + 7) = 72
11 de 59
Simbolizacin de la suma de los cuadrados de las repeticiones de un tratamiento cualquiera.
ij
= 22 + 62 + 42 + 82 = 120 ; 72 + 32 + 82 + 62 = 158; etc.
Suma de los sumandos de los cuadrados de los totales de las repeticiones de todos los tratamientos:
X
i
2 ij
X .
i i
= 202 + 242 + 282 = 1760
El promedio de las repeticiones de un tratamiento es: El promedio general de un experimento es:
x i. = X i. / r
x .. = X.. / rt = 72 / 4
La suma de las SC Dentro de Tratamientos queda simbolizada en la forma siguiente:

Total de las SC Dentro de Tratamientos =
2 i j
. r
2 i
= 2 2 + 6 2 + 4 2 + 82
202 + etc. . = 36 4
2
SC Entre Tratamientos =
xi 2 . + x2 2 . + ... + x p 2 . r
x .. = rt
x
i
x 2 .. rt
202 + 242 + 282 722 = 8 = r 12

Los datos corresponden al 1er ejemplo de la Seccin 5.4 SC Total =
ij
ij
722 x 2 .. 2 2 2 2 = 2 + 6 + 4 + ....+7 = 44 rt 12
Como la suma de las SC ''Entre y "Dentro" de tratamientos es igual a la SC Total; conociendo la SC Total y la SC Entre, por diferencia se puede obtener la SC Dentro de tratamientos. La simbolizacin de los grados de libertad es la siguiente: Grados de libertad Total = rt-1 = (4)(3)-1 GL "Entre" tratamientos = t1 = 31 GL "Dentro" tratamientos = t(r1) = 3(41)
= = =
11 2 9
Qu es el CM del Error o variancia comn o sc 2 como tambin se denomina? El sc 2 es un estimador de la variancia de la poblacin ( 2) de donde provienen las muestras del experimento. Explicamos esto, si de la poblacin de alumnos cuyos pesos tiene la variancia 2 , extraemos completamente al azar tres muestras de n = 10 cada una, las variancias de
12 de 59
estas muestras son estimadoras de la variancia 2 de la poblacin de peso. Si al azar les aplicamos a los alumnos de estas 3 muestras los tratamientos A, B y C y nos ajustamos al principio estadstico de que los efectos de los tratamientos son aditivos (ver modelo lineal), resulta que los pesos de los 10 estudiantes de la muestra A habrn variado de peso en una cantidad constante, que representaremos por tA (tB es estimador del parmetro A), igualmente los 10 estudiantes de B habrn variado de peso en la cantidad constante tB, y los 10 de C en la cantidad constante tC ; y sabemos que si a los datos de una muestra se les suma una cantidad constante no varia su variancia, resulta pues que las variancias de las tres muestras despus de la aplicacin de los tratamientos seguirn siendo iguales a las que respectivamente tena cada una antes de la aplicacin de los tratamientos y por consiguiente seguirn estimando la 2 de la poblacin de donde provinieron. Esto es sA 2, sB 2, sC 2 son estimadores de 2. La Sc 2 que es el promedio de esas tres variancias tambin es estimador de 2 de la poblacin, con la ventaja de ser un mejor estimador por ser el promedio de tres estimadores. Si x .. es el promedio general del experimento y es el promedio de la poblacin, tenemos que:
x A. x B. x C.
= = =
x .. + tA , estima la A = + A , de la poblacin A x .. + tB , estima la B = + B , de la poblacin B x .. + tC , estima la C = + C , de la poblacin C
Estas tres poblaciones tienen diferentes promedios, pero similares variancias entre s, siendo estimadores de la poblacin original que es 2. En el Cuadro (5.5.1) se dan los clculos simbolizados del anlisis de la variancia para el diseo Completamente Randomizado: Cuadro (5.5.1) Anlisis de la Variancia del CR en forma simbolizada
Fuentes de Variabilidad GL SC CM (SC de Trats.) / (t-1) = CM de Trats. (SC del Error) / t(r-1) = CM del Error
Entre muestras ( 2 )
(t1)
x
i
r
Dentro de muestras t(r1)
x 2 .. rt
X 2. X i j2 i r j
2
Total
Tr-1
ij
ij
x 2 .. rt
"Total" no es fuente, sino la suma de dos fuentes para el caso particular del diseo Completamente Randomizado.
( 2 ) Vale tambin decir Entre Tratamiento. 13 de 59
5.6
PRUEBAS DE SIGNIFICACION DE F, t Y DLS.
Valores Esperados de los Componentes de los Cuadrados Medios o VEC (CM) En el segundo ejemplo que hemos tenido en la Seccin 5.4 (final pgina 108), los promedios de los tres tratamientos son: x A = 1; x B = 6; x C = 8 y x.. = 6. Segn esto, tA = 4 6 = -2, tB = 6 - 6 = 0, tC = 8 - 6 = 2. En el Cuadro (5.4.2) hemos visto que el CM de tratamientos es 16. Este valor mide la variabilidad total presente en la x i. con respecto a x .. , tal como podemos verlo a continuacin: CM de Tratamientos =
r (t A + t B + t C ) SC _ de _ Trat . = (t 1) GL _ de _ Trat
2 2 2
= Si es que las diferencias
4 (4 6) 2 + (6 6) 2 + (8 6) 2 (3 1)
i.
32 = 16 2
= 0), el CM de
= i son todas iguales a cero (i

2
tratamientos de las muestras ser un estimador de c , solamente. En el caso de que haya variabilidad entre los i , entonces al sacar muestras de las poblaciones implicadas, esperamos que en cada x i . - x .. influyan las variabilidades siguientes: (a) (b) la que existe "dentro" de tratamientos que hemos representado por c2, estimada esta variante por s c2, y adems. la que existe "entre tratamientos, que es la que corresponde a las diferencias
i. . . = i . Esta variabilidad esperada est representada por :

r
2 i 2
/ (t 1), si es que los tratamientos pertenecen al Modelo Fijo o I; y, por
r si es que los tratamientos pertenecen al Modelo al Azar o II Se dice que los tratamientos de un experimento pertenecen al Modelo Fijo I, cuando los tratamientos han sido escogidos por el experimentador. En este caso el experimentador est interesado solo en hacer comparaciones entre los tratamientos escogidos. La mayor parte de los experimentos pertenecen a este modelo. Se dice que los tratamientos de un experimento pertenecen al Modelo al Azar II, cuando !os tratamientos han sido tomados al azar de un grupo muy grande de tratamientos. En este caso el experimentador est interesado ms que nada en saber si hay variabilidad entre los distintos tratamientos que forman la poblacin. Ejemplo: Supongamos que se toma el consumo de una bebida gaseosa en 10 das elegidos al azar de entre los 365 das del ao; los 10 das son los tratamientos, las muestras seran dadas para da por la venta de botellas en 15 establecimientos comerciales, 15 seran las repeticiones. De acuerdo a lo expuesto, en el Completamente Randomizado, tenemos que: En el caso de que ri sea igual pera todos los tratamientos.
El CM de tratamientos es estimador de 2 + i2 / (t-1), para el que sean fijos. El CM de tratamientos es estimador de 2 + r 2, para el caso en que sean al azar
14 de 59
En el caso de que ri vara de un tratamiento a otro.
El CM de tratamientos fijos es estimador de El CM de tratamientos al azar es estimador de

2
2 + r i i2 / (t-1) 2 + n0 2
R ri / R Siendo n0 = ; en donde R = ri , o sea nmero total de unidades experimentales. r 1

El CM del Error es estimador de o 2. Prueba de F Se designa por F a la razn "CM de Tratamientos / CM del Error". De lo expuesto es natural esperar que F > 1, puesto que: F =
o 2 + r o 2 o2
Esta razn est estimada por: Fc =
CM _ de _ Tratamientos 16 = = 4 CM _ del _ Error 4
Slo en el caso de que los i = 0, esperaramos que F = 1; aunque an as puede suceder que F > 1; pero en este caso slo sera por causa del azar. Luego, no es suficiente de que F > 1 para aceptar que los i 0. Para aceptar esta hiptesis alternante, debemos comparar Fc con F tabular, buscando este en la Tabla IV con los Grados de Libertad de Tratamiento y los Grados de Libertad del Error. Las demostraciones acerca de los "valores esperados de los componentes de los CM" puede vers en la secciones 4 a 7 de la II parte del libro Introduction to Experimental Statistics, de C. C. publicado por McGraw-Hill Book Co. En los experimentos, tanto sc2 como s 2 son los estimadores de c2 y 2, respectivamente. Si en realidad los promedios de las poblaciones de los tratamientos son iguales, o sea si
1 = 2 = 3 = 0, en este caso 2 es cero. Y por lo tanto:
o +0 CM _ de _ Tratamientos F = = = 1 CM _ del _ Error o2

2
Es lgico que el valor de F calculado sea tanto mayor que 1, cuanto 2 sea mayor que cero. En los experimentos no es suficiente que los ti resulten diferentes entre si para considerar que hay diferencias entre los parmetros correspondientes i (esto indicara que diferencias entre los ), a que las diferencias x i. x .. influye tambin el azar representado por s t 2 que existe dentro de las muestras. Es por esto que se debe hallar el valor de F calculado. As, para los resultados del segundo ejemplo que estn en el Cuadro (5.4.2), tenemos:
15 de 59
Fc
CM _ de _ Tratamientos CM _ del _ Error
16 4
(5.6.1)
Si es que 2 = 0, slo hay 5% de probabilidades de que Fc sea mayor que el F tabular que corresponde a (t - 1) y [ (r - 1) t ] grados de libertad en la Tabla IV, los que vienen a ser los grados de libertad de Tratamientos y del Error Experimental respectivamente (los que para nuestro ejemplo son 2 y 9). En general, F tabular es buscado en la Tabla mencionada con los grados de libertad del numerador en la primera lnea de la Tabla y con los grados de libertad del denominador en la primera columna de la Tabla, en el encuentro correspondiente se hallan dos nmeros; uno en tipo corriente que corresponde al nivel de 0.05 y otro de tipo negrita que corresponde al nivel 0.01, que marca la separacin de las regiones que dejan 5 y 1 % del rea de frecuencia en la distribucin de F. F tabular para 2 y 9 (lo que corrientemente se representa por F(2,9) ), encontramos que es para 0.05 el valor de 4.26 y para 0.01 el valor de 8.02. Como Fc hemos visto que es 4, no supera a 4.26, por lo que no podemos rechazar la Ho: 2 = 0, por lo que no podemos aceptar que Has.: 2 0. Esto nos indica que no se ha probado que los i sean diferentes de cero, y por lo consiguiente tampoco que hay diferencias entre los i Como sc 2 y st 2 son estimadores de c 2 y t 2, luego en los experimentos el CM de tratamientos = sc2 + rst2 . Aplicado esto a nuestro 2do. ejemplo cuyo cuadro de anlisis de variancia est en la pgina 109, tenemos: CM de tratamientos = 16 = sc2 + rst2 CM del error = 4 = sc2 Sustituyendo en la primera ecuacin sc2 y r por sus valores, tenemos: 16 = 4 + 4st2, de donde st2 = (16 4 ) / 4 = 3. Si F calculado supera a F0.05 se dice que la prueba es significativa y esto se representa en el "Cuadro de Anlisis de Variancia" con un asterisco puesto en la parte superior derecha del valor del CM de tratamientos, y si F calculado supera a F0.01 se dice que la prueba ha resultado altamente significativa y se representa por un doble asterisco. La prueba de F no es especfica sino genrica, es decir que el rechazo de la hiptesis nula Ho no indica entre qu tratamientos hay diferencias significativas, solo indica que hay, mas no indica cuantas y cuales diferencias son las significativas. Para llegar a este resultado detallado hay que pasar a la prueba de t, de la DLS, de Duncan o a la de Tukey. Prueba de t : No se debe pasar a realizar esta prueba sino ha salido previamente significativa la prueba de F. En nuestro ejemplo esto no ha sucedido, sin embargo slo con fines didcticos supondremos que s ha sido significativa la prueba de F. La prueba de t es la misma que hemos visto en la Seccin 4.18, en el caso (A), que corresponde a cuando las variancias son homogneas y los tamaos de las muestras son iguales.
16 de 59
Sabemos que en el anlisis de la variancia el CM del error es la variancia comn (sc2) de los tratamientos. Esta variancia debe deducirse siempre que ella sea una buena representativa de las variancias dentro de los tratamientos. Tal cosa ocurre cuando hay homogeneidad de variancias. Hecho este que se presenta siempre que el origen de las unidades experimentales que forman las muestras de los tratamientos sea el mismo, y hallan sido distribuidos al azar entre los tratamientos. En caso de duda de la homogeneidad de variancias, debera realizarse una prueba de homogeneidad, adoptando para esto el procedimiento de Bartlett que se da en la Seccin ?. A continuacin se describen los cinco pasos para la prueba de t, aplicados a un ejemplo numrico. (a) Se plantea la Ho 1 = 2 y las Has 1 > 2, 1 < 2 Para el caso de nuestro segundo ejemplo de la Seccin 5. 4, tenemos: Para A vs. B Para A vs. C Para B vs. C Ho A = B Ho A = C Ho B = C Has. A B Has. A C Has. B C (b) Desviacin estndar de las diferencias (S). Aplicamos la formula conocida siguiente: S =
Sc 2 r
CM _ del _ Error r
Para nuestro ejemplo que tenemos en el Cuadro 5.4.2, resulta: S =
4 4
= 1.4142
(c) t calculado para cada par de tratamientos. Aplicamos la formula conocida siguiente: t =
( x 1 - x 2 ) - ( 1 - 2 ) ( x1 x 2 ) d = = sd sd sd
Para nuestro ejemplo tenemos: Para A vs. B: t =
(4 6) = 1.4142 (4 8) = 1.4142 (8 6) = 1.4142
- 1.41
Para A vs. C: t =
- 2.83
Para B vs. C: t =
1.41
(d) t tabular es buscado en la Tabla III con los GL del Error. Grados de libertad del error = t (r 1) Para nuestro ejemplo t0.05 para 9 GL = 2.262 y t0.01 = 3.250
17 de 59
(e) Comparar t calculado de cada comparacin con t Si resulta tc > t se rechaza la Ho y se acepta la Has., pero si tc < t se acepta la Ho. Para nuestro ejemplo tenemos: Para A vs. B: tc = 1.41 < t0.05 = 2.262; aceptamos la Ho Para A vs. C: tc = 2.83 > t0.05 = 2.262; por ser x
C
> x
, aceptamos la Has. de que C
>A, con 5% de probabilidades de que estos dos promedios sean iguales. Para B vs. C: tc = 1.41 < t0.05 = 2.262; aceptamos la Ho. Como el resultado de la prueba de F no fue significativa, no se toma en cuenta la significacin que acabamos de obtener para A vs. C. Tngase presente, que la aceptacin de la Ho , no constituye una prueba de que dos promedios son iguales. En estadstica podemos probar que el promedio de una poblacin es superior al promedio de otra poblacin, pero no podemos probar que son iguales. La falta del rechazo de la Ho , se debe a que para la diferencia qu hay entre los dos promedios de las poblaciones a las que pertenecen, las muestras resultaron pequeas, por lo que con muestras de tamao ms grande (convenientemente ms grande) se llegara a rechazar la hiptesis Ho . La prueba de F es equivalente a la prueba de t en los casos en que se tenga dos tratamientos, pues en estos casos, F para 1 y 2 (r - 1) grados de libertad es igual a t 2 para 2(r-1); buscados F y t en las tablas respectivas. As por ejemplo, para el nivel de 0.05, F(1 , 10) = 4.96 y t2(10) = 2.2282 = 4.96. Prueba de la DLS (Diferencia Lmite de Significacin): Con la prueba de t habra que realizar tantas pruebas como comprobaciones, por lo que s el nmero de tratamientos en el experimento es elevado resultara tedioso realizar tantas pruebas de t. Esta labor puede aliviarse enormemente empleando la prueba de la DLS, que no es ms que la prueba de t, pero realizada mediante un artificio con el cual se obtiene los mismos resultados que se obtendran si se hicieran todas las pruebas de t. La prueba de t est basada en: tc =
( x1 x 2 ) d = = t sd sd
Pero si en la ecuacin anterior sustituimos tc por t y despejamos d , tenemos d = (t) ( s d )
= DLS. El valor de d o DLS establece los lmites de separacin de las regiones de aceptacin y de rechazo de la Ho. Es as que con un slo valor de DLS se acepta o rechaza todas las Hos de las comparaciones. No se rechaza la Ho cuando la ( x 1 - x 2 ) < DLS. Y se rechaza la Ho cuando la ( x 1 - x 2 ) > DLS. Para nuestro 2do. ejemplo tenemos: DLS = (2.262) (1.4142) = 3.2 Para A vs. B: ( x B - x A ) = 2 < 3.2, no se rechaza la Ho Para A vs. C: ( x C - x A ) = 4 > 3.2, si se rechaza la Ho Para B vs. C: ( x C - x B ) = 2 < 3.2, no se rechaza la Ho
18 de 59
Sucede algunas veces, como en el presente ejemplo, que sin haber sido significativa la prueba de F, salga alguna significacin en las pruebas de la DLS; en este caso la aceptacin de superioridad de un tratamiento sobre otro no debe tomarse en cuenta. La prueba de la DLS y de t deben usarse simplemente cuando se comparan dos tratamientos en el experimento o cuando habran varios tratamientos, previamente a la conduccin del estudio ya se han determinado las comparaciones que se van a hacer entre los tratamientos de acuerdo a las necesidades de la investigacin; pero no debe emplearse una vez conocido los resultados para comparar aquellos tratamientos de resultados altos con los de resultados bajos. La prueba de la DLS es fcil de realizar, pero tiene la desventaja al igual que la prueba de t, que puede fallar en las comparaciones de aquellos tratamientos de resultados altos con los de resultados bajos, la falla consiste en que comparaciones as que no deberan salir significativas al nivel de 0.05 adoptado, pueden llegar a salir significativa, a pesar de emplearse los valores de t para este nivel (an cuando haya diferencia real entre los extremos). La razn se explica ms adelante. Cundo y porqu falla la prueba de t y la de la DLS La explicacin es la siguiente. En un experimento con ms de 2 tratamientos y con mayor razn si el nmero es elevado, resulta que an sin tener efectos diferentes los tratamientos, habr variabilidad entre los x i. de los tratamientos, debido exclusivamente a la variabilidad comn, y si se realiza la prueba de la DLS al nivel de 0.05 entre tratamientos tomados al azar, por las bases en que se funda esta prueba que son las mismas que las de t, 5% de comparaciones resultaran significativas. Pero qu sucede si se comparan nicamente pares de tratamientos con resultados extremadamente opuestos. En estas comparaciones ms del 5% de las comparaciones resultaran significativas. Consideremos un ejemplo. Si un experimento tiene 20 tratamientos, podemos hacer 190 comparaciones entre pares de promedios. Si todos los tratamientos fueran iguales (1 = 2 = 3 = . . . = o) entonces todas las Ho seran ciertas. En estas condiciones: En cuntas de las comparaciones rechazaramos la Ho si todas las pruebas se hicieran al nivel de 0.05? Respuesta: en 5% de las comparaciones. En cules de las comparaciones haramos rechazos indebidos? Respuesta: en las comparaciones en promedios extremos, ya que en ellas tc sera muy alto y mayor que t0.05. Pero si las comparaciones entre promedios se hiciesen al azar: En qu porcentaje la Ho sera rechazada? Respuesta: en 5% de las comparaciones, o sea con este tipo de comparaciones hay 5% de probabilidades de que en una comparacin se rechace indebidamente la Ho. Si se compara el ms alto promedio con el ms bajo promedio: Qu probabilidad hay de que la Ho sea rechazada indebidamente? Respuesta: la probabilidad es de 86%, y no de 5% 0.05, pese a compararse tc con t0.05. Es decir el nivel real de la prueba para la comparacin del ms alto promedio con el ms bajo es de 0.86. Es por esto que decimos que la prueba de t falla. Esta prueba falla desde el momento que hay en el experimento ms de dos tratamientos, y fallar tanto ms, y sobre todo en las comparaciones entre promedios extremos cuanto mayor sea el nmero de tratamientos.
19 de 59
Los estadsticos han determinado que s en los experimentos hay 3 tratamientos y no existe diferencia de efectos, pero en todos se compara el tratamiento con resultados ms alto con el de resultado ms bajo, el 13% de estas comparaciones resultarn significativas, y no 5% como debera ser. En experimentos con 6 tratamientos en los que en todos los tratamientos sean iguales, a! comparar siempre el tratamiento de resultado ms alto con el de resultado ms bajo, 40% de estas comparaciones fallarn dando significacin estadstica, en lugar de fallar solo en 5% que es el nivel de la prueba o sea 0.05. En la misma forma con 10 tratamientos la falla es de 59%, y con 20 tratamientos la falla es de 86%. En resumen, en comparaciones del ms alto con el ms bajo las fallas son: Con 2 tratamientos falla 5% Con 10 tratamientos falla 59% Con 3 tratamientos falla 13% Con 20 tratamientos falla 86% Con 6 tratamientos falla 40% De aqu que las pruebas de t y de la DLS solo dan 5% de fallas cuando se hacen comparaciones al azar o si son comparaciones predeterminadas de acuerdo a implicaciones de los estudios. Afortunadamente los estadsticos han ideado otras pruebas (pruebas de Duncan, Tukey, Student - Newman - Keul, Dunnett, Scheff) con las que no se falla en desechar indebidamente la hiptesis nula (Ho) con ms frecuencia que la que corresponde al nivel en que se hace la prueba. 5.7 PRUEBA DE SIGNIFICACION DE DUNCAN. Esta prueba tiene en cuenta los rdenes que les toca a los promedios de los tratamientos en comparacin en el ordenamiento general, dando mayores lmites de significacin (mayor exigencia) en las comparaciones de tratamientos ms apartados en el ordenamiento. Esta prueba no requiere como la de t y DLS de una prueba previa de F, pues puede hacerse la prueba de Duncan an sin ser significativa la prueba de F, Pero si requiere homogeneidad de variancias entre los tratamientos. Puede hacerse tambin si el nmero de repeticiones de los tratamientos no es igual. Esto ltimo ser visto en la Seccin 5.16 Esta prueba debe pasar por las etapas que pasaremos a ver en un ejemplo de un experimento cuyas caractersticas se dan a continuacin, incluyendo el anlisis de variancia. Para comparar los porcentajes de limpieza de la lana de 7 zonas ganaderas, 4 de ellas de una regin A, 2 de una regin B y 1 de una regin C, se tomaron de cada zona 5 muestras al azar representativas. En el Cuadro (5.7.1) se dan los porcentajes de limpieza de la lana y algunos datos del anlisis estadstico:
Cuadro (5.7.1) Porcentajes de lana limpia de 7 zonas ganaderas pertenecientes a 3 regiones. 1A 2A 3A 4A 5B 6B 7C 35 33 35 31 45 40 23 37 35 39 28 39 39 39 36 38 43 29 36 45 34 34 29 41 25 44 35 33 32 31 37 34 43 38 34
20 de 59
X i.
x i.
SC Dentro GL Dentro s2 Dentro
174 34.8 14.80 4 3.70
166 33.2 48.80 4 12.20
195 39.0 40.00 4 10.00
147 29.4 45.20 4 11.30
207 41.4 57.20 4 14.30
197 39.4 53.20 4 13.30
163 32.6 137.30 4 34.30
Variancia comn = sc2 = 12.16
En el Cuadro (5.7.2) se da el anlisis de la variancia: Cuadro (5.7.2) Anlisis de la variancia del estudio de porcentaje de limpieza de lana.
Fuentes Tratamientos Error Total SC 567 396 963 GL 6 28 34 CM 94.5 14.2 Fc 6.65
1ra. Etapa.-
Determinacin de s x = =
sc 2 r =
CM _ del _ Error r
14.2 5 = 1.69
2da. Etapa.- Con los GL del error se va a la Tabla VII en donde se encuentran los valores de las "Amplitudes Estudiantizadas Significativas de Duncan" o abreviadamente AES (D), y en ella se buscan los valores de p con los GL del Error para 2, 3, 4, etc., hasta el nmero t de tratamientos del experimento, correspondientes al nivel 0.05 o 0.01 segn la exigencia que se le quiera dar a la prueba. Para nuestro ejemplo encontramos que para 28 GL y 0.05 los valores de p son los siguientes: p5 = 3.20 p2 = 2.90 p6 = 3.26 p3 = 3.04 p4 = 3.13 p7 = 3.30 Estos valores entran en el Cuad. (5.7.3) en la lnea correspondiente a AES(D), y son multiplicados sucesivamente por s x ; para dar los valores de las "Amplitudes Limites de Significacin de Duncan" o abreviadamente ALS(D); as para nuestro ejemplo tenemos:
Cuadro (5.7.3) Amplitudes Limites de Significacin de Duncan. Valores de p 2 3 4 5 6 AES (D) 2.90 3.04 3.13 3.20 3.26
7 3.30
s x = 1.69
ALS (D) 4.9 5.1 5.3 5.4 5.5 5.6
La ecuacin que da los valores de las ALS(D) es: ALS(D) = AES(D) .
sx
21 de 59
3ra. Etapa.- A continuacin se ordenan en orden creciente los resultados promedios de los tratamientos, y para ms sencillez de las comparaciones se les pone de clave nmeros romanos, tal como puede verse en el ejemplo:
Tratamientos Promedios ( x i . ) Clave 4A 29.4 I 7C 32.6 II 2A 33.2 III 1A 34.8 IV 3A 39.0 V 6B 39.4 VI 5B 41.4 VII
4ta. Etapa. - Se empieza a comparar el promedio ms alto con el ms bajo (en el ejemplo VII-I = 41.4-29.4 = 12.0), Y la diferencia se ve si es mayor o menor que la ALS(D) que corresponde al valor de p del nmero de lugares que hay entre los que se comparan incluyendo ellos (en el ejemplo de VII a I hay 7 lugares, luego se compara con el valor que corresponde a p1 que es 5.6, como 12.0 es mayor que 5.6, hay superioridad de 5B sobre 4A al nivel de 0.05). A continuacin se compara el promedio ms alto con el que sigue al ms bajo (en nuestro ejemplo VII - II = 41.4 - 32.6 = 8.8, y la diferencia se ve si es mayor o menor que la ALS(D) correspondiente al valor de p del nmero de lugares que hay entre los que se comparan incluyendo ellos (en el ejemplo de VII a II hay 6 lugares, luego se compara con el valor que corresponde a p6 que es 5.5, como 8.8 supera a 5.5, hay significacin). Y as se sigue hasta comparar II con I (y la diferencia se ve si es mayor que el valor de la ALS (D) que corresponden a p2 (en el ejemplo, II I = 32.6 - 29.4 = 3.2, que no supera a la ALS{D) de p2 que es 4.9, por lo tanto no es significativa. Los resultados de todas las comparaciones se dan a continuacin:
VII I VII II VII III VII IV VII V VII VI VI I VI II VI III VI IV VI V V I V II V III V IV IV I IV II IV III III I III II II I = = = = = = = = = = = = = = = = = = = = = 41.4 29.4 41.4 32.6 41.4 33.2 41.4 34.8 41.4 39.0 41.4 39.4 39.4 29.4 39.4 32.6 39.4 33.2 39.4 34.8 39.4 39.0 39.0 29.4 39.0 32.6 39.0 33.2 39.0 34.8 34.8 29.4 34.8 32.6 34.8 33.2 33.2 29.4 33.2 32.6 32.6 29.4 = = = = = = = = = = = = = = = = = = = = = 12.0 > ALS (D) (7) 8.8 > ALS (D) (6) 8.2 > ALS (D) (5) 6.6 > ALS (D) (4) 2.4 < ALS (D) (3) 2.0 < ALS (D) (2) 10.0 > DLS (D) (6) 6.8 > DLS (D) (5) 6.2 > DLS (D) (4) 4.6 < DLS (D) (3) 0.4 < DLS (D) (2) 9.6 > ALS (D) (5) 6.4 > ALS (D) (4) 5.8 > ALS (D) (3) 4.2 < ALS (D) (2) 5.4 > ALS (D) (4) 2.2 > ALS (D) (3) 1.6 > ALS (D) (2) 3.8 < ALS (D) (3) 0.6 < ALS (D) (2) 3.2 < ALS (D) (2) = = = = = = = = = = = = = = = = = = = = = 5.6 Si significativa 5.5 Si significativa 5.4 Si significativa 5.3 Si significativa 5.1 No significativa 4.9 No significativa 5.5 Si significativa 5.4 Si significativa 5.3 Si significativa 5.1 No significativa 4.9 No significativa 5.4 Si significativa 5.3 Si significativa 5.1 Si significativa 4.9 No significativa 5.3 Si significativa 5.1 No significativa 4.9 No significativa 5.1 No significativa 4.9 No significativa 4.9 No significativa
22 de 59
Cada diferencia se considera significativa si excede a la correspondiente ALS(D), en caso contrario no es significativo, con la excepcin siguiente; si una diferencia entre dos promedios alcanza a la significacin, pero esta significacin est comprendida entre dos no significaciones, no puede declararse significativa. Esto se debe a que en realidad se est probando la homogeneidad de grupos de promedios homogneos. Regla prctica.- Cuando el nmero de tratamientos es elevado el procedimiento expuesto es demasiado largo. En estos casos se recomienda adoptar el procedimiento abreviado que consiste en restar, del promedio ms alto el valor de la ALS(D) ms alto (en nuestro ejemplo, a VII le restamos la ALS(D)(7), 41.4 - 5.6 = 35.8), todos los promedios menores de esta diferencia son significativamente diferentes del promedio ms altos, los promedios de los tratamientos menores de 35.8 que son los siguientes: I, II, III y IV, son significativos con VII, porque las diferencias de ste con los 4 mencionados sern mayores que las ALS(D) que a cada uno le corresponde, porque stas son menores que la ALS(D)(7). Quedara por determinar si entre el promedio ms alto y los promedios que siguen hacia arriba hay tambin significativa, para lo cual se sigue con el procedimiento normal (en el ejemplo quedara por determinar si VII es significativo con V y VI). En la misma forma se seguira con el promedio menor al ms alto [a VI le restaramos la ALS(D) (6)], esto es 39.4 - 5.5 = 33.9, deduciendo de inmediato que VI es significativo con l, Il y III, y seguiramos despus comparando VI con IV, V. Las significaciones obtenidas pueden representarse mediante rayas, as para nuestro ejemplo tenemos:
4A I 7C II 2A III 1A IV 3A V 6B VI 5B VII
El significado de estas rayas es el siguiente. Entre cualquier par de tratamientos, que aparecen unidos por la misma raya, no hay superioridad significativa. Las rayas que se superponen se suprimen, tal como se ha hecho en el ejemplo. En, cambio, entre cualquier par de tratamientos que no aparecen unidos por la misma raya hay superioridad significativa (as para nuestro ejemplo, VII no tiene significacin con VI y V, pero si con IV, III, II y I). Otra forma de expresar los resultados es indicando las diferencias entre pares y poniendo para cada diferencia si tiene o no significacin estadstica, tal como puede verse con los resultados del ejemplo.
23 de 59
Calzada Benza, Jos (1982): Mtodos Estadsticos para la Investigacin, 5ta edicin. Cuadro (5.7.4) Diferencias y significaciones entre tratamientos (cada lnea horizontal se compara con su correspondiente en la primera columna) 4A 7C 2A 1A 3A 6B 5B Comparados 29.4 32.6 33.2 34.8 39.0 39.4 41.4 con: I II III IV V VI VII 4A 29.4 I 7C 32.6 II 2A 33.2 III 1A 34.8 IV 3A 39.0 V 6B 39.4 VI 5B 41.4 VII .... .... .... .... .... .... .... 3.2 .... .... .... .... .... .... 3.8 0.6 .... .... .... .... .... 5.4 * 2.2 1.6 .... .... .... .... 9.6 * 6.4 * 5.8 * 4.2 .... .... .... 10.0 * 6.8 * 6.2 * 4.6 0.4 .... .... 12.0 * 8.8 * 8.2 * 6.6 * 2.4 2.0 ....
5.8
PRUEBA DE SIGNIFICACION DE TUKEY.
Esta prueba no tiene en cuenta los ordenes entre s de los promedios de los tratamientos porque est basada en otro principio que las pruebas anteriores; mientras que en las pruebas de t, DLS y ALS(D), cada comparacin entre dos promedios de un experimento es considerada como una unidad para computar el 5% o 1 % de fallas en desechar indebidamente la Ho; es decir en estas pruebas, si se hacen al nivel de 0.05, se tiene que de 100 comparaciones que se hiciesen, en todas las cuales la Ho fuese cierta, slo en 5 comparaciones se desechara indebidamente la Ho. En cambio, con la prueba de Tukey cada comparacin no es la unidad, sino cada experimento; es decir, con esta prueba (al nivel de 0.05) si se tienen 100 experimentos en los que en cada uno en todas las comparaciones posibles entre tratamientos la Ho fuese cierta, se encontrara slo en 5 experimentos indebidos desechamientos de una o ms hiptesis nulas. En esta prueba, al nivel 0.05 o 0.01 se les llama "Razn Juiciosa del Error Experimental". Como es fcil de comprender, esta prueba es bastante ms severa que las anteriores, por lo que Hartley ha sugerido que la razn juiciosa del error experimental se eleve a 10% a un valor ms alto. En la prueba de Tukey slo se determina una Amplitud Lmite de Significacin, la que representaremos por ALS (T). Esta prueba no requiere de una prueba previa de F. Para realizar la prueba se requiere saber los GL del Error, el CM del Error y el nivel de significacin a que se va a hacer la prueba. Las etapas se dan a continuacin aplicadas al ejemplo del Cuadro (5.7.1) y (5.7.2). 1ra. Etapa.- Determinacin de s x =
sc 2 / r =
CM _ del _ Error r = 14.2 / 5 = 1.69
2da. Etapa. - Con los GL del Error se va a la Tabla VIII (3), en donde se busca la Amplitud Estudiantizada Significativa de Tukey o abreviadamente AES(T) que corresponde a
(3) Esta Tabla tambin se emplea en otra prueba similar a la de Duncan que se denomina Prueba de Significacin de Student - Newman - Keul, con la nica diferencia que en lugar de emplearse la Tabla VII se emplea la Tabla VIII. Esta ltima Tabla tambin se emplea en la prueba de Tukey. 24 de 59
dichos GL y de pt , y este valor se multiplica por s x de la etapa anterior, con lo que se obtiene la ALS(T); esto es: ALS (T) = AES (T) s x (5.8.1) Para 28 GL y p = 7 no hay en la Tabla el valor de la AES(T), por lo que hay que hacer una interpolacin armnica ( 4 ), para lo cual se emplean los recprocos de GL ms prximos para establecer la regla de tres. As, hay valores para 24 y 30, estos son 4.54 y 4.46 respectivamente (nivel 0.05), luego se hace una regla de tres simple, como sigue: (1 / 24) (1 / 30) = 1 / 120; es a 4.54 4.46 = 0.08 Como (1 / 24) (1 / 28) = 1 / 168; es a x ; de donde x = de aqu que la AEST (T) = 4.54 0.057 = 4.483 De aqu que la ALST (T) = (4.483) (1.69) = 7.6 3ra. Etapa.- Esta etapa es igual que la correspondiente de la Prueba de Duncan. 4ta. Etapa.- En esta etapa se hacen todas las comparaciones posibles entre los promedios de los tratamientos. Las diferencias se comparan con la ALS(T), y aquellas que sean superiores son significativas. En nuestro ejemplo, las diferencias que superan a 7.6 se indican a continuacin: VII, VI y V superiores significativamente a I VII superior significativamente a II VII superior significativamente a III Como puede observarse, el nmero de significaciones obtenidas con esta prueba es menor que el obtenido con la prueba Duncan (vase Cuadro (5.7.4)). Lmites de Confianza. La ALST(T) puede emplearse tambin para establecer los lmites de confianza entre los cuales se encuentra la diferencia d = 1 - 2. As, para nuestro ejemplo la verdadera diferencia entre los tratamientos VII y I se encuentra entre los lmites: VII I ALS(T) = (41.4 - 29.4) 7.6 = 12.0 7.6 o sea entre 19.6 y 4.4 que estn a favor de VII. Entre estos lmites no se encuentra encerrado el valor cero, que corresponde a la hiptesis nula (Ho). 5.9 PRUEBA DE CONTRASTE ENTRE PROMEDIOS DE GRUPOS DE TRATAMIENTOS DE SCHEFFE.
(1/168)(0.08) = 0.057; (1/120)
Esta prueba debe aplicarse cuando la prueba F en el anlisis de variancia ha dado resultado significativo, en caso contrario, ninguna prueba de contraste sera significativa, razn por la que no se justificara hacerla. Para establecer la formula para una comparacin de contraste debe tenerse presente que la "Amplitud Limite de Significacin de Scheff" o abreviadamente ALS(S) est dada en forma general como sigue:
(4) La interpolacin armnica funciona bien en las tablas de z, t, F, AES(D) y AEST(T). 25 de 59
ALS (S) =
c12 c2 2 ( F )(t 1)( sc ) + + ..... r r

2
En donde: F, es el valor tabular de F para los GL de tratamientos y del error, del anlisis de la variancia. (t-1),son los GL de libertad de tratamientos. r , es el nmero de repeticiones de los tratamientos. c12, c22, .. son los coeficientes que corresponden a los promedios de los grupos de tratamientos en comparacin, los que deben establecerse de acuerdo a las reglas siguientes: 1.- La suma algebraica de los coeficientes de cada comparacin debe ser cero (en la primera comparacin que se da ms adelante son: 1 + 1 - 1 - 1 = 0). 2.- Los signos de los coeficientes de los promedios de un grupo deben ser iguales entre s y de signo contrario a los del otro grupo. 3.- Cada comparacin debe obedecer a un inters especial, y no simplemente a comparar un grupo de promedios mayores con otro de promedios menores. En el Cuadro (5.7.1), en el que se dan los porcentajes de lana limpia de 7 zonas ganaderas, de las que 4 pertenecen a la regin A, dos a la regin B y uno a la regin C; puede haber inters en hacer las siguientes comparaciones: 1ra. Comparacin. En la comparacin de dos sub-regiones de A representada por: (1A, 2A) y (3A, 4A) los coeficientes c para los 4 promedios son todos iguales a uno, por lo que se indica a continuacin: c1 x 1 + c2 x 2 - c3 x 3 - c4 x 4 . Reemplazando los valores de los promedios con los que se tienen en el Cuadro (5.7.1), tenemos: (1 )(34.8) + (1 )(33.2) - (1 )(39.0) - (1)(29.4) = -0.4 Al aplicar la frmula a esta particular comparacin tenemos: ALS(S) =
12 12 12 12 (2.44)(7 1)(14.2) + + + = 5 5 5 5
4 (207.888) = 12.9 5
Como 0.4 est muy lejos de superar a 12.9 decimos que no hay diferencia entre los promedios de las dos sub-regiones comparadas. 2da. Comparacin. Supongamos que interesa comparar la regin del Norte A con la del Centro B, en este caso los coeficientes de c apropiados para los promedios de A del Norte son 1 y para los promedios del Sur son 2, o sea: c1 x 1A + c2 x 2A + c3 x 3A + c4 x 4A c5 x 5B c6 x 6B = (1) (34.8) + (1) (33.2) + (1) (39.0) + (1)(29.4) - (2) (41.4) - (2) (39.4) = 136.4 - 161.6 = - 25.2 Al aplicar la formula general a esta particular comparacin da:
26 de 59
ALS(S) =
12 12 12 12 12 12 (2.44)(7 1)(14.2) + + + + + = 5 5 5 5 5 5
12 (207.888) = 22.33 5
Como 25.2 supera a 22.33 podemos decir que en la regin A el promedio de los porcentajes de limpieza de la lana es menor que en la regin B. Los promedios obtenidos son: para A es (136.4)/4 = 34.1, y para B es (161.6)/4= 40.4%, y la diferencia es 40.4-34.1 = 25.2/4 = 6.3%. 3ra. Comparacin. Puede tambin interesar comparar las regiones B y C, en este caso los coeficientes de c son los siguientes: c1 x 1B + c2 x 6B - c3 x 7C = (1)(41.4) + (1)(39.4) - (2)(32.6)= 80.8 - 65.2 = 15.6 La formula general aplicada a esta comparacin de contraste da: ALS(S) =
12 12 22 (2.44)(7 1)(14.2) + + = 5 5 5
6 (207.888) = 15.79 5
Como 15.6 supera a 15.79, quiere decir que no se llega a probar que el promedio de la regin B es mayor que el promedio de la regin C. 5.10 METODOS ABREVIADOS DE SIGNIFICACION BASADOS EN LA AMPLITUD. Link y Wallace (5.24) han ideado un mtodo fcil y rpido para probar la significacin estadstica entre los promedios de los tratamientos en los diseos Completamente Randomizados y Bloque Completo Randomizado (este ltimo lo veremos en el prximo Captulo), basado en la suma de las "amplitudes" de los datos de las muestras de los tratamientos. Mtodo para ms de dos tratamientos. Este mtodo lo vamos a ver aplicado al diseo Completamente Randomizado del Cuadro (5.7.1), en las siguientes etapas: 1ra. Etapa.- Determnese la amplitud existente en cada una de las 7 muestras (amplitud entre el dato ms alto y el ms bajo), as para las muestras 1A es 37-32=5, las dems se dan a continuacin:
Amplitudes 1A 5 + 2A 9 + 3A 8 + 4A 9 + 5B 9 + 6B 10 + 7C 16 Total amplitudes (A) 66
2da Etapa.- La suma de las amplitudes se multiplican por un factor tabular buscado en la Tabla IX para 0.05 con el nmero de repeticiones (r n) y el nmero de tratamiento (t). Para nuestro ejemplo r = 5 y t = 7, con los que encontramos que el valor tabular es 0.61. 3ra Etapa.- En esta etapa se obtiene la ALS (W) con la frmula que se ha aplicado a nuestro ejemplo: ALS (W) =
( factor _ tabular )(A) (061)(66) = 8.1 = r 5
Comprese esta ALS (W) con la ALS (T) de la Seccin (5.8) y se notar que la primera es ligeramente mayor que esta ltima, cuyo valor es 7.6.
27 de 59
Mtodo para dos tratamientos. Cuando las dos muestras son de igual tamao y los datos no pueden parearse, se comienza por deducir el promedio de las amplitudes dentro de las 2 muestras; esto es: A =
(A1 + A2)/2, y la diferencia entre los promedios, esto es d = x1 + x2 . Con estos dos valores
se calcula ta ' , tal como se indica a continuacin:
ta ' = ( d - 0) A .
El cero corresponde a la hiptesis nula. Este valor se compara con ta tabular buscado en el lado derecho de la Tabla X con el tamao de las muestras. Si ta ' > ta se desecha la hiptesis nula, en caso contrario se acepta. Se desea probar cul de dos racionamientos de cerdos representados por A y B es mejor, para esto un grupo de 10 cerdos es alimentado con la racin A y otro con la racin B; las ganancias en peso, se dan a continuacin: Rac. A: 26, 25, 12, 25, 20, 16, 18, 21, 11, 8. X = 182 Rac. B: 23, 22, 16, 29, 24, 15, 24, 25, 16, 14. X = 208
x A = 18.2
x B = 20.8
2(14.2 5) d = 2.6
La amplitud de la primera muestra es 18 y de la segunda muestra es 15, luego
A = (18 + 15) / 2 = 16.5, y d = 2.6; luego:

ta ' =
(d 0) (2.6 0) = = 0.158 16.5 A
La Tabla X da para n = 10 el valor ta = 0.304; como este valor no supera a 0.158, quiere decir que no se ha probado de que hay diferencia probada estadsticamente al nivel de 0.05. Si aplicamos la prueba de t a este mismo ejemplo encontramos que t = (2.6-0) / 2.585 = 1.006; y el valor de t0.05 para 18 GL en la Tabla III es 2.101, como t < t0.05 tampoco queda probado que hay diferencia entre los dos racionamientos. Algunas consideraciones sobre estos mtodos abreviados. La amplitud de la muestra constituye un sustituto apropiado de s, siempre que se trate de muestras provenientes de poblaciones normalmente distribuidas y pueda tolerarse una prdida de 5 a 10% de la informacin que pueden dar las muestras. Aqu cabe sealar que no es fcil contar con poblaciones normalmente distribuidas (curva normal). Las conclusiones que se deducen a base de la prueba de t en cambio no son muy afectadas por una moderada divergencia de la normalidad, y de hecho esta afectacin disminuye a medida que crece el tamao de la muestra. Las conclusiones basadas en la amplitud son pues ms sensibles a la anormalidad y en especial a la asimetra, razn por la qu debe tenerse menos confianza en estas pruebas. La eficiencia de la amplitud, decrece a medida que crece el tamao de la muestra, sucediendo lo contrario con la de t. Para muestras de n = 8, la amplitud adquiere su mxima
28 de 59
eficiencia; para n entre 12 y 22. Se recomienda dividir al azar la muestra en dos submuestras de igual tamao y emplear el promedio de las amplitudes de las dos para realizar las pruebas. En el artculo publicado por Lord (539) puede encontrarse mayor informacin sobre el empleo de la amplitud de las muestras y las tablas que se emplean. 5.11 PRUEBA DE SIGNIFICACION CON EL CONTROL DE DUNNETT.
En algunos estudios el objetivo principal es determinar si hay diferencias significativas de nuevos tratamientos sobre un testigo o control, sin interesar por el momento las comparaciones entre los nuevos tratamientos, lo que se deja para un posterior estudio. Las comparaciones de los nuevos tratamientos con el control, no son independientes ni al azar, requisitos que se requieren para las pruebas de t y de la DLS. Es por esto que Dunnett ha desarrollado una prueba que da una ALS(D) que sirve para juzgar todas las comparaciones con el control. Para aplicar esta prueba se requiere conocer los GL del error, el CM del error y el nmero de comparaciones con el control. La prueba es de dos colas y los niveles pueden ser de 0.05 o 0.01. Si sta prueba la aplicamos a nuestro ejemplo del Cuadro (5.7.1) y consideramos que el tratamiento 1A es el control, tenemos: GL el error = 28, CM del error = 14.2, nmero de comparaciones con el control = 6, o sea el nmero de tratamientos sin incluir el control. La frmula que debe emplearse es: ALS (DT) = td
sd
td : factor que es buscado en la Tabla XI con los GL del error del anlisis de la variancia y el nmero de comparaciones con el control.
sd : Desviacin estndar de las diferencias.

Con el nmero de comparaciones con el control que es 6 encontramos en la Tabla mencionada que no hay valor de td para 28 GL, por lo que tomamos los que corresponden a 24 y 30 GL que son 3.47 y 3.39, para hacer una interpolacin armnica en forma semejante a la que hemos visto en la Seccin 5.8 con lo que obtenemos que para 6 y 28 corresponde td = 3.413. Por otra parte determinamos
sd =
2( Sc 2 r ) =
2(14.2 5) = 2.383. Luego:
ALS (DT) = (3.413) (2.383) = 8.13 Las diferencias de los tratamientos con el control de este ejemplo las encontramos en la primera lnea del cuerpo del Cuadro (5.7.4); ntese que slo 3 diferencias son significativas, en este sentido esta prueba es un poco ms severa que la de Duncan. 5.12 COMENTARIOS SOBRE LAS DIFERENTES PRUEBAS DE SIGNIFICACION.
Cuando los experimentos tienen 2 tratamientos (t = 2), las pruebas de t y F son equivalentes y recomendables, y no dan ms fallas en sacar significaciones que lo que indica el nivel
29 de 59
adoptado para la prueba cuando la Ho es cierta (error I). Pero si el nmero de tratamiento es mayor de 2, en aquellas comparaciones del mayor promedio con el menor, las pruebas de t y Duncan dan ms fallas que el indicado por el nivel de significacin adoptado, dando t mayores porcentajes an que Duncan. As, si las pruebas se hacen a nivel de = 0.05, las probabilidades de sacar significaciones cuando no las hay entre promedios extremos son: Probabilidades de sacar significaciones en donde Ho es cierta en comparaciones extremas
Para : t = 2 t = 3 t = 4 t = 5 t = 6 t = 7 t = 10 Prueba de t 5% ( 5 ) 13% 40% 59% Prueba de Duncan 5% 10% 14% 19% 23% 26% 37% Prueba de Tukey 5% 5% 5% 5% 5% 5% 5%
En cambio, con la Prueba de Tukey la probabilidad, en este tipo de comparaciones, permanece siempre igual a 5%, siendo por lo tanto ms severa que las otras dos pruebas La prueba de Duncan tiene un porcentaje de fallas intermedio entre la de t y la de Tukey. En cuanto a la prueba de Scheff para las comparaciones entre promedios es an ms severa que la de Tukey, razn por la que se recomienda solo para pruebas de contraste entre promedios de grupos de tratamientos. La prueba de Tukey y de Scheff, dan menos errores del tipo I pero ms errores del tipo II (aceptar la Ho cuando esta hiptesis es falsa) que las pruebas de t y Duncan. La eleccin de una u otra prueba depende del grado de exigencia que se quiera tener en la obtencin de las significaciones. En este sentido es importante que en los informes de los estudios que se hacen se indique el tipo de prueba adoptado para las significaciones.
5.13 5.14 5.15
MODELO ADITIVO LINEAL Y VALORES ESPERADOS COMPONENETES DE LOS CUADRADOS MEDIOS EN EL C. R.
DE
LOS
REQUISITOS PARA QUE TENGA VALIDEZ EL ANALISIS DE VARIANCIA Y LAS PRUEBAS. PRUEBAS PARA DETERMINAR SI SE CUMPLEN LOS REQUISITOS
(5) De 100 comparaciones en las que la Ho sea cierta, en 5 de ellas se desechar esta hiptesis, afirmando en cada una de ellas que hay diferencia significativa, indebidamente, entre los promedios de las poblaciones respectivas. 30 de 59
5.16
DISEO COMPLETAMENTE RANDOMIZADO CON DESIGUAL NUMERO DE UNIDADES POR TRATAMIENTO
Muchas veces no es posible tener igual nmero de repeticiones para todos los tratamientos, hecho que suele ocurrir con relativa frecuencia, sobre todo en los experimentos de ganadera. As por ejemplo, si el experimentador est trabajando con vacas, algunas pueden enfermarse, morir, o bien el material experimental puede que no alcance por igual para todos los tratamientos. En el laboratorio tambin puede ocurrir que un asistente involuntariamente tome algunos resultados equivocadamente, olvide de tomarlos, etc. En estos casos el anlisis es poco afectado por el desigual nmero de repeticiones por tratamiento, pues solo resulta ligeramente ms complicado. Otra consecuencia es de que las comparaciones entre tratamientos que tienen menos repeticiones son menos precisas, que entre las que tiene mas repeticiones. Como ejemplo consideremos el anlisis de los resultados de la descendencia de tres reproductores vacunos, expresados por los pesos de los terneros hijos de cada reproductor a los 4 meses de nacidos; los dalos se dan en el Cuadro (5.16.1) en el que se han incluido los clculos para la determinacin de la SC dentro de cada tratamiento (reproductor).
Cuadro (5.16.1) Clculos de la SC de tratamientos, siendo desigual el nmero de repeticiones (datos Kgs. por ternero). Reproductores 1 2 3 90 73 101 92 Formulas de la SC aplicadas a cada tratamiento 100 83 84 81 76 99 90 101 92 93 528 88.0 50,544 96 64 103 364 91.0 34,122 1,498 = X . .
X
j
ij
= X i.
606 86.6
x i.
X ij
2
52,846
X i. i
r = TC
52,462
46,464
33,124
X ij
- TC = SC
384 6
4,080 5
998 3
5,462 = SC 14 = GL
Grados de Libertad
La SC dentro de tratamientos esta dada por:

31 de 59
X 2. 6062 X ij 2 i = (902 + 922 + . . . .+ 762 ) + . . . . + (1012 + ri 7 i j 2 364 962 + . . . + 1032 ) = 5,462; con 6 + 5 + 3 = 14 GL 4
SC dentro de Trat. = El total de las SC dentro de tratamientos, dividido entre el total de GL, da la variancia comn (error experimental); siendo en nuestro ejemplo: 5,462 / 14 = 390.1. El trmino de correccin general est dado por:
X 2 .. TC = = ri
( x1 . + .... + xt .)
r1 + ... + rt
( 606 + 528 + 364 )

7+6+4
= 132,000
La SC entre tratamientos est dado por la Ecuacin (5.16.1) que tiene en cuenta el nmero de repeticiones que tiene cada tratamiento: SC entre Tratamientos =
X t2. X t2 X 12 - TC = + ... + - TC r1 rt ri
2
(5.16.1)
6062 5282 3642 ( 606 + 528 + 364 ) + + = = 132,050 132,000 = 50 7 6 4 7+6+4

7, 6 y 4 son las repeticiones de los tratamientos 1, 2 y 3 respectivamente. La SC Total, puede obtenerse sumando las SC dentro y entre tratamientos, esto es: 5,462 + 50 = 5,512. En la misma forma los GL Total se obtienen sumando los GL de cada muestra ms los GL del nmero de muestras, esto es: 6 + 5 +3 + 2 = 16. La SC Total puede obtenerse tambin directamente a base de todas las observaciones de las muestras; esto es: SC Total =
ij
X ij 2 T C = 902 + 922 + . . . . + 642 - 132,000 = 5.512
Todos estos resultados estn ordenados en el Cuadro (5.16.2)

Cuadro (5.16.2) Anlisis de la variancia de las muestras (tratamientos de desiguales tamaos) Fuentes de Variabilidad SC GL CM Entre muestras (Tratamientos) 50 2 25.0 Dentro de muestras (Error Experimental) 5,462 14 390.1 Total 5,512 16 -
La prueba de F se realiza en la forma conocida, siendo en este caso F calculado 25.0/390.1=0.81, que comparado con F tabular para 0.05 y 2 con 14 GL, resulta no superarlo (el valor es 3.74), con lo que no queda rechazada la Hiptesis de que las muestras de 105 tratamientos provienen de diferentes poblaciones. Pese a esto para completar el ejemplo, pasamos a la prueba de la DLS, para lo cual debemos emplear la siguiente ecuacin (5.16.2).
DLS =
s2 s2 + ( t ) r1 r2
(5.16.2)
32 de 59
Siendo s2 el CM del error experimental, r1 y r2 el nmero de repeticiones de los tratamientos puestos en comparacin y t. el valor tabular de t de la Tabla III, buscado con los GL de libertad del error experimental. As, para la comparacin entre los tratamientos 1 y 2 al nivel de 0.05 tenemos: DLS =
390.1 390.1 (2.145) + 7 6
En caso de aplicar la prueba de Duncan, debe multiplicarse los valores de la AES de la Tabla VII por el valor s del error experimental, (en lugar de multiplicarse por s x para obtener un juego intermedio de amplitudes de significacin. Para cada comparacin deseada, debe multiplicarse el valor intermediario por la Ecuacin (5.16.3).
1 1 1/ 2 + r2 r1
Aplicando esto a nuestro ejemplo, tenemos que s del E.E. =
(5.16.3)
390.1 = 19.75. Los valores
de p para 14 GL del error y 0.05 de la Tabla VII son: p2 = 3.03 y p3 = 3.18. Los valores intermedios (I) son: Para dos tratamientos juntos en el orden de mrito I2 = (19.75) (3,03) = 59.8 Para dos tratamientos separado en el orden de mrito I3 = (19.75) (3.18) = 62.8 As, para comparar los reproductores 3 y 1 (separados; x3 = 91.0 y x1 = 86.6), el valor de la ALS(D)3 = 62.8
1/ 2 (1/ 4 + 1/ 7 ) = 27.8. Como 27.8 es mayor que la diferencia de x3 -
x1 , no hay significacin.
Para comparar los reproductores 3 y 2 (juntos, x3 = 91.0 y x 2 = 88.0), el valor de la ALS(D)2 = 59.8
1/ 2 (1/ 4 + 1/ 6 ) = 27.3.
Como 27.3 es mayor que la diferencia entre
x3 - x 2 , no hay significacin. Igual procedimiento se sigue para la comparacin que queda

entre los reproductores 2 y 1. Este es el procedimiento propuesto por Kramer (5.22), pero cuya validez no se ha verificado todava. Antes de terminar esta parte, debemos indicar que no se dan los modelos aditivos lineales I y II que corresponden al diseo Completamente Randomizado con desigual nmero de repeticiones; los lectores interesados en estos modelos pueden consultar el Captulo 7 del libro de Steel y Torrie (5.32).
33 de 59
5.17
DISEO COMPLETAMENTE RANDOMIZADO CON IGUAL NUMERO DE SUB UNIDADES POR UNIDAD.
Hay experimentos que demandan unidades experimentales muy grandes, digamos por ejemplo, parcelas de gran tamao o toda una fabrica por unidad, tambin suele realizarse algunas determinaciones en los experimentos que serian muy tediosas tomarlas en toda la unidad experimental, siendo por esto necesario sacar sub unidades de cada unidad. Por ejemplo, un experimentador puede tener parcelas de 20 surcos de 40 metros de largo, y no haber tiempo para realizar la cosecha de todo el experimento, en este caso se puede, resolver el problema muestreando cada parcela, para lo cual pueden tomarse cinco secciones de surco de 5 m. cada una al azar; pongamos otro ejemplo, en un experimento de variedades de caa de azcar en que se estudian rendimientos, hay generalmente inters de conocer el porcentaje de sacarosa de las variedades, en este caso puede sacarse al azar 4 muestras de caa por parcela y analizarlas separadamente en lugar de tomar una sola muestra, ya que hay variacin en el contenido de una muestra a otra, y por consiguiente una muestra resultara insuficiente para representar a la parcela. Las sub unidades que forman la muestra de cada parcela (unidad experimental) no debe tratarse de localizar previo examen de la parcela con la esperanza de obtener un mejor muestreo. El muestreo debe hacerse al azar o bien con una regularidad anticipadamente establecida, por ejemplo, de la cabecera, medio y pie de los surcos. Algunas veces es necesario hacer el muestreo una vez que la parcela esta cosechada. Esto es corriente en los experimentos de forrajes, en los que adems del rendimiento en materia verde, es interesante determinar el porcentaje de humedad y otros datos qumicos. Para stos, el material de la parcela previamente pesado y mezclado, debe ser muestreado del montn y llevado al laboratorio para su anlisis inmediato. En el muestreo de las parcelas de los experimentos, surgen las siguientes preguntas: o Cuntas sub unidades por muestra deben tomarse de cada unidad experimental?; o Conviene ms aumentar el nmero de sub unidades por unidad, o aumentar el nmero de unidades y disminuir el de sub unidades?, a fin de reducir el Error Experimental. Mediante los resultados de un experimento analizado previamente con unidades y sub unidades, se puede estudiar la relacin existente entre las unidades y sub unidades para reducir el Error Experimental, y determinar para futuros experimentos de la misma naturaleza, el nmero de unidades y sub unidades por tratamiento ms conveniente. Debe recalcarse que las recomendaciones deducidas de esta clase de estudio deben aplicarse a estudios y condiciones similares a la de los datos que han servido para los clculos. Hay dos fuentes de variabilidad que contribuyen a formar la variancia para las comparaciones entre los promedios de los tratamientos, estas son: 1.- La variabilidad entre las sub unidades de una misma unidad experimental. Al CM de esta variabilidad se denomina error de muestreo. 2.- La variabilidad entre las unidades experimentales de un mismo tratamiento. Al CM de esta variabilidad se denomina Error experimental.
34 de 59
Como ejemplo vamos a considerar los datos del Cuadro (5.17.1).

Cuadro (5.17.1) 3 Sub unidades por unidad experimental, 4 unidades experimentales por tratamiento y 9 tratamientos. Tratamientos (i) Unidades Sub Unidades j k 1 2 3 4 5 6 7 8 9 1 1 2 3 Total Unids. = x i j . 1 2 2 3 Total Unids. = x i j . 1 3 2 3 Total Unids. = x i j . 1 4 2 3 Total Unids. = x i j . Total Trats. = X i . . 21 34 48 103 37 23 45 105 35 41 36 112 30 50 27 107 427 67 77 71 215 96 106 126 328 146 145 167 458 100 80 78 258 1259 41 81 105 227 94 78 67 239 44 54 42 140 46 46 34 126 732 183 52 235 470 183 235 235 653 60 72 49 181 235 203 235 673 1977 59 69 50 178 56 47 235 338 80 51 59 190 54 160 63 277 983 70 68 70 208 180 84 183 447 85 73 41 199 120 65 221 406 1260 44 47 74 165 235 120 66 421 36 36 33 105 73 118 86 277 968 235 235 235 705 88 220 62 370 88 54 70 212 218 110 98 427 1713 113 55 60 228 131 82 193 406 178 235 126 539 216 176 64 456 1639
X . . . = 10,959
x . . . = 103.16
Una observacin o sub unidad experimental cualquiera del Cuadro (5.17.1) queda representado por X i j k en donde i = 1, . . ., 9; j = 1, . . . . , 4; k = 1, 2, 3. La notacin de puntos (X i j . ; X i . . ; X . . . ) es una forma abreviada muy til de representar los totales de un experimento. Los puntos reemplazan a los sub ndices para indicar que todos los valores que corresponden a dicho sub ndices han sido sumados. As, X i j . denota que todas las sub unidades de una particular unidad experimental han sido sumadas. Por ejemplo X42. corresponde al total 653, mientras que X74. corresponde a 277 del Cuadro (15.17.1). Por otra parte, X i.. denota que todas las unidades experimentales pertenecientes a un mismo tratamiento han sido sumadas; por ejemplo X 8.. corresponde a 1714, mientras que X 2.. corresponde a 1259. As tambin, X... sirve para denotar el total de todas las unidades del estudio o sea 10959. Para el anlisis, representamos el nmero de sub unidades por unidad por s, el nmero de unidades (repeticiones) por tratamiento por r y el nmero de tratamiento por t; en estas condiciones el Trmino de Correccin (TC) es calculado en la forma siguiente:
35 de 59
TC =
20, 650 X 2 ... 109592... = = 1,112,034 6, 227 srt 3 x 4 x9
X
SC Total Unidades =
i, j
2 ij
.
- TC =
2
i
1032 + 2152 + .... + 4562 - TC = 333,323 con 35 GL 3 4272 + 12592 + .... + 16392 - TC = 165,200 con 8GL 3x 4
SC Entre Tratamientos =
X
i
..
- TC =
Debemos indicar que sr = (3)( 4) = 12, es el nmero de sub unidades que tiene el total de cada tratamiento, o sea X i.. ; de aqu que el divisor sea sr. La SC Total Unidades, comprende a SC Entre Tratamientos y SC Unidades dentro de Tratamientos; de aqu que esta ltima SC pueda ser encontrada por simple sustraccin entre las dos primeras; en nuestro ejemplo resulta: 333,323 - 165,200 = 168,123. Con los grados de libertad se hace lo mismo: 35 - 8 = 27, estos son los GL de Unidades dentro de Tratamientos. El anlisis de la variancia de este experimento puede verse en el Cuadro (5.11.2):
Cuadro (5.17.12) Anlisis de las observaciones dadas en el Cuadro (5.17.1) Fuente de Variabilidad SC GL CM El CM es una estimacin de: Total unidades Entre Tratamientos Unidades Dentro de Tratamientos = Error Experimental Entre Sub Unidades Dentro de unidades = Error de Muestreo Total entre Sub Unidades 333,323 165,200 35 8 20,650
i 2 + 3 2 + (12 2 o 12 8 )
168,123
27
6,227
2 + 3 2
140,890 474,213
72 107
1,957 -
s = 1,957;
6, 227 1,957 s = = 1,423.3; 3

2 i
t 2 = 8
20, 650 6, 227 = 12
1720.8;
en
donde ti es una estimacin de
Puede comprobarse la SC de Unidades dentro de Tratamientos o Error Experimental deduciendo la SC de las unidades dentro de cada tratamiento y sumando todas las SC; as, para el tratamiento 1 (suelo) tenemos: SC de Unidades dentro de Tratamientos =
(1032 + 1052 + 1122 + 107 2 ) (103 + 105 + 112 + 107)2 4 = 15.0 3

36 de 59
El divisor 3 sirve para poner la SC que resulta en base de sub unidades a fin de que la suma de las SC de todos los tratamientos as calculados, sea igual a la SC de Unidades dentro de Tratamientos o Error Experimental que hemos obtenido por sustraccin; esto es 15.0 + . . . . . + 71,306 = 168,123; con (3)(9) = 27 GL, que son los mismos resultados que hemos obtenido antes en forma indirecta. La SC de Total Entre Sub Unidades est dado por: SC Total Entre Sub Unidades =
ijk
2 ijk
TC = 212 + 672 + . . . . +982 + 642 TC =
1,586,267 1,112,034 = 474,213. Con 107 GL. La SC del Error de Muestreo (entre sub unidades dentro de cada unidad) se obtiene restando, de la SC Total entre Sub Unidades la SC Total Unidades; en nuestro ejemplo es: SC del Error de Muestreo = 474,213 - 333,323 = 140,890 con 107 35 = 72 GL. Puede comprobarse esta SC tambin deduciendo las SC de las Sub Unidades de cada Unidad y sumndolas; para la primera unidad es:
1032 SC de la 1ra. unidad del 1er. tratamiento (S)=21 + 34 + 48 = 364.7 3

2 2 2
La suma de las SC de las 36 unidades de 364.7 + . . . . + 12,416.0 = 140,890; con (2)(36) = 72 GL, que es el mismo resultado que tenemos en el Cuadro (5.18.2). Para comparaciones entre tratamientos por la prueba de F, el Error Experimental es apropiado, pero no as el Error de Muestreo, debido a que la variancia Entre Tratamiento slo tiene un componente adicional (12i2 / 8) ms que la variancia del Error Experimental, este componente adicional se debe a los tratamientos, mientras que con respecto al Error de Muestreo tiene dos componentes, de los cuales uno solo es comn, que es 2. En nuestro ejemplo, una prueba vlida de la hiptesis nula (de que no hay diferencia entre los tratamientos) es (vase Cuadro 5.17.2):
i2 s 2 + 3 s 2 + 1 2 CM _ de_ Entre _Tratamientos 8 = 20, 650 = 3.31, con GL 8 y 27. = F= CM _ del _ Error _ Experimental 6, 227 s 2 + 3 s 2
El Error Experimental tiene un componente adicional que no tiene el Error de Muestreo, que se debe a las diferencias de una unidad respecto a otra de un mismo tratamiento; puede suceder, sin embargo, que este componente no exista y que la variabilidad entre las unidades de un mismo tratamiento se deba a la variabilidad entre las sub unidades dentro de las unidades; esto es a 2. Para probar esto se realiza la siguiente prueba de F:
CM _ del _ Error _ Experimental s + 3s 6, 227 = = = 3.18, con GL 27 y 72. F= 2 s CM _ del _ Error _ de _ Muestreo 1,957
2 2
En nuestro ejemplo esta prueba resulta altamente significativa. A partir de aqu la aplicacin de las pruebas de significacin se realizan en la forma expuesta para cada prueba, con slo tener presente que cada total debe dividirse entre su nmero apropiado de repeticiones. Se pueden aplicar las pruebas de Duncan, Tukey, etc.
37 de 59
5.18 MODELO ADITIVO LINEAL PARA SUB-UNlDADES Si los tratamientos de un experimento se ajustan al modelo I (tratamientos seleccionados por el experimentador); representa el promedio de los promedios de las poblaciones, poblaciones representadas por sus respectivas muestras en el experimento, una por cada tratamiento, +
i
representa los promedios de esas poblaciones, y
representa las
diferencias de los promedios de las poblaciones con respecto a . En este caso i 0. La i 2 no es un estimador de 2. Pero si los tratamientos estn ajustados al modelo II (tratamientos tomados al azar), no es solamente el promedio de !as poblaciones representadas en el experimento sino incluye tambin los promedios de las poblaciones que no estn representadas. En este caso los i de las poblaciones representadas en el experimento constituyen una muestra al azar de la poblacin de i y i 2 es un estimador de 2.
ij ijk
representa las discrepancias al azar de una unidad con respecto al promedio de la representa las discrepancias de una sub unidad con respecto al promedio de la
poblacin a la que pertenece el tratamiento. unidad a la que pertenece. El modelo lineal de una sub unidad es: X ijk =
+ i
+ ij +
ijk
(5.18,1)
Se asume que las distribuciones de los 3 ltimos trminos de la ecuacin son: (a) independientes; (b) se ajustan a la curva normal, y (c) que cada una de estas tres distribuciones tiene cero como promedio. Si aplicamos la ecuacin (5.18.1) a las sub unidades X411 , X412 y X413 del Cuadro (5.17.1), considerando que (donde hay flechas lase estimador): X411 = 183 X412 = 52 X413 = 235
x x 41. x4. .
= 103.16 = 156.67 = 164.75
x 41. x 4.. = 156.67 164.75 = 8.08 41 x 4.. x = 164.75 - 103.16 = 61.59 4

X411 x 41. = 183 156.67 = X413 x 41. = 235 156.67 = 26.33 78.33 411 413 X412 x 41. = 52 156.67 = 104.67 412 Tenemos segn esto que: X411 = 103.16 + 61.59 8.08 + 26.33 = 183 X412 = 103.16 + 61.59 8.08 104.67 = 52 X413 = 103.16 + 61.59 8.08 + 78.33 = 235 Estos valores son estimadores de: X ijk =
+ i
+ ij +
ijk
38 de 59
5.19
DISEO COMPLETAMENTE RANDOMIZADO CON DESIGUAL NUMERO DE UNIDADES y SUB-UNIDADES.
En algunos estudios ocurre con frecuencia que no es posible obtener igual nmero de unidades por muestra y de sub unidades por unidad; en estos casos el anlisis se aparta ligeramente del anlisis bsico, pero sin que cambie el procedimiento para calcular la SC, es decir, que cada X2 se divide entre el nmero de observaciones que forman cada X del numerador, as como tambin de que para el Termino de Correccin (TC) la (X)2 se divide entre el nmero total de observaciones involucradas en la (X) del numerador en la formula SC =
( X / r ) ( X ) / rt
2 2
Como ejemplo consideremos el estudio comparativo del tenor de nitrgeno, expresado en porcentaje de los suelos de tres valles que representamos por A, B y C, para cuyo fin se disponen de los anlisis provenientes de tres haciendas representativas del valle A (I, II y III), de dos del valle B (I y II) y de dos del valle C (I y lI); con dos anlisis de suelo de la hacienda lA, tres anlisis de la hacienda IIA ...... , y finalmente con dos anlisis de la hacienda IIC. los resultados de los anlisis se indican en el Cuadro (5.19.1) en "clave" ( 6 ).
Cuadro (5.19.1) Tres muestras con desigual nmero de unidades por muestra y desigual nmero de sub unidades por unidad Valles A B C Haciendas I II III I II I II Anlisis 7, 9 6, 9, 9 5, 6, 9 10, 12 8.7, 6 5, 4.5 5, 5
Las letras indican muestras, los nmeros romanos unidades y los nmeros latinos corresponden a resultados de cada sub unidad. Procediendo en la forma conocida tenemos: TC = (7 + 6 + 5 + . . . . . . . + 5 + 5)2 / 18 = 896.06 SC Total = 72 + 92 + . . . . . . . . + 52 + 52 +- TC = 82.94 SC Haciendas sin considerar valles =
(7 + 9 )2 + (6 + 9 + 9 )2 + ........ + (5 + 5)2 TC = 61.60

2 3 2
GL = 7 1 = 6
Anlisis dentro de Haciendas o Error de Muestreo se obtiene como sigue: SC Total SC Haciendas sin considerar Valles = 82.94 61.60 = 21.34 GL = 17 6 = 11 La SC de Haciendas sin Considerar Valles, se divide a continuacin en dos componentes: uno asociado con Valles y el otro asociado con Haciendas Dentro de Valles, tal como se puede ver a continuacin: SC Valles =
(7 + 9 + 6 + 9 + 9 + 5 + 6 + 9 )2
8
(5 + 4 + 5 + 5 + 5)2 + .... +
5
TC = 38 .94 ,
GL de Valles = 3 1 = 2 SC Haciendas Dentro de Valles o Error Experimental =

(6) Los porcentajes de nitrgeno se dan multiplicados por 100 a fin de trabajar con cifras enteras. 39 de 59
SC Haciendas Sin Considerar Valles - SC Valles = 61.50 38.94 = 22.66, GL = 6 2 = 4 Los resultados del anlisis de la variancia estn dados en el Cuadro (5.19.2)
Cuadro (5.19.2) Anlisis de la variancia de los datos del Cuadro (5.19.1) Fuentes de Variabilidad SC GL CM CM estimacin de: 2 Valles 38.94 2 19.47 + 2.64 2 + 5.84 2 Hdas. Dentro de Valles = Error Experimental Anlisis Dentro de Hdas. = Error de Muestreo TOTAL 22.66 21.34 82.94 4 11 17 5.67 1.94 2 + 2.51 2 2
Los resultados del anlisis estadstico no dan evidencia de que la variacin entre los promedios de los anlisis de nitrgeno de las haciendas sea mayor que la variacin entre los anlisis de las haciendas, ya que F = 5.67 / 1.94 = 2.99 no supera al F tabular. Los resultados del anlisis tampoco evidencia que existe diferencia significativa entre los promedios de nitrgeno de los tres valles, puesto que F = 19.47 / 5.67 = 3.43 no supera a F tabular. Esta ltima prueba es correcta cuando no hay significacin del Error Experimental sobre el Error de Muestreo; pero si hubiera superioridad, entonces recomendamos consultar Anderson y Bancroft (5.1) y Snedecor (5.24) para realizar esa prueba. En los estudios en los que es desigual el nmero de sub-unidades por unidad, la determinacin de los coeficientes de los componentes de la variancia no es tan sencilla. Para comprender mejor su determinacin representemos r i j como el nmero de observaciones (anlisis) en la hacienda j del valle i; por ejemplo, r13 = 3 y r21 = 2. Por otra parte, ri. es el total de observaciones hechas en el valle i ; por ejemplo, r1. = 2 + 3 + 3 = 8 y r2. = 2 + 3 = 5. Por ltimo, r.. es el total de observaciones; en nuestro ejemplo r.. = 18. Si k es igual al nmero de valles, k = 3. El coeficiente de 2 depende de si es componente del CM de Valles o si es componente del CM de Haciendas dentro de Valles. As, el coeficiente de este ltimo es:
2 r.. rij / ri . 2 2 2 2 2 2 2 i j 18 ( 2 + 3 + 3 ) / 8 + ( 2 + 3 ) / 5 + ( 3 + 2 ) / 5 = = 2.51 GL _ Error _ Exptal. 4

El coeficiente de 2 para Valles es:
2 2 rij / ri . rij / r.. j i ij = GL _ Valles

2
( 2 +3 +3 ) /8+ ( 2 + 3 ) /5+(3 + 2 ) /5( 2 +3 +... + 3 + 2 ) /18 = 2.64 =

2 2 2 2 2 2 2 2 2 2
40 de 59
El coeficiente de 2 es:
r.. X 2 . j / r..
j
GL _ Valles
5.20
18 (82 + 52 + 22 ) /18 = 5.84 2

s2 Y s 2 Y EL PLANEAMIENTO DE UN NUEVO
RELACION ENTRE EXPERIMENTO.
Al planear un nuevo experimento, surge la pregunta: Conviene ms aumentar el nmero de unidades y disminuir el de sub-unidades o hacer a la inversa? Las sub-unidades pueden representar fciles determinaciones, etc., o por el contrario pueden constituir costosas determinaciones o prdidas de un valioso material como consecuencia. Por otra parte las unidades pueden representar simples modificaciones de labores de rutina, o puede suceder que el aumento del nmero de unidades demande incrementar valioso material, equipo, etc. Todo esto hay que tener presente. La respuesta a esta pregunta puede verse en la pgina 198 de Ia 2da. edicin de este mismo libro.
41 de 59
ANEXO 1: Pruebas de Comparacin Mltiples de Medias

Cuando el anlisis de varianza aplicado detecta diferencias entre las modalidades estudiadas se utilizan comparaciones mltiples que diferencien el mximo nmero de tratamientos, es decir, emplear pruebas que detecten diferencias pequeas entre ellos. El hecho planteado es justamente un problema de precisin, pero si no se identifica como tal, se corre el riesgo de usar pruebas que proporcionan diferencias pequeas pero que no conservan el nivel de significancia establecido, tal es el caso del uso de la prueba de Duncan por ejemplo, en lugar de emplear Tukey. La prueba de Tukey cuando interesa efectuar todas las comparaciones entre pares de tratamientos, y se desea encontrar diferencias ms grandes entre las diferentes modalidades. La prueba de Dunnett cuando el inters se centra en comparar un conjunto de tratamientos con un testigo o tratamiento control. Para el clculo de esta prueba no es necesario realizar un ANVA.
A N E X O 2: Pruebas Mltiples de Medias

Las pruebas mltiples de medias son tiles para seleccionar l o los tratamientos, y se aplican cuando el Anlisis de Varianza declara diferencias significativas. Se denominan pruebas mltiples de medias, porque simultneamente se comparan varios promedios de los tratamientos. Algunas pruebas mltiples de medias, enunciadas en grado descendente de severidad son: a. Tukey b. SNK c. Duncan d. Dunnett Una severidad alta hace referencia a que se necesitan diferencias de promedios altas, para poder declarar diferencias significativas entre los tratamientos. Para el desarrollo de este ejemplo se tomarn datos, referidos a un diseo completamente al azar. PROCEDIMIENTO PARA REALIZAR LAS PRUEBAS MULTIPLES DE MEDIAS TUKEY
Obtener el valor del comparador WP
q (P, gl), donde P = nmero de medias a comparar; gl = grados de libertad del error. El
valor se busca en la tabla correspondiente.
42 de 59
Error experimental ajustado por el tamao de la muestra (nmero de repeticiones)
Ordenar los promedios de los tratamientos en forma descendente horizontalmente, y verticalmente en forma ascendente, y construir una matriz con las diferencias entre ellos. Regla de decisin: Si la diferencia entre dos promedios es mayor que el comparador WP, los promedios son estadsticamente diferentes. Si la diferencia entre dos promedios es menor o igual que WP, los promedios son iguales y se identifican con la misma literal. Construir la tabla de presentacin final de los resultados. Encontrar t-1 comparadores WP Continuar de la misma manera que en TUKEY. (Esta prueba es una modificacin o suavizacin de la prueba de TUKEY, por lo que se emplea la misma tabla)
SNK

DUNCAN Encontrar t-1 comparadores CD
TMa: el valor est dado por t-1 comparadores, grados de libertad del error y el nivel de significancia. Se obtiene el valor de TMa en una tabla de t modificada.
Despus continuar de la misma manera que en las otras pruebas.
EJEMPLO
En un experimento se compar el rendimiento de seis variedades de maz bajo el diseo experimental de completamente al azar con cinco repeticiones. El anlisis de varianza demostr que existen diferencias significativas entre los tratamientos, con una varianza del error (CMee) de 47.16. Realizar la comparacin mltiple de medias de acuerdo al criterio de Tukey y SNK para seleccionar la (o las) mejor (es) variedades. Los rendimientos promedio (expresados en kg./und. exp.) se presentan a continuacin: Variedad A Variedad B Variedad C Variedad D Variedad E Variedad F 48.0 29.2 37.4 57.6 26.6 39.8
43 de 59
TUKEY
Clculo del comparador : qa (6,20,0.05)= 4.45
WP= 4.45 * 3.0171 = 13.66
Construccin de la matriz de diferencias V4 57.6 V5 V2 V3 V6 V1 V4 26.6 29.2 37.4 39.8 48 57.6 31 28.4 20.2 17.8 9.6 0 V1 48 21.4 18.8 10.6 8.2 0 V6 39.8 13.2 10.6 2.4 0 V3 37.4 10.8 8.2 0 V2 29.2 2.6 0 V5 26.6 0
Presentacin Variedad V4 V1 V6 V3 V2 V5 Rendimiento promedio 57.6 48.0 39.8 37.4 29.2 26.6 Grupo Tukey a ab bc bc c c
SNK (Student Newman Keuls)
Encontrar t-1 comparadores Rangos Qa Sx WP 2 2.95 3.07 9.06 3 3.58 3.07 10.99 4 3.96 3.07 12.16 5 4.23 3.07 12.99 6 4.45 3.07 13.66
*Note que a medida que las medias se separan ms, se utiliza un comparador ms grande.

Construccin de la matriz de diferencias Presentacin final
44 de 59
Variedad V4 V1 V6 V3 V2 V5
Rendimiento promedio 57.6 48.0 39.8 37.4 29.2 26.6
Grupo SNK a b bc bcd cd d
DUNCAN Un experimento donde se emple un diseo completamente al azar, con cinco tratamientos y cuatro repeticiones, demostr alta significancia de acuerdo a la prueba de F, con un CMee de 0.041. Los promedios de los tratamientos (expresados en kg./und. exp.) son: Tratamiento A Tratamiento B Tratamiento C Tratamiento D Tratamiento E Encontrar t-1 comparadores Rangos TMa Sx CD

6.30 7.40 8.75 7.66 6.22
2 3.08 0.101 0.311
3 3.23 0.101 0.326
4 3.33 0.101 0.336
5 3.36 0.101 0.339
Construir la matriz de diferencias Elaborar la tabla de presentacin final.
45 de 59
ANEXO 3: Pginas Web tiles

GENERAL: DUNCAN: http://mipagina.cantv.net/ssinha/ http://mipagina.cantv.net/ssinha/duncan.htm
TUKEY:
http://mipagina.cantv.net/ssinha/cmtukey.htm
46 de 59
Calzada Benza, Jos (1982): Mtodos Estadsticos para la Investigacin, 5ta edicin. (Trascripcin de la pgina Web)
COMPARACION MULTIPLE POR EL METODO DE TUKEY

Escriba los datos segn el formato en la ayuda: Ayuda
(Salida de Resultados)
Rst1
Rst2
Ejemplo 1
Ejemplo 2
Acerca de ...
Ejecuta Tukey
Ayuda para la entrada de datos para el programa: Comparacin Mltiple por el Mtodo de Tukey: (A) Diseos Bsicos: Completamente aleatorio, Bloques aleatorios y Cuadrado Latino. Consideremos los 3 diseos bsicos pero excluyendo el caso cuando se trata del experimento factorial. Todos los datos para la entrada al programa deben ser escritos en una sola hilera, separados por uno o ms espacios en blanco y consistente en: Nmero-de-tratamientos Promedios-de-tratamientos Valor-Tabular Cuadrado-medio-errorexperimental Nmero-efectivo-de-replicaciones Nota: La enumeracin anterior ocup 2 lneas para escribir, pero como se ha dicho anteriormente, todos los datos sern entrados en el programa en una sola hilera separados por uno o ms espacios en blanco. Nmero-efectivo-de-replicaciones : para todos los diseos bsicos y siempre que el experimento no sea factorial, es igual al nmero de replicaciones del diseo. Para un diseo en bloques aleatorios, el nmero efectivo de replicaciones tambin ser igual al nmero de bloques. En el caso de un diseo cuadrado latino, el nmero-efectivo-de-replicaciones = nmero de filas = nmero de columnas = nmero de tratamientos. Cmo buscar el Valor tabular que ser usado por el Mtodo de Tukey? El mtodo de comparacin mltiple necesita solamente un valor tabular. Este valor tabular se obtiene de una tabla estadstica llamada: Percentage points of studentized range statistics (En espaol: Puntos porcentuales de estadsticas de rangos estudiantizados). Esta tabla existe para los niveles de significacin de 1% y 5%. Para buscar el valor tabular en la mencionada tabla, Ud. Debe de disponer primero de las 3 informaciones siguientes: i. El nivel de significacin que ser usado, ii. El nmero de tratamientos que tiene el diseo, iii. El valor numrico de grados de libertad (abreviatura: g.l.) del error del diseo. Encontrar que el valor tabular es igual a 4.37 Ya que tenemos toda la informacin que necesitamos, ahora debe escribir la siguiente hilera de datos en la caja del texto superior del programa: 6 28.8 24 14.6 19.9 13.3 18.7 4.37 11.79 5 47 de 59
Calzada Benza, Jos (1982): Mtodos Estadsticos para la Investigacin, 5ta edicin. Luego haga click sobre el botn que se llama: Ejecutar Tukey. Nota: Obsrvese que tambin ser correcto entrar la siguiente hilera de datos en la caja del texto: 6 ; 28.8 24 14.6 19.9 13.3 18.7 ; 4.37 11.79 5 Esta entrada tiene la ventaja que se usa ; para indicar el comienzo y el fin de ciertos subgrupos de datos para una mejor visualizacin. El Programa no tomar en cuenta el separador ; en el procesamiento de datos. Nota: En algunos casos para hallar los valores tabulares, ser necesario usar la interpolacin lineal, ya que la tabla presenta discontinuidades entre los valores presentados, tanto en las filas como en las columnas. Suceder esto por ejemplo si un diseo tiene 26 GL para el error experimental y/o hay ms de 20 tratamientos. (B) Experimentos Factoriales: En el caso de los experimentos factoriales, el clculo del nmero efectivo de replicaciones depender del tipo de promedios que sern comparados que pueden ser promedios unidimensionales, bidimensionales, tridimensionales, etc.; y tambin segn los factores que se consideran en los promedios que sern comparados, como por ejemplo A, B, C, AB, AC, etc. La informacin que se presenta acerca del clculo del nmero efectivo de replicaciones para experimentos factoriales en la ayuda del Rango mltiple de Duncan en la seccin de la Computacin estadstica por Java Script es aplicable tambin en el caso de comparaciones mltiples por el mtodo de Tukey. Para leer esta ayuda, haga click sobre DUNCAN en el men principal y luego haga click sobre la ayuda.. Nota: Para otros diseos tales como Parcela Dividida y Parcela Sub Dividida que tiene ms de un tipo del error experimental, ser necesario seleccionar el CM del error experimental que sea apropiado para una comparacin en el momento de hacer la entrada de datos al programa.
ANEXO 4: DIFERENCIA MNIMA SIGNIFICATIVA

Mtodo de Tukey o Mtodo de la Diferencia Significativa Honesta de Tukey (DSH) Este procedimiento fue propuesto por Tukey (1952) para probar la hiptesis
H0 : j = k (j k)
Este mtodo es muy similar en la aplicacin al de DMS, salvo por el hecho de que en lugar de utilizar las distribuciones de t como base para realizar las comparaciones, se emplea la distribucin del rango estandarizado o estudientizado:
y i. y i '. ( i. i '.) Q , t, r = CM EE . r
Se rechaza H0:
=
i
i ' si
Nosotros comparamos y i. y i '. con
Q , t, glerror
CMEE r
y i. y i '. Q , t, glerror
CMEE r
48 de 59
Q , t , r es el simo percentil de la distribucin rango estandarizado. Tablas para hallar los valores de Q , t , glerror son dadas por Harter (1960), Hochberg and
Donde Tamhane (1987). En esta prueba se utiliza un slo valor con el cual se comparan todos los posibles pares de medias. El mtodo de comparacin de Tukey fue reformado por Kramer (1956) para casos en el que el nmero de rplicas no es igual. Este mtodo es conocido como mtodo de Tukey-Kramer. Este simplemente reemplaza la expresin dada en Tukey por:
y i . y i '. Q , t , glerror
1 1 1 CMEE + 2 ri. ri '.
Donde r =
ri t
en un D.C.A. Si el nmero de repeticiones no es demasiado desigual,
Spotuall y Stoline (1973) dieron un mtodo para probar la hiptesis H0 :
=
i
i' .
Rechazar H0 si
i i' Q , t, glerror
CMEE min( ri , ri'
Cuando las rplicas son muy diferentes este mtodo es menos sensible que el de Scheff. Cuando utilizar el test de Tukey el test de Scheff? Utilizar Tukey: Cuando el tamao de las muestras seleccionadas para cada grupo son iguales. Cuando el inters fundamental es comparar promedios entre dos grupos y son mltiples las comparaciones que estamos haciendo. Por lo tanto este test de Tukey es el ms utilizado, y al parecer, el ms recomendado por los estadsticos, aunque al parecer an no hay acuerdo. http://mipagina.cantv.net/ssinha/cmtukey.htm Utilizar Scheff: El tamao de los grupos seleccionados es diferente (sea en el ejemplo anterior era mejor este test), y Otras comparaciones, ms que las simples comparaciones de dos promedios son de inters. A este tipo de comparaciones se les llama tambin contrastes.
49 de 59
APENDICE 1: TABLAS ESTADISTICAS

TABLA 1: DISTRIBUCIN NORMAL ___________________________________ 51 TABLA 2: DISTRIBUCIN t DE STUDENT ______________________________ 52 TABLA 3: DISTRIBUCIN X2_________________________________________ 53 TABLA 4: DISTRIBUCIN F DE FISHER________________________________ 54 TABLA 5: AMPLITUD ESTUDIANTIZADA SIGNIFICATIVA DE DUNCAN ______ 57 TABLA 6: AMPLITUD ESTUDIANTIZADA SIGNIFICATIVA DE TUKEY ________ 59
50 de 59
TABLA 1: DISTRIBUCIN NORMAL
Desv. Normal X 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3.0
0.00 0.5000 0.4602 0.4207 0.3821 0.3446 0.3085 0.2743 0.2420 0.2119 0.1841 0.1587 0.1357 0.1151 0.0968 0.0808 0.0668 0.0548 0.0446 0.0359 0.0287 0.0228 0.0179 0.0139 0.0107 0.0082 0.0062 0.0047 0.0035 0.0026 0.0019 0.0013
0.01 0.4960 0.4562 0.4168 0.3783 0.3409 0.3050 0.2709 0.2389 0.2090 0.1814 0.1562 0.1335 0.1131 0.0951 0.0793 0.0655 0.0537 0.0436 0.0351 0.0281 0.0222 0.0174 0.0136 0.0104 0.0080 0.0060 0.0045 0.0034 0.0025 0.0018 0.0013
0.02 0.4920 0.4522 0.4129 0.3745 0.3372 0.3015 0.2676 0.2358 0.2061 0.1788 0.1539 0.1314 0.1112 0.0934 0.0778 0.0643 0.0526 0.0427 0.0344 0.0274 0.0217 0.0170 0.0132 0.0102 0.0078 0.0059 0.0044 0.0033 0.0024 0.0018 0.0013
0.03 0.4880 0.4483 0.4090 0.3707 0.3336 0.2981 0.2643 0.2327 0.2033 0.1762 0.1515 0.1292 0.1093 0.0918 0.0764 0.0630 0.0516 0.0418 0.0336 0.0268 0.0212 0.0166 0.0129 0.0099 0.0075 0.0057 0.0043 0.0032 0.0023 0.0017 0.0012
0.04 0.4840 0.4443 0.4052 0.3669 0.3300 0.2946 0.2611 0.2296 0.2005 0.1736 0.1492 0.1271 0.1075 0.0901 0.0749 0.0618 0.0505 0.0409 0.0329 0.0262 0.0207 0.0162 0.0125 0.0096 0.0073 0.0055 0.0041 0.0031 0.0023 0.0016 0.0012
0.05 0.4801 0.4404 0.4013 0.3632 0.3264 0.2912 0.2578 0.2266 0.1977 0.1711 0.1469 0.1251 0.1056 0.0885 0.0735 0.0606 0.0495 0.0401 0.0322 0.0256 0.0202 0.0158 0.0122 0.0094 0.0071 0.0054 0.0040 0.0030 0.0022 0.0016 0.0011
0.06 0.4761 0.4364 0.3974 0.3594 0.3228 0.2877 0.2546 0.2236 0.1949 0.1685 0.1446 0.1230 0.1038 0.0869 0.0721 0.0594 0.0485 0.0392 0.0314 0.0250 0.0197 0.0154 0.0119 0.0091 0.0069 0.0052 0.0039 0.0029 0.0021 0.0015 0.0011
0.07 0.4721 0.4325 0.3936 0.3557 0.3192 0.2843 0.2514 0.2206 0.1922 0.1660 0.1423 0.1210 0.1020 0.0853 0.0708 0.0582 0.0475 0.0384 0.0307 0.0244 0.0192 0.0150 0.0116 0.0089 0.0068 0.0051 0.0038 0.0028 0.0021 0.0015 0.0011
0.08 0.4681 0.4286 0.3897 0.3520 0.3156 0.2810 0.2483 0.2177 0.1894 0.1635 0.1401 0.1190 0.1003 0.0838 0.0694 0.0571 0.0465 0.0375 0.0301 0.0239 0.0188 0.0146 0.0113 0.0087 0.0066 0.0049 0.0037 0.0027 0.0020 0.0014 0.0010
0.09 0.4641 0.4247 0.3859 0.3483 0.3121 0.2776 0.2451 0.2148 0.1867 0.1611 0.1379 0.1170 0.0985 0.0823 0.0681 0.0559 0.0455 0.0367 0.0294 0.0233 0.0183 0.0143 0.0110 0.0084 0.0064 0.0048 0.0036 0.0026 0.0019 0.0014 0.0010
51 de 59
TABLA 2: DISTRIBUCIN t DE STUDENT
r
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120
0,25
0,2
0,15
0,1
0,05
0,025
0,01
0,005
0,0005
1,000 0,816 0,765 0,741 0,727 0,718 0,711 0,706 0,703 0,700 0,697 0,695 0,694 0,692 0,691 0,690 0,689 0,688 0,688 0,687 0,686 0,686 0,685 0,685 0,684 0,684 0,684 0,683 0,683 0,683 0,681 0,679 0,677 0,674
1,376 1,061 0,978 0,941 0,920 0,906 0,896 0,889 0,883 0,879 0,876 0,873 0,870 0,868 0,866 0,865 0,863 0,862 0,861 0,860 0,859 0,858 0,858 0,857 0,856 0,856 0,855 0,855 0,854 0,854 0,851 0,848 0,845 0,842
1,963 1,386 1,250 1,190 1,156 1,134 1,119 1,108 1,100 1,093 1,088 1,083 1,079 1,076 1,074 1,071 1,069 1,067 1,066 1,064 1,063 1,061 1,060 1,059 1,058 1,058 1,057 1,056 1,055 1,055 1,050 1,045 1,041 1,036
3,078 1,886 1,638 1,533 1,476 1,440 1,415 1,397 1,383 1,372 1,363 1,356 1,350 1,345 1,341 1,337 1,333 1,330 1,328 1,325 1,323 1,321 1,319 1,318 1,316 1,315 1,314 1,313 1,311 1,310 1,303 1,296 1,289 1,282
6,314 2,920 2,353 2,132 2,015 1,943 1,895 1,860 1,833 1,812 1,796 1,782 1,771 1,761 1,753 1,746 1,740 1,734 1,729 1,725 1,721 1,717 1,714 1,711 1,708 1,706 1,703 1,701 1,699 1,697 1,684 1,671 1,658 1,645
12,706 4,303 3,182 2,776 2,571 2,447 2,365 2,306 2,262 2,228 2,201 2,179 2,160 2,145 2,131 2,120 2,110 2,101 2,093 2,086 2,080 2,074 2,069 2,064 2,060 2,056 2,052 2,048 2,045 2,042 2,021 2,000 1,980 1,960
31,821 6,965 4,541 3,747 3,365 3,143 2,998 2,896 2,821 2,764 2,718 2,681 2,650 2,624 2,602 2,583 2,567 2,552 2,539 2,528 2,518 2,508 2,500 2,492 2,485 2,479 2,473 2,467 2,462 2,457 2,423 2,390 2,358 2,326
63,656 9,925 5,841 4,604 4,032 3,707 3,499 3,355 3,250 3,169 3,106 3,055 3,012 2,977 2,947 2,921 2,898 2,878 2,861 2,845 2,831 2,819 2,807 2,797 2,787 2,779 2,771 2,763 2,756 2,750 2,704 2,660 2,617 2,576
636,578 31,600 12,924 8,610 6,869 5,959 5,408 5,041 4,781 4,587 4,437 4,318 4,221 4,140 4,073 4,015 3,965 3,922 3,883 3,850 3,819 3,792 3,768 3,745 3,725 3,707 3,689 3,674 3,660 3,646 3,551 3,460 3,373 3,290
52 de 59
TABLA 3: DISTRIBUCIN X 2
0.995
3.93E-05 1.00E-02 7.17E-02
0.99
1.57E-04 2.01E-02
0.975
9.82E-04 5.06E-02
0.95
3.93E-03
0.9
1.58E-02
0.75
0.102 0.575 1.213 1.923 2.67 3.45 4.25 5.07 5.90 6.74 7.58 8.44 9.30 10.17 11.04 11.91 12.79 13.68 14.56 15.45 16.34 17.24 18.14 19.04 19.94 20.8 21.7 22.7 23.6 24.5 33.7 42.9 52.3 61.7 71.1 80.6 90.1 -0.674
0.5
0.455 1.386 2.37 3.36 4.35 5.35 6.35 7.34 8.34 9.34 10.34 11.34 12.34 13.34 14.34 15.34 16.34 17.34 18.34 19.34 20.3 21.3 22.3 23.3 24.3 25.3 26.3 27.3 28.3 29.3 39.3 49.3 59.3 69.3 79.3 89.3 99.3 0.000
0.25
1.323 2.77 4.11 5.39 6.63 7.84 9.04 10.22 11.39 12.55 13.70 14.85 15.98 17.12 18.25 19.37 20.5 21.6 22.7 23.8 24.9 26.0 27.1 28.2 29.3 30.4 31.5 32.6 33.7 34.8 45.6 56.3 67.0 77.6 88.1 98.6 109.1 0.674
0.1
2.71 4.61 6.25 7.78 9.24 10.64 12.02 13.36 14.68 15.99 17.28 18.55 19.81 21.1 22.3 23.5 24.8 26.0 27.2 28.4 29.6 30.8 32.0 33.2 34.4 35.6 36.7 37.9 39.1 40.3 51.8 63.2 74.4 85.5 96.6 107.6 118.5 1.282
0.05
3.84 5.99 7.81 9.49 11.07 12.59 14.07 15.51 16.92 18.31 19.68 21.0 22.4 23.7 25.0 26.3 27.6 28.9 30.1 31.4 32.7 33.9 35.2 36.4 37.7 38.9 40.1 41.3 42.6 43.8 55.8 67.5 79.1 90.5 101.9 113.1 124.3 1.645
0.025
5.02 7.38 9.35 11.14 12.83 14.45 16.01 17.53 19.02 20.5 21.9 23.3 24.7 26.1 27.5 28.8 30.2 31.5 32.9 34.2 35.5 36.8 38.1 39.4 40.6 41.9 43.2 44.5 45.7 47.0 59.3 71.4 83.3 95.0 106.6 118.1 129.6 1.96
0.01
6.63 9.21 11.34 13.28 15.09 16.81 18.48 20.1 21.7 23.2 24.7 26.2 27.7 29.1 30.6 32.0 33.4 34.8 36.2 37.6 38.9 40.3 41.6 43.0 44.3 45.6 47.0 48.3 49.6 50.9 63.7 76.2 88.4 100.4 112.3 124.1 135.8 2.33
0.005
7.88 10.60 12.84 14.86 16.75 18.55 20.3 22.0 23.6 25.2 26.8 28.3 29.8 31.3 32.8 34.3 35.7 37.2 38.6 40.0 41.4 42.8 44.2 45.6 46.9 48.3 49.6 51.0 52.3 53.7 66.8 79.5 92.0 104.2 116.3 128.3 140.2 2.58
1 2 3 4 5 6 7 8
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100
0.103 0.352 0.711 1.145 1.635 2.17 2.73 3.33 3.94 4.57 5.23 5.89 6.57 7.26 7.96 8.67 9.39 10.12 10.85 11.59 12.34 13.09 13.85 14.61 15.38 16.15 16.93 17.71 18.49 26.5 34.8 43.2 51.7 60.4 69.1 77.9 -1.64
0.211 0.584 1.064 1.610 2.20 2.83 3.49 4.17 4.87 5.58 6.30 7.04 7.79 8.55 9.31 10.09 10.86 11.65 12.44 13.24 14.04 14.85 15.66 16.47 17.29 18.11 18.94 19.77 20.6 29.1 37.7 46.5 55.3 64.3 73.3 82.4 -1.28
0.115 0.297 0.554 0.872 1.239 1.647 2.09 2.56 3.05 3.57 4.11 4.66 5.23 5.81 6.41 7.01 7.63 8.26 8.90 9.54 10.20 10.86 11.52 12.20 12.88 13.56 14.26 14.95 22.2 29.7 37.5 45.4 53.5 61.8 70.1 -2.33
0.216 0.484 0.831 1.237 1.690 2.18 2.70 3.25 3.82 4.40 5.01 5.63 6.26 6.91 7.56 8.23 8.91 9.59 10.28 10.98 11.69 12.40 13.12 13.84 14.57 15.31 16.05 16.79 24.4 32.4 40.5 48.8 57.2 65.6 74.2 -1.96
0.207 0.412 0.676 0.989 1.344 1.735 2.16 2.60 3.07 3.57 4.07 4.60 5.14 5.70 6.26 6.84 7.43 8.03 8.64 9.26 9.89 10.52 11.16 11.81 12.46 13.12 13.79 20.7 28.0 35.5 43.3 51.2 59.2 67.3 -2.58
9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100
53 de 59
TABLA 4: DISTRIBUCIN F DE FISHER
54 de 59
55 de 59
56 de 59
TABLA 5. PRUEBA DE DUNCAN

GL Error 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Nivel
0.5 0.1 0.5 0.1 0.5 0.1 0.5 0.1 0.5 0.1 0.5 0.1 0.5 0.1 0.5 0.1 0.5 0.1 0.5 0.1 0.5 0.1 0.5 0.1 0.5 0.1 0.5 0.1 0.5 0.1
2 3 4 5 6 7
Amplitudes Estudiantizadas Significativas para 0.05 y 0.01.

8 9 10 12 14 16 18 20
p = nmero de promedios del ordenamiento que se esta probando

18.0 90.0 6.09 14.0 4.50 8.26 3.93 6.51 3.64 5.79 3.48 5.24 3.35 4.95 3.26 4.74 3.20 4.60 3.15 4.48 3.11 4.30 3.98 4.29 3.06 4.26 3.03 4.21 3.01 4.17 18.0 90.0 6.09 14.0 4.50 8.30 4.01 6.80 3.74 5.98 3.56 5.51 3.47 5.22 3.36 5.00 3.34 4.86 3.30 4.73 3.27 4.63 3.23 4.35 3.21 4.46 3.19 4.42 3.16 4.37 18.0 90.0 6.09 14.0 4.50 8.60 4.02 6.90 3.79 6.11 3.64 5.65 3.54 5.30 3.47 5.14 3.41 4.99 3.37 4.89 3.35 4.77 3.36 4.68 3.30 4.62 3.27 4.55 3.25 4.50 18.0 90.0 6.09 14.0 4.50 8.70 4.02 7.00 3.83 6.18 3.66 5.73 3.56 5.45 3.52 5.23 3.47 5.08 3.43 4.95 3.39 4.86 3.36 4.76 3.35 4.69 3.33 4.63 3.31 4.58 18.0 90.0 6.09 14.0 4.50 8.80 4.02 7.10 3.83 6.28 3.68 5.81 3.60 5.53 3.55 5.32 3.50 5.17 3.45 5.08 3.41 4.54 3.40 4.84 3.38 4.74 3.37 4.70 3.36 4.64 18.0 90.0 6.09 14.0 4.50 8.90 4.02 7.10 3.83 6.36 3.68 5.89 3.61 5.61 3.56 5.40 3.52 5.28 3.47 5.13 3.44 5.05 3.41 4.92 3.41 4.84 3.39 4.76 3.38 4.72 18.0 90.0 6.09 14.0 4.50 8.90 4.02 7.20 3.83 6.40 3.68 5.93 3.61 5.66 3.56 5.47 3.52 5.32 3.47 5.20 3.45 5.05 3.44 4.96 3.42 4.88 3.41 4.85 3.40 4.77 18.0 90.0 6.09 14.0 4.50 9.00 4.02 7.20 3.83 6.40 3.68 6.00 3.61 5.75 3.56 5.51 3.52 5.36 3.47 5.24 3.46 5.12 3.44 5.02 3.44 4.94 3.42 4.87 3.42 4.81 18.0 90.0 6.09 14.0 4.50 9.00 4.02 7.30 3.83 6.50 3.68 6.00 3.61 5.80 3.56 5.60 3.52 5.40 3.47 5.28 3.46 5.15 3.46 5.07 3.45 4.96 3.44 4.91 3.43 4.84 18.0 90.0 6.09 14.0 4.50 9.00 4.02 7.30 3.83 6.50 3.68 6.10 3.61 5.80 3.56 5.60 3.52 5.50 3.47 5.36 3.46 5.24 3.46 5.13 3.45 5.04 3.45 4.95 3.44 4.90 18.0 90.0 6.09 14.0 4.50 9.10 4.02 7.40 3.83 6.60 3.68 6.20 3.61 5.90 3.56 5.70 3.52 5.50 3.47 5.42 3.46 5.28 3.46 5.17 3.45 5.08 3.46 5.00 3.46 4.94 18.0 90.0 6.09 14.0 4.50 9.20 4.02 7.40 3.83 6.70 3.68 6.20 3.61 5.90 3.56 5.70 3.52 5.60 3.47 5.48 3.46 5.34 3.46 5.22 3.46 5.13 3.46 5.04 3.46 4.97 18.0 90.0 6.09 14.0 4.50 9.30 4.02 7.50 3.83 6.70 3.68 6.30 3.61 6.00 3.56 5.80 3.52 5.70 3.47 5.54 3.47 5.38 3.47 5.24 3.47 5.14 3.47 5.06 3.47 4.99 18.0 90.0 6.09 14.0 4.50 9.30 4.02 7.50 3.83 6.80 3.68 6.30 3.61 6.00 3.56 5.80 3.52 5.70 3.48 5.55 3.48 5.39 3.48 5.26 3.47 5.15 3.47 5.07 3.47 5.00
57 de 59
GL Error 16 17 18 19 20 22 24 26 28 30 40 60 100
Nivel
0.5 0.1 0.5 0.1 0.5 0.1 0.5 0.1 0.5 0.1 0.5 0.1 0.5 0.1 0.5 0.1 0.5 0.1 0.5 0.1 0.5 0.1 0.5 0.1 0.5 0.1 0.5 0.1
2
3.00 4.13 2.98 4.10 2.97 4.07 2.96 4.06 2.95 4.02 2.93 3.99 2.92 3.96 2.91 3.93 2.90 3.91 2.88 3.39 2.86 3.62 2.83 3.76 2.80 3.71 2.77 3.64
3
3.15 4.34 3.13 4.29 3.12 4.27 3.11 4.24 3.10 4.22 3.08 4.17 3.07 4.14 3.06 4.11 3.04 4.06 3.04 4.06 3.01 3.99 2.98 3.92 2.95 3.85 2.92 3.80
4
3.22 4.45 3.22 4.41 3.21 4.38 3.19 4.35 3.18 4.33 3.17 4.28 3.15 4.24 3.14 4.21 3.15 4.16 3.12 4.16 3.10 4.10 3.08 4.05 3.05 3.98 3.02 3.90
p = nmero de promedios del ordenamiento que se esta probando 5 6 7 8 9 10 12 14

3.30 4.54 3.28 4.50 3.27 4.46 3.26 4.45 3.25 4.40 3.24 4.36 3.22 4.33 3.21 4.30 3.20 4.25 3.20 4.22 3.17 4.17 3.14 4.12 3.12 4.00 3.09 3.98 3.34 4.60 3.33 4.55 3.32 4.55 3.31 4.50 3.30 4.47 3.29 4.42 3.26 4.39 3.27 4.36 3.28 4.34 3.23 4.32 3.22 4.24 3.20 4.17 3.18 4.11 3.15 4.04 3.37 4.67 3.36 4.63 3.35 4.59 3.35 4.56 3.34 4.55 3.32 4.48 3.31 4.44 3.30 4.41 3.30 4.38 3.25 4.36 3.27 4.30 3.24 4.23 3.22 4.17 3.19 4.09 3.39 4.72 3.38 4.68 3.37 4.64 3.37 4.61 3.36 4.58 3.36 4.56 3.34 4.49 3.34 4.45 3.33 4.43 3.32 4.41 3.30 4.34 3.26 4.27 3.25 4.21 3.25 4.14 3.41 4.75 3.40 4.72 3.39 4.68 3.38 4.64 3.38 4.61 3.37 4.57 3.37 4.56 3.36 4.50 3.33 4.47 3.35 4.45 3.33 4.37 3.31 4.31 3.29 4.23 3.28 4.17 3.43 4.79 3.42 4.75 3.41 4.71 3.41 4.67 3.40 4.65 3.39 4.60 3.38 4.57 3.38 4.53 3.37 4.51 3.37 4.48 3.35 4.41 3.33 4.34 3.31 4.25 3.29 4.20 3.44 4.85 3.44 4.80 3.44 4.73 3.43 4.72 3.42 4.68 3.42 4.65 3.41 4.62 3.41 4.58 3.40 4.55 3.40 4.54 3.39 4.45 3.37 4.39 3.35 4.35 3.34 4.26 3.45 4.88 3.45 4.85 3.45 4.74 3.44 4.75 3.44 4.71 3.44 4.66 3.44 4.64 3.43 4.60 3.43 4.60 3.42 4.58 3.42 4.51 3.40 4.44 3.40 4.40 3.38 4.31
16
3.46 4.91 3.46 4.86 3.46 4.82 3.46 4.79 3.46 4.76 3.45 4.71 3.45 4.67 3.45 4.65 3.45 4.62 3.44 4.61 3.44 4.54 3.43 4.47 3.42 4.42 3.41 4.34
18
3.47 4.92 3.47 4.88 3.47 4.84 3.47 4.81 3.46 4.78 3.46 4.74 3.46 4.70 3.46 4.67 3.46 4.65 3.46 4.63 3.46 4.57 3.45 4.50 3.45 4.45 3.44 4.38
20
3.47 4.94 3.47 4.89 3.47 4.85 3.47 4.82 3.47 4.79 3.47 4.75 3.47 4.72 3.47 4.69 3.47 4.67 3.47 4.65 3.47 4.58 3.47 4.55 3.47 4.48 3.47 4.41
58 de 59
TABLA 6. TABLA DE TUKEY

Grados de libertad del error
Amplitudes Estudiantizadas Significativas de Tukey (AES (T), al 5% de probabilidad.

Nmero de Tratamientos
2
17.97 6.08 4.50 3.93 3.64 3.46 3.34 3.26 3.20 3.15 3.11 3.08 3.06 3.03 3.01 3.00 2.98 2.97 2.96 2.95 2.92 2.89 2.86 2.83 2.80 2.77
3
26.98 8.33 5.91 5.04 4.60 4.34 4.16 4.04 3.95 3.88 3.82 3.77 3.73 3.70 3.67 3.65 3.63 3.61 3.59 3.59 3.53 3.49 3.44 3.40 3.36 3.31
4
32.82 9.80 6.82 5.76 5.22 4.90 4.68 4.53 4.41 4.33 4.26 4.20 4.15 4.11 4.08 4.05 4.02 4.00 3.98 3.96 3.90 3.85 3.79 3.74 3.68 3.63
5
37.08 10.88 7.50 6.29 5.67 5.30 5.06 4.89 4.76 4.65 4.57 4.51 4.45 4.41 4.37 4.33 4.30 4.28 4.25 4.23 4.17 4.10 4.04 3.98 3.92 3.86
6
40.41 11.74 8.04 6.71 6.03 5.63 5.36 5.17 5.02 4.91 4.82 4.75 4.69 4.64 4.59 4.56 4.52 4.49 4.47 4.45 4.37 4.30 4.23 4.16 4.10 4.03
7
43.12 12.44 8.48 7.05 6.33 5.90 5.61 5.40 5.24 5.12 5.03 4.95 4.88 4.83 4.78 4.74 4.70 4.67 4.65 4.62 4.54 4.46 4.39 4.31 4.24 4.17
8
45.40 13.03 8.85 7.35 6.58 6.12 5.82 5.60 5.43 5.30 5.20 5.12 5.05 4.99 4.94 4.90 4.86 4.82 4.79 4.77 4.68 4.60 4.52 4.44 4.36 4.29
9
47.36 13.54 9.18 7.60 6.80 6.32 5.82 6.00 5.77 5.59 5.46 5.35 5.27 5.19 5.08 5.03 4.99 4.96 4.92 4.90 4.81 4.72 4.63 4.55 4.47 4.39
10
49.07 13.99 9.46 7.83 6.99 6.49 6.16 5.92 5.74 5.60 5.49 5.39 5.32 5.25 5.20 5.15 5.11 5.07 5.04 5.01 4.92 4.82 4.73 4.65 4.56 4.47
11
50.59 14.39 9.72 8.03 7.17 6.65 6.30 6.05 5.87 5.72 5.61 5.51 5.43 5.36 5.31 5.26 5.21 5.17 5.14 5.11 5.01 4.92 4.82 4.73 4.64 4.55
12
51.96 14.75 9.95 8.21 7.32 6.79 6.43 6.18 5.98 5.83 5.71 5.61 5.53 5.46 5.40 5.35 5.31 5.27 5.23 5.20 5.10 5.00 4.90 4.81 4.71 4.62
13
53.20 18.08 10.15 8.37 7.47 6.92 6.55 6.29 6.09 5.93 5.81 5.71 5.63 5.55 5.49 5.44 5.39 5.35 5.31 5.28 5.18 5.08 4.98 4.88 4.78 4.68
14
54.33 15.38 10.35 8.52 7.60 7.03 6.66 6.39 6.19 6.03 5.90 5.80 5.71 5.64 5.57 5.52 5.47 5.43 5.39 5.36 5.25 5.15 5.04 4.94 4.94 4.74
15
55.36 15.65 10.53 8.66 7.72 7.14 6.76 6.48 6.28 6.11 5.98 5.88 5.79 5.71 5.65 5.59 5.54 5.50 5.46 5.43 5.32 5.21 5.11 5.00 4.90 4.80
16
56.32 15.91 10.69 8.79 7.83 7.24 6.85 6.57 6.36 6.19 6.06 5.95 5.86 5.79 5.72 5.66 5.61 5.57 5.53 5.49 5.38 5.27 5.16 5.06 4.95 4.85
17
57.22 16.14 10.84 8.91 7.93 7.34 6.94 6.65 6.44 6.27 6.13 6.02 5.93 5.85 5.78 5.73 5.67 5.63 5.59 5.55 5.44 5.33 5.22 5.11 5.00 4.89
18
58.04 16.37 10.98 9.03 8.03 7.34 7.02 6.73 6.51 6.34 6.20 6.09 5.99 5.91 5.85 5.79 5.73 5.69 5.65 5.61 5.49 5.38 5.27 5.15 5.04 4.93
19
58.83 16.57 11.11 9.13 8.12 7.51 7.10 6.80 6.58 6.40 6.27 6.15 6.05 5.97 5.90 5.84 5.79 5.74 5.70 5.66 5.55 5.43 5.31 5.20 5.09 4.97
20
59.56 16.77 11.24 9.23 8.21 7.59 7.17 6.87 6.64 6.47 6.33 6.21 6.11 6.03 5.96 5.90 5.84 5.79 5.75 5.71 5.59 5.47 5.36 5.24 5.13 5.01
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 24 30 40 60 120 Inf
59 de 59

Apuntes de Estadistica - 2012

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Apuntes de Estadistica - 2012

Uploaded by

Copyright:

Available Formats

Calzada Benza, Jos (1982): Mtodos Estadsticos para la Investigacin, 5ta edicin.

APUNTES SOBRE ESTADISTICA APLICADA

s = 2.10 cm. s = 2.40 cm.

MODELO ADICTIVO LINEAL

DESVIACION ESTANDAR DE LOS PROMEDIOS ( x s)

5! 5 x4 x3 x 2 x1 = = 10 2!(5 2)! 2 x1(3 x 2 x1)

12 + 30 2 + ..... + 29 2 (104) 2 / 5 = 12.221 5

15.5 2 + 16.5 2 + ..... + 20.5 2 (208) 2 / 10 = 7.48 10

N n N 1 52 = (8.64) (0.866) = 7.48 51

As sustituyendo valores en la formula con los de nuestro ejemplo, tenemos:

( N n) /( N 1) de la formula anterior se denomina fraccin de muestreo, y

(100,000 100) /(100,00 1) = 0.998

4.10 DESVIACION ESTANDAR DE LAS DIFERENCIAS DE LOS PROMEDIOS ( d s)

poblaciones o sea A B = d . Si repetimos esta operacin de extraer pares de muestras,

d y como desviacin estndar d , a sta la denominamos desviacin estndar de

(B) Cuando las variancias son homogneas y n1 n2

(C) Cuando las variancias no son homogneas y n1 y n2 = n

(D) Cuando las variancias no son homogneas y n1 n2

lmites. 4.12 DISTRIBUCION DE

PARA VALORES DE PROMEDIOS ( x s)

es igual a la forma de la curva normal de la

es iguales a 1.60 m., al aplicarles la frmula de iguales a

x que sean iguales a x = 1.60 - 0.033 = 1.567, darn valores de z = 1.

, todas las cuales tienen las siguientes caractersticas

= 0 1, se encuentra el 68.26 % de todos los valores de

de esta distribucin. Entre z 3z = 0 3 se encuentra el 99.73 % de todos los

bien es un estimador de x , sin embargo no es igual. Es por esto que ( x ) / s x da un

Dib. (4.13.1) Curvas de las distribuciones de t que corresponden a (n - 1) = 8 y (n - 1) = 4.

As tambin: P ( - 2.306 < tg < 2.306) = 0.95

< - x + 2.306 s x ) > x - 2.306 s x )

En forma simplificada: P ( l2 >

ANALISIS DEL DISEO COMPLETAMENTE RANDOMIZADO CON MAS DE DOS TRATAMIENTOS

Totales : Promedios : SC dentro de A =

SCdeA + SCdeB + SCdeC GL

SCdeA + SCdeB + SCdeC 3(GL)

Total _ de _ la _ SC _ dentro _ de _ Tratamientos 36 = =4 Total _ de _ los _ GL _ dentro _ de _ Tratamientos 4

= Error Experimental Variancia entre Tratamientos : s2 entre tratamientos =

202 + 242 + 282 722 /(4 x3) 8 10 = = = 4 (3 1) 2

Variancia Total : s2 Total

SC Total = 12 + 52 + . . . . . + 82 + 82 722 / 12 = 68, con 11 GL

Simbolizacin de la suma de los cuadrados de las repeticiones de un tratamiento cualquiera.

= 22 + 62 + 42 + 82 = 120 ; 72 + 32 + 82 + 62 = 158; etc.

= 202 + 242 + 282 = 1760

El promedio de las repeticiones de un tratamiento es: El promedio general de un experimento es:

La suma de las SC Dentro de Tratamientos queda simbolizada en la forma siguiente:

202 + 242 + 282 722 = 8 = r 12

x .. + tA , estima la A = + A , de la poblacin A x .. + tB , estima la B = + B , de la poblacin B x .. + tC , estima la C = + C , de la poblacin C

( 2 ) Vale tambin decir Entre Tratamiento. 13 de 59

PRUEBAS DE SIGNIFICACION DE F, t Y DLS.

= Si es que las diferencias

= i son todas iguales a cero (i

i. . . = i . Esta variabilidad esperada est representada por :

/ (t 1), si es que los tratamientos pertenecen al Modelo Fijo o I; y, por

En el caso de que ri vara de un tratamiento a otro.

El CM de tratamientos fijos es estimador de El CM de tratamientos al azar es estimador de

R ri / R Siendo n0 = ; en donde R = ri , o sea nmero total de unidades experimentales. r 1

Esta razn est estimada por: Fc =

CM _ de _ Tratamientos 16 = = 4 CM _ del _ Error 4

1 = 2 = 3 = 0, en este caso 2 es cero. Y por lo tanto:

o +0 CM _ de _ Tratamientos F = = = 1 CM _ del _ Error o2

CM _ de _ Tratamientos CM _ del _ Error

Para nuestro ejemplo que tenemos en el Cuadro 5.4.2, resulta: S =

Para nuestro ejemplo tenemos: Para A vs. B: t =

(4 6) = 1.4142 (4 8) = 1.4142 (8 6) = 1.4142