You are on page 1of 43

REVISIN DE LOS FUNDAMENTOS DE ESTADSTICA

I. OBJETIVO
Revisar los principales conceptos y aplicaciones de los fundamentos de estadstica, debido a su
importante relacin con las actividades de control de calidad en la industria alimentaria.
II. REVISIN DE LITERATURA
2.1 Distribuciones de Frecuencia
2.1.1 Definiciones relativas a las distribuciones de frecuencias
Distribucin de Frecuencia
Segn Velasco (2001) es una disposicin tabular de los datos por clase junto con las
correspondientes frecuencias de clase; entendiendo por clase a una coleccin de datos y por
frecuencia de clases al nmero de individuos que pertenecen a cada clase.
Segn Hernndez (2006) el objetivo de la distribucin de frecuencias es convertir los datos sueltos
(que no han sido organizados, y que dicen muy poco acerca de la poblacin estudiada), en
informacin organizada; ello significa hacer hablar los nmeros.

Frecuencia Relativa
Segn UNALM (2012) es la proporcin o porcentaje de observaciones con respecto al total (n) que
existen en la clase o categora i. Se tiene: fr
i
= f
i
/ n
Se cumple:

i
=1
Frecuencia Acumulada
Segn Gmez (1998) para ciertos fines resulta til conocer, adems de la frecuencia simple de una
clase, el nmero de observaciones que son mayores o menores que uno de sus lmites, esto es, la
frecuencia acumulada. Para obtener las frecuencias acumuladas se procede a sumar las
frecuencias absolutas (o relativas) en sentido ascendente o descendente segn se quieran
acumular hacia arriba o hacia abajo. Las frecuencias acumuladas resultan tiles para el clculo
de la mediana y de las otras medidas percentiles.


Clase (nmero de intervalos)
Segn Gmez (1998) las clases son agrupaciones de los distintos valores que toma la variable. Las
clases deben ser exclusivas, es decir todos los valores deben estar incluidos en alguna clase y
mutuamente excluyentes, a saber, un valor no puede pertenecer a ms de una clase.
Segn Gmez (1998) el intervalo de clase indica la amplitud de la clase y la diferencia entre el
lmite real superior y el lmite real inferior de la clase.
Rango
Segn UNALM (2012) el rango de un grupo de nmeros es la diferencia entre el nmero mayor y el
menor del grupo.
2.1.2 Representaciones Grficas
Segn Hernndez (2006) su finalidad consiste en presentar, a golpe de vista, el comportamiento
de la distribucin. Se usan, por tanto, como complemento del trabajo estadstico, y a veces, como
punto de partida para el posterior anlisis estadstico.
Histograma de frecuencia
Segn Hernndez (2006) consiste en un grupo de rectngulos con bases sobre el eje horizontal,
con centros en la marca de clase y ancho igual al tamao del intervalo de clase.

Figura. 1 Histograma de la variable peso en Kilogramos

Fuente: UNC (2012)

Diagrama de frecuencia
Ortegn (2010) los diagramas de frecuencia se representan por medio de lneas verticales, cuya
altura est dada por los valores de las frecuencias, ya sean absolutas o relativas. Si la
representacin se refiere a las frecuencias acumuladas (absolutas o relativas), esta se har por
medio de lneas horizontales, ubicando en el eje vertical los valores de la frecuencia acumulada.
Este ltimo diagrama, denominado diagrama de frecuencias acumuladas, genera una serie de
lneas horizontales que dan la sensacin de los peldaos de una escalera.
Tabla. 1 tabla de frecuencias Figura. 2 Diagrama para una variable discreta

Fuente: UNC (2012)
Diagrama de barras
Segn Cazau (2010) representacin grfica donde cada barra representa una frecuencia parcial. En
el eje de las ordenadas se indican las frecuencias absolutas, y en el eje de abscisas se representan
los valores de la variable x. De esta manera, las barras ms altas tienen mayor frecuencia.
Segn Cazau (2010) existen diferentes tipos de diagramas de barras, de los cuales se ilustran tres:
las barras simples, las barras superpuestas y las barras adyacentes. Los dos ltimos tipos dan
informacin sobre dos variables al mismo tiempo, que son sexo y estado civil en los ejemplos que
siguen:


Figura. 3 Diferentes formas de diagramas de barras

Fuente: Cazau (2010)
Polgono de frecuencias
Segn Hernndez (2006) es un grfico de lnea de las frecuencias de clase, graficadas contra las
marcas de clase. Se puede obtener uniendo los puntos medios de los extremos superiores de los
rectngulos en el histograma.
Figura. 4 Variable peso en Kilogramos

Fuente: UNC (2012)

2.1.3 Medidas algebraicas de las distribuciones de frecuencia
2.1.3.1 Medidas de exactitud
Media aritmtica o promedio
Segn UNALM (2012) la media aritmtica o promedio de un conjunto de datos provenientes de
una poblacin (N) o muestras (n), es igual al cociente entre la suma total de sus valores y el
nmero de observaciones.
Media o promedio poblacional: = (1/N)
i=1
E
N
Xi
Media o promedio muestral: X = (1/n)
i=1
E
N
Xi
Propiedades:
1 La media aritmtica localiza la parte central de un conjunto de observaciones.
2 Para un conjunto de observaciones la media es nica.
3 si la media sustituye a cada observacin, la suma total no cambia.
4 La suma de las desviaciones de las observaciones con respecto al promedio es igual a cero.
5 La suma de los cuadrados de las desviaciones de las observaciones con respecto a la media es
mnima.
6 La media es afectada por valores extremos (altos o pequeos). Es una desventaja de la media
La mediana
Segn UNALM (2012) la mediana es el valor que ocupa la posicin central de un conjunto de
datos, previamente ordenados: X
(1)
, X
(2),,
X
(n).

Propiedades:
1 la mediana divide las n observaciones en dos partes iguales. El 50% con valores menores de la
mediana y el otro 50% con valores mayores a la mediana.
2 Las observaciones no est influenciada por valores extremos.
3 La suma de las desviaciones absolutas de las observaciones con respecto a la mediana es un
valor mnimo.
La moda
Segn UNALM (2012) la moda de un conjunto de datos es el valor que ocurre con mayor
frecuencia.
Propiedades:
1 La moda no puede existir o puede haber ms de una moda en un conjunto de datos.
2 La moda no est afectada por valores extremos.
3 Se aplica tanto para informacin cualitativa como cuantitativa
2.1.3.2 Medidas de precisin
Segn UNALM (2012) son medidas estadsticas que permiten conocer el grado de dispersin o
variabilidad dentro de un conjunto de datos. Se usan para comparar la variabilidad entre dos o
ms conjunto de datos.
Rango
Segn UNALM (2012) el rango amplitud de un conjunto de observaciones es igual a la diferencia
entre el valor mximo y el mnimo.
R = X
mx
- X
mn
Desventajas: - Queda afectada por valores extremos.
- No mide la variabilidad de los datos intermedios.
Variancia
Segn UNALM (2012) la variancia se define como la media aritmtica de los cuadrados de las
desviaciones respecto a su media.
- Variancia poblacional: o
2
= 1/N i=1E
N
(Xi - )
2

- Variancia muestral: S
2
= 1/(n-1) i=1E
n
(Xi X)
2

Se deduce que la variancia de un conjunto de observaciones esta expresada en unidades
cuadrticas; por ejemplo, si las unidades de las observaciones es metros, la variancia ser
expresada en metros cuadrados. Este hecho dificulta la interpretacin de la variancia.

Desviacin estndar
Segn UNALM (2012) la desviacin estndar de un conjunto de observaciones se define como la
raz cuadrada de la variancia. Se expresa con signo positivo. Es decir:
-
Desviacin Estndar poblacional: o = o
2
- Desviacin Estndar muestral: S = S
2


Como puede observarse la desviacin estndar de un conjunto de valores est dada en las mismas
unidades de la variable en estudio, por ejemplo, si las unidades de las observaciones son metros,
la desviacin estndar estar en metros. Este hecho brinda una clara ventaja con respecto a la
variancia en cuanto a su interpretacin.

Coeficiente de variabilidad
Segn UNALM (2012) es una medida de dispersin relativa que se define como el cociente entre la
desviacin estndar y la media aritmtica de un conjunto de observaciones.
- Coeficiente de variabilidad poblacional: CV = (o/)* 100
- Coeficiente de variabilidad muestral: CV = (S/X)* 100

De estas expresiones se deduce que el coeficiente de variabilidad no se puede definir si el
promedio es igual a cero. Si el promedio es un valor negativo, debe considerarse su valor absoluto
para evaluar el coeficiente de variabilidad.
Se utiliza el coeficiente de variabilidad cuando las unidades de medida de las observaciones de dos
o ms conjuntos de datos son diferentes o si sus promedios son diferentes. Caso contrario se usa
la desviacin estndar y varianza.




2.2 Relacin entre dos variables
Correlacin
Segn Hernndez (2006) se define a la correlacin, como el grado de relacin lineal entre dos
variables. Se emplea para determinar en qu medida una ecuacin lineal (una recta), describe o
explica la relacin entre dos variables.
Coeficiente de correlacin
Segn Hernndez (2006) esta medida es aplicada a fin de cuantificar hasta qu grado estn
relacionadas dos variables. Se simboliza por R2 y se denomina como coeficiente de correlacin al
cuadrado, o coeficiente de determinacin. El valor de este coeficiente oscila entre 0 R2 1, sin
embargo en la prctica es muy frecuente usar r (minscula) denominada simplemente coeficiente
de correlacin lineal que oscila entre los valores -1 r 1.
Interpretacin del coeficiente de correlacin (r)
Segn Hernndez (2006) el coeficiente de correlacin se limita a valores entre -1 y 1, un valor r= 0
significa que no hay relacin entre X e Y. Para valores de r diferentes de 0 no hay una relacin
directa entre X, Y. Valores negativos de r indican una relacin inversa de X, Y. El valor lmite de r=1
indica una relacin perfecta entre X, Y.

Regresin: Lineal y Curvilnea
La regresin lineal
Segn Martn (2004) es una tcnica estadstica para modelar e investigar la relacin entre dos o
ms variables. Tiene aplicacin en la industria para investigar la relacin entre el rendimiento de la
produccin y uno o ms factores del (o de los) que depende, como la temperatura, la humedad
ambiental, la presin, la cantidad de insumos, etc; con base en este anlisis se puede pronosticar
el comportamiento de una variable que se desea estimar
Segn Martn (2004) el anlisis de Regresin Lineal Simple trata el problema de predecir o estimar
una variable, llamada respuesta, a partir de otra variable llamada predictiva o explicativa. A la
primera se le conoce tambin como la variable independiente y se le representa generalmente
con la letra Y, mientras que la segunda se le conoce como variable independiente y se le
representa generalmente con la letra X.
Figura. 5 Diferentes nubes de puntos y modelos de regresin para ellas


















Fuente: Rus (2009)

La regresin curvilnea
Segn Martn (2004) se da cuando una regresin no se ajusta a una recta (regresin lineal), por lo
tanto se debe ajustar a los datos un polinomio del menos orden posible. La razn matemtica de
tal proceder es que cualquier funcin (como la de regresin, aun cuando nos sea desconocida) se
puede tericamente obtener de modo aproximado a travs de un polinomio mediante el
desarrollo en serie de Taylor.

2.3 Distribuciones ms comunes
Distribucin Normal
Segn Luiz (2005) la distribucin normal se caracteriza porque los valores se distribuyen en forma
de campana, en torno a un valor central que coincide con el valor medio de la distribucin: un 50%
de los valores estn a la derecha de este valor central y otro 50% a la izquierda.

Figura 6. Curva de Distribucin Normal o Gaussiana

Fuente Luiz (2005)
Segn Luiz (2005) la distribucin normal tiene varias propiedades tericas importantes, entre las
que se encuentran las siguientes:
La distribucin de los eventos grficamente se asemeja a una campana simtrica.
Las mediciones de tendencia central (media, mediana, moda, alcance me-dio y eje medio) son
idnticas.
La dispersin media es igual a 1.33 desviaciones estndar.
La variable aleatoria tiene un alcance terico de , aunque en la prctica caer entre los
valores de 3 desviaciones estndar.
La probabilidad de ocurrencia de un evento es igual a la frecuencia relativa
Segn Luiz (2005) el modelo matemtico que representa la funcin de densidad de probabilidad se
denota mediante:
2
) *( 2 / 1
2
2
1
) (

H
=
x
e x f

Dado que e y son nmeros constantes, cada que se modifique la media de la poblacin o la
desviacin estndar se generar una distribucin de probabilidad diferente, lo que propicia que
exista un nmero infinito de combinaciones y se requerir, para el clculo de probabilidades, un
nmero infinito de tablas.
Ejemplo :
Los pesos de las bolsas de un lote de frutas confitadas marca FRUTIT siguen una distribucin
normal con media 3kg y desviacin estndar de 0.25kg. Calcule la probabilidad de que al escoger
una bolsa al azar.
- Su peso sea mayor que 3.2kg
- Su peso sea menor que 2.85kg
Solucin:

= peso de una bolsa de fruta confitada de dicho lote.
= 3kg


= 0.254

(

)

(

)


Distribucin Binomial
Experimento binomial
Segn UNALM (2012) hay muchos experimentos que se ajustan ya sea exacta o aproximadamente
a las siguientes propiedades:
1 el experimento consiste en una secuencia de n intervalos (experimento de bernoulli), donde n
se fija antes del experimento.
2 los intentos son idnticos, y cada uno de ellos puede dar lugar a dos posibles resultados,
llamados: xitos (E) o fracaso (F).
3 los intentos son independientes, por lo que el resultado de cualquier intento particular no
afecta el resultado de cualquier otro intento.
4 la probabilidad de xito es constante de un intento a otro; se denota esta probabilidad por
P(E)= . la probabilidad de fracaso es P(F)=1
La funcin de probabilidad binomial
Segn UNALM (2012) dado un experimento binomial entonces v.a.d (variable aleatoria discreta)
binomial X se define como el nmero de xitos en n intentos, y su funcin de probabilidad est
dada por:
Figura. 7 Frmula de la probabilidad binomial

Fuente: UNALM (2012)

Ejemplo :
El gerente de una empresa afirma que la probabilidad de producir yogures en mal estado es 0.25,
dado q la condicin de un yogurt es diferente de la de otros, el nmero de yogures en mal estado
por jaba debe ser una variable aleatoria con distribucin binomial. El departamento de control de
calidad selecciona al azar 100 jabas de 4 yogures cada una obtenindose los siguientes resultados.
Nmero de yogures
en mal estado
0 1 2 3 4
frecuencia 13 16 30 31 10

Hiptesis:
H
o
: el nmero de yogures en mal estado sigue la distribucin binomial
H
1
: el nmero de yogures en mal estado no sigue la distribucin binomial
= 0.05
P
(x=0)
= C
4
0
0.25
0
(1-0.25)
4
=0.316
P
(x=1)
= C
4
1
0.25
1
(1-0.25)
3
=0.422
P
(x=2)
= C
4
2
0.25
2
(1-0.25)
2
=0.211
P
(x=3)
= C
4
3
0.25
3
(1-0.25)
1
=0.047
P
(x=4)
= C
4
4
0.25
4
(1-0.25)
0
=0.004

X u
i
P
i
e
i

0 13 0.316 0.316
1 16 0.422 0.422
2 30 0.211 0.211
3 31 0.047 0.047
4 10 0.004 0.004
100 1

X
CALC
2
= (13-31.6)
2
+. (10 5.1)
31.6 5.1

X
CALC
2
= 287.676
X
TAB
2
(0.95, 3 gl)= 7.815
Existe evidencia estadstica para afirmar que el nmero de yogures en mal estado no sigue una
lnea de distribucin binomial a un nivel de significancia de 0.05

Distribucin de Poisson
Segn UNALM (2012) una v.a.d X tiene distribucin de Poisson con parmetro > 0 si su funcin
de probabilidad es:


Donde:
p(x, ) = probabilidad de que ocurran x xitos, cuando el nmero promedio de ocurrencia de ellos
es .
= media o promedio de xitos por unidad de tiempo, rea o producto
e = 2.718
x = variable que nos denota el nmero de xitos que se desea que ocurra
Propiedades de un proceso Poisson:
1 Los suceso son de la misma clase u homogneos.
2 Los sucesos en un intervalo son independientes de los sucesos en otros intervalos no
superpuestos.
3 El promedio de sucesos por unidad de intervalo (t = 1), es conocido e igual a v.
Ejemplo :
En el laboratorio de microbiologa de alimentos se descubri la presencia de nuevas cepas de
bacillus sp. en las muestra de arroz, cultivados en el medio de polimixina los cuales se encuentran
en pequeas colonias formadas.
Se selecciono una muestra de 70 porciones de 1c.c. de arroz y se registro en cada c.c en nmero
de colonias formadas en el agar polimixina obtenindose lo siguiente:
Nro. De colonias 0 1 2 3 4 5 a ms
Nro de porciones 3 30 15 10 7 5

Solucin:
H
0
: El nmero de colonias en 1 c.c. de arroz sigue una distribucin de Poisson.
H
a
: El nmero de colonias en 1 c.c. de arroz no sigue una distribucin de Poisson.


P(x=0) =0.129
P(x=1) = 0.265
P(x=2) = 0.271
P(x=3) = 0.184
P(x=4) =0.094
P(x=5) =1- P(x 4) = 0.057
Nro. De colonias 0 1 2 3 4 a ms
Nro de porciones 3 30 15 10 12
E
i
9.03 18.55 18.97 12.88 10.57


Con un nivel de significancia del 5% se concluye que el nmero de colonias formadas en 1 c.c de
arroz no sigue una distribucin de Poisson.
Distribucin Hipergeomtrica
Segn UNALM (2012) los supuestos que se consideran para una distribucin Hipergeomtrica son:
1 La poblacin o conjunto donde se hace el muestreo tiene N elementos, individuos u objetos
(una poblacin finita).
2 Cada elemento puede ser caracterizado como un xito (E) o fracaso (F), y hay A xitos en la
poblacin entonces son (N-A) fracasos.
3Se saca una muestra, sin reemplazo, de n elementos de tal forma que sea igualmente probable
cada subconjunto de tamao n.

La funcin de probabilidad Hipergeomtrica
La variable aleatoria discreta Hipergeomtrica X est definida como el numero de xitos en la
muestra de tamao n.
Notacin: X~ Hiper(N, n, A)
Si X~ Hiper(N, n, A) entonces su distribucin de probabilidad es:

(

)(

)
(

)

Para x entero tal que mx. (0, n-N+A) x min (n, A)
La media y la variancia de X
Si X~ Hiper(N, n, A) entonces:

) (


)
Los experimentos que tienen este tipo de distribucin tienen las siguientes caractersticas:
a) Al realizar un experimento con este tipo de distribucin, se esperan dos tipos de
resultados.
b) Las probabilidades asociadas a cada uno de los resultados no son constantes.
c) Cada ensayo o repeticin del experimento no es independiente de los dems.
d) El nmero de repeticiones del experimento (n) es constante.

Ejemplo :
Un embarque de aditivos qumicos llega en 15 contenedores, 2 de los cuales no cumplen con el
requerimiento de pureza. Se eligen 3 contenedores al azar, sin reemplazo, para hacer una
inspeccin del producto. Calcule la probabilidad de que al menos uno de los contenedores que no
cumplen los requerimientos est en la muestra.
Solucin:
La v.a.d Hipergeomtrica X se define como el nmero de contenedores que no cumplen los
requisitos, entonces: X ~ Hiper(N, n, A) ~ Hiper(15, 3, 2)


(

)(

)
(

)
mx. (0, 0-15+2) x min (3, 2)


(

)(

)
(

)(

)
(

)

2.4 Pruebas estadsticas
2.4.1 Paramtricas
2.4.1.1 Diseos Experimentales
Diseo completamente al azar (D.C.A)
Segn UNALM (2011) es el ms simple de todos los diseos, en el cual los tratamientos son
asignados aleatoriamente a las unidades experimentales sin ningn tipo de restriccin. Este diseo
es utilizado cuando las unidades experimentales son bastantes homogneas, es decir, cuando la
variabilidad entre ellas es pequea y no existe ningn criterio de bloqueo que permita disminuirla.
Dado que los tratamientos constituyen el nico criterio de clasificacin para las unidades
experimentales, este diseo se le conoce tambin como diseo de clasificacin de una va

Ventajas:
- Es un diseo flexible en tanto que el nmero de tratamientos y de repeticiones solo est
limitado por el nmero de unidades experimentales.
- El nmero de repeticiones puede variar entre tratamientos aunque generalmente lo ideal es
tener un nmero igual por tratamiento.
- El anlisis estadstico es simple.
- El nmero de grados de libertad para estimar el error experimental es mximo. Esto mejora la
precisin del experimento.

Desventajas:
- Solo es aplicable en situaciones en las que el material experimental es homogneo.
- Dado que no hay restricciones de aleatoriedad toda la variabilidad existente en las unidades
experimentales estar incluida en el error experimental.

Ejemplo :
La empresa Diamante se dedica a la fabricacin de nctares. Esta empresa ha instituido 4
programas diferentes (A, B, C, D) de entrenamiento para los empleados que trabajen en
operaciones de lotizacin del nctar. Veinte trabajadores fueron distribuidos aleatoriamente en la
lotizacin del nctar para posteriormente evaluar su tiempo de lotizacin (minutos) obtenindose
los siguientes resultados:

Repeticin
Programas
A B C D
1 59 52 65 64
2 64 58 71 67
3 57 54 63 62
4 62 56 64 64
5 60 58 63 66
Total 302 278 326 323
Promedio 60,4 55,6 65,2 64,6

Se desea saber si hay diferencias en los tiempos promedios de lotizacin del nctar con un nivel de
significacin de 0.05
- Normalidad de errores
H
o
: Los errores se distribuyen normalmente
H
1
: Los errores no se distribuyen normalmente
= 0.05
p-valor = 0.53
Conclusin: A un nivel de significacin de 0.05, no existe evidencia estadstica para rechazar H
0
.
Por lo tanto, no se puede afirmar que los errores no se distribuyan normalmente.



- Homogeneidad de varianzas
H
o
:
1
2
=
2
2
=
3
2
=
4
2
=
H
1
: Al menos un
1
2
, es diferente i = 1, 2,, 4
= 0.05
p-valor = 0.796
Conclusin: A un nivel de significacin de 0.05, no existe evidencia estadstica para rechazar H
0
.
Por lo tanto, no se puede afirmar que las variancias de los tratamientos sean heterogneas.

TC = (1299
2
)/20 = 75522.05
SC (Total) = (59
2
+ . + 66
2
) TC = 412.95
SC (Trat) = ( 302
2
/5 + + 323
2
/5) TC = 75818.6 75522.05 = 296.55
SC (Error) = 412.95 296.55 = 116.4

Fuente de
variacin
Grados de
libertad
Suma de
cuadrados
Cuadrado
medios
F cal
Programas 3 296.55 98.85 13.588
Error 16 116.4 7.275

Total 19 412.95


a) Hiptesis
H
0
:
1
=
2
=
3
=
4
H
1
:
1
= para al menos algn i= 2, 3, 4

= 0.05

b) Prueba estadstica
Fcal = CM (Trat) / CM (Error) ~ F
(t-1, n-t)
c) Desarrollo de la prueba
Fcal = 13.588
d) Criterio de decisin
Fcal = 13.588 > F
(0.95, 3.16)
= 3.2388
Conclusin: Existe suficiente evidencia estadstica a un nivel de significacin de 0.05 para rechazar
H
0.
Por tanto se puede afirmar que al menos uno de los programas difiere del resto al analizar el
tiempo de medio de lotizacin.
- Prueba T de Student
Del ejemplo del Diseo experimental Completamente al azar, se desea comparar los programas A
y B. Se probara si la diferencia del tiempo medio de lotizacin de ambos mtodos es menor a 2
minutos. Usando un nivel de significacin de 0.05
a) Hipotesis:
H
0
=
1
-
2
= 2
H
1
=
1
-
2
< 2
b) Estadstica de prueba
t
c
= ((Y
i
Y
j
)-
0
) / (CME (1/n
i
+ 1/n
j
))
0.5
~ t
(GLE)
c) Criterio de decisin
Si t
c
< t (
0.05, 16)
= -1.746 se rechaza H
0
d) Desarrollo de la prueba
t
c
= ( (60.4-55.6) 2 ) / (2*7.275 / 5)
0.5
t
c
= 1.641
Conclusin: A un nivel de significacin de 0.05 no existe evidencia estadstica para rechazar H
0
. Por
lo tanto, no se puede afirmar que la diferencia del tiempo medio de lotizacin al aplicar los
programas es menor de 2 minutos.
Diseo de bloques completamente al azar (D.B.C.A)
Segn UNALM (2011) se denominan bloques completos porque en los experimentos existe al
menos una unidad experimental en cada bloque para cada uno de los tratamientos en estudio. En
los casos en los que se pueda identificar otras fuentes de variacin, que no constituyen el objetivo
de la investigacin, estas debern ser controladas por el experimentador. Estas fuentes de
variacin son controladas mediante la formacin de bloques; la idea es agrupar a las
observaciones en los distintos bloques de modo que sean lo ms homogneas dentro del bloque y
heterogneas entre bloques.
Ventajas:
- El agrupamiento de las unidades experimentales en bloques, debido a la existencia real de
esta fuente de variabilidad, aumenta la precisin del experimento con relacin al DCA.
- No existen restricciones en cuanto al nmero de tratamientos o bloques.
- El anlisis estadstico es simple.
- Si se pierden los datos de un bloque completo, estos pueden omitirse sin mayores
complicaciones para el anlisis. Si faltan datos de unidades experimentales, estos pueden
estimarse.
Desventajas:
- Cuando la variabilidad entre las unidades experimentales dentro de los bloques es grande,
resulta un error experimental considerable. Esto ocurre usualmente cuando el nmero de
tratamientos es muy grande.
- Si existe interaccin entre los bloques y los tratamientos, esta va incluida en el error
experimental.
- Si no existe una real diferencia entre los bloques, habr una prdida de precisin en el
experimento con relacin al DCA, debido a la disminucin de los grados de libertad del
error.


Ejemplo :
El jugo de tomate es una importante materia prima en el mbito culinario.. Debido a los costos de
transporte es conveniente obtenerlo con zumo concentrado, lo que se realiza en una etapa de
evaporacin. Por tanto se hace un estudio de la rapidez de sus operaciones utilizando 4 diferentes
tipos de evaporadores a 5 diferentes presiones. Al final del proceso se registra el tiempo (en
minutos) para concentrar el producto desde 10 Brix hasta 35Brix. Los resultados en minutos se
presentan a continuacin:


Mquinas
r
1
r
2
r
3
r
4
Y
ij

P-1
P-2
P-3
P-4
P-5
2.5
2.4
2.3
2.0
1.8
2.6
2.7
2.2
1.8
1.6
2.7
2.6
2.0
1.7
1.5
1.7
1.6
1.5
1.5
1.2
9.5
9.3
8
7
6.1
Yi 11 10.9 10.5 7.5 39.1

Modelo aditivo lineal Yij = u + i + j + ij
i = Nmero de tratamientos (t) 1,2,3....,t (evaporadores)
j = Nmero de bloques (b) 1,2,3....,b (presiones)
Variable: minutos
Yij = Tiempo utilizado para concentrar el tomate de 10Brix a 35 Brix al utilizar la j-simo presion
el cual se le asign el i-simo evaporador
u = Efecto del medio general
i = Efecto del isimo tratamiento
j = Efecto de la j-sima unidad experimental
CUADRO ANVA
FV GL SC CM Fc
Tratamientos
Bloque
Error
Total
3
4
12
19
1.6615
2.137
0.411
4.2095
0.5538
0.5343
0.03425
-
16.169
-*
-
-


Sc
total
= (2.5) +....... + (1.2) - (39.9)
20
Sc
trat
= (11) +....... + (7.5) - (39.9)
5 5 20
Sc
bloques
= (9.5) +....... + (6.1) - (39.9)
4 4 20
Sc
error
= Sc
total
Sc
trat
Sc
bloques


Hipotesis:
Ho:
1
=
2
=
3
=
4

Ha: Al menos un
i

j
= 0.05
Fe = CM
trat
Fc > Ft rechazo Ho
CM
error
La prueba es significativa
Conclusin: Segn el anlisis realizado, existe suficiente evidencia estadstica a un nivel de
significacin de = 0,05 para rechazar la hiptesis planteada; por lo tanto podemos afirmar que
en uno de los evaporadores existe diferencia significativa para los tiempos de concentracin del
producto.
- Prueba de Tukey
Se realiz la prueba Tukey para el ejemplo de Diseo de Bloques Completamente al Azar. A
continuacin se presenta la prueba de Tukey para comparar los tratamientos en estudio de sus
conclusiones a un nivel de significancia de 0.05
H
0:

1
=
2
H
0:

1
=
3
H
0:

2
=
3

H
0:

1
.
2
H
0:

1
.
3
H
0:

2
.
3
H
0:

1
=
4
H
0:

2
=
4
H
0:

3
=
4

H
0:

1
.
4
H
0:

2
.
4
H
0:

3
.

El valor de la tabla con un nivel de significacin de 5%, p= 4 tratamientos y 12 grados de libertad
para el error experimental es AES(T)= 4.2
La amplitud limite significativa de Tukey es:
ALS(T) = AEST(T) (CME/b)
0.5
= 0.3476
A continuacin se presentan los resultados para las 6 comparaciones
Niveles de B
en a1
ALS (T) I Y
i
Y
j
l
Significancia
1 y 2 0.3476 1.9 *
1 y 3 0.3476 0.5 *
1 y 4 0.3476 3.5 *
2 y 3 0.3476 0.4 *
2 y 4 0.3476 3.4 *
3 y4 0.3476 3 *

Diseo cuadrado latino (D.C.L)
Segn UNALM (2011) el DCL es aquel diseo en donde las unidades experimentales estn sujetas o
influenciadas por un doble criterio de agrupacin, en bloque y en columna. Este diseo es una
extensin del DBCA puesto que en l se impone la misma restriccin en la distribucin de los
tratamientos para formar los bloques, ms otra restriccin igual formar las columnas. Es por eso
que en cuadrado latino, cada tratamiento esta una vez y al azar en cada bloque y en cada
columna.

Ventajas:
- La existencia real de dos fuentes de variabilidad entre las unidades experimentales y su
separacin en el anlisis de variancia permite incrementar la precisin del experimento.
- La prdida de una o ms unidades experimentales no influye esencialmente en el anlisis
de variancia, siendo posible estimar los resultados de las unidades experimentales
perdidas.

Desventajas:
- La existencia de interacciones entre los bloques y tratamientos, esta ira incluida en el
error experimental. En este caso se tiene la interaccin filas por columnas, filas por
tratamientos, columnas por tratamientos y filas por columnas por tratamientos.
- No es recomendable para un elevado nmero de tratamientos ya que en estos casos se
requiere de un elevado nmero de unidades experimentales.
- El diseo no es flexible ya que el nmero de tratamientos depende del nmero de filas y
columnas que se dispongan.

Ejemplo :
Para comparar el rendimiento de 4 variedades de trigo (A, B, C, D) para la produccin de harina se
llev a cabo un experimento con diferentes proporciones de protena y diferentes tipos de
molienda. Los resultados experimentales se presentan expresados en kg.

CONCENTRAC.
DE PROTEINA
TIPOS DE MOLIENDA
TOTAL
1 2 3 4
1
2
3
4
10.5 (C)
11.1 (B)
05.8 (D)
11.6 (A)
07.7 (D)
12.0 (A)
12.2 (C)
12.3 (B)
12.0 (B)
10.3 (C)
11.2 (A)
05.9 (D)
13.2 (A)
07.5 (D)
13.7 (B)
10.2 (C)
43.4
40.9
42.9
40.0
TOTAL 39.0 44.2 39.4 44.6 167.2

VAR. DE TRIGO TOTAL
A B C D
48 49.1 43.2 26.9 167.2

64 . 1837
4
1
4
1
) (
2
=

= = i j
k ij Y

2 . 167 = Y

Modelo aditivo lineal del DCL
Y
ij(k)
= +
i
+
j
+
k
+
ij(k)
Y
ij
: Valor observado de la i-sima variedad de trigo en la j-sima concentracin de proteina
(fila) en el k simo tipo de molienda (columna).
: Efecto de la media general.

i
: Efecto del i-sima variedad de trigo

j
: Efecto del j-sima concentracin de proteina (fila).

k
: Efecto del k simo tipo de molienda (columna).

ij
: Efecto del error experimental.
- Anlisis de varianza:
- Trmino de correccin:
24 . 1747
16
) 2 . 167 ( ..) (
2 2
= = =
tr
Y
TC

TC Y Total SC
t
i
r
j
ij =

= = 1 1
2
) (

- Suma de Cuadrados del total:
SC(Total) = 1837.64- TC = 90.4
- Suma de cuadrados de filas

( )
955 . 1
4
40
4
) 9 . 42 (
4
) 9 . 40 (
4
) 4 . 43 (
) (
2 2 2 2
1
.
2
= + + + = =

=
TC TC
t
Y
Filas SC
r
j
j

- Suma de cuadrados de columnas
( )
8 . 6
4
6 . 44
4
) 4 . 39 (
4
) 2 . 44 (
4
) 39 (
) (
2 2 2 2
1
.
2
= + + + = =

=
TC TC
t
Y
Columnas SC
r
j
j

- Suma de cuadrados de tratamientos:
TC
r
Y
Trat SC
t
i
i
=

=1
.
2
) (

( )
925 . 78
4
9 . 26
4
) 2 . 43 (
4
) 1 . 49 (
4
) 48 (
) (
2 2 2 2
= + + + = TC Trat SC

- Suma de cuadrados del Error:
SC(Error)= SC(Total)-SC(filas)SC(columnas)-SC(trat) = 2.72

- Grados de Libertad:
Para el Total : tt-1=15
Para filas : t-1 = 4 1 = 3
Para columnas : t-1 = 4 1 = 3
Para tratamientos: t-1 = 4 1 = 3
Para el error : Total f-c-t = 15 3 3 - 3 = 6

CUADRO ANVA
F. de V. Gl SC CM F
cal
N.S
Fila 3 1.955 0.652 1.439 ns
Columna 3 6.8 2.267 5.004 *
Tratamiento 3 78.925 26.308 58.075 *
Error 6 2.72 0.453
Total 15 90.4
a) Prueba de hiptesis:
Ho: t
1
= t
2
= t
3
= t
4
Ha: al menos un t
i
es distinto de los dems
b) = 0.05

c) Prueba estadstica:
F
cal
= CM trat/CM error ---- F ( gl trat, gl error; 1-alfa)
F
cal
= CM fila/CM error ---- F ( gl fila, gl error; 1-alfa)
F
cal
= CM columna/CM error ---- F ( gl columna, gl error; 1-alfa)
d) Criterio de decisin
F( 3; 6; 0,95) = 4.76 F( 3; 6; 0,95) = 4.76
Se acepta Ho si F
cal
< 4.76 Se acepta Ho si F
cal
< 4.76
Se rechaza Ho si F
cal
> 4.76 Se rechaza Ho si F
cal
> 4.76

F( 3; 6; 0,95) = 4.76
Se acepta Ho si F
cal
< 4.76
Se rechaza Ho si F
cal
> 4.76
e) Desarrollo de la prueba: F
cal
= 58.075 (tratamientos)
F
cal
= 1.439 (filas)
F
cal
= 5.004 (columnas)
f) Conclusiones: Se rechaza Ho
Existe evidencia estadstica a un o = 0.05 para afirmar que existe diferencia en el rendimiento de
las variedades de quinua sometidos a distintas concentraciones de protena y a distintos tipos de
molienda.

Experimentos factoriales
Segn UNALM (2011) los diseos factoriales ms eficientes, pues cada observacin proporciona
informacin sobre todos los factores, y es posible apreciar las respuestas de un factor en los
diferentes niveles del otro factor. Se puede observar si los factores actan en las unidades
experimentales en forma independiente. Cuando los factores actan en forma independiente se
dice que no hay interaccin entre ellos.

Ventajas:
- Permite obtener ms informacin que en un experimento de un solo factor, ya que se
estudian los efectos principales, los efectos simples, los efectos cruzados y de interaccin
entre los factores.
- Todas las unidades intervienen en la estimacin de los efectos principales y de interaccin,
por lo que el nmero de repeticiones es elevado para estos casos.
Desventajas:
- Se requiere un mayor nmero de unidades experimentales que en los experimentos con
un solo factor.
- Dado que todos los niveles de un factor se combinan con todos los niveles de los otros,
por requerimientos del anlisis estadstico, se tendr que algunas combinaciones que no
son de inters para el investigador, sern tambin incluidas en el experimento.
- El anlisis estadstico y la interpretacin de los resultados son ms complicados que en los
experimentos con un solo factor, y la dificultad aumenta considerablemente conforme
mas factores son incluidos.

Ejemplo :
Para realizar un estudio sobre el rendimiento que se obtiene en la elaboracin de papas prefritas
congeladas que retarde el pardeamiento enzimtico durante la congelacin, se realiz un
experimento durante 5 semanas conducido en DBCA. Los niveles de los factores en estudio son:
A: tiempo del blanqueado; A1= 3min; A2=5min ; A3 = 8min
B: Variedad de papa ; B1: yungay ; B2:tomasa
Bloque
A1 A2 A3
Y..k
B1 B2 B1 B2 B1 B2
I 49.8 45.3 49.9 48.5 47.3 43.1 283.9
II 48.6 42.5 44.3 42.5 43.2 39.2 260.3
III 44.8 42.1 41.1 49.1 40.5 38.5 256.1
IV 43.9 40.3 40.5 40.9 39.6 36.2 241.4
Yij. 187.1 170.2 175.8 181.0 170.6 157 1041.7

Rta:
Cuadro de totales:
A1 A2 A3
B1 187.1 175.8 170.6 533.5
B2 170.2 181.0 157 508.2
357.3 356.8 327.6 1041.7

Cuadro de promedios- Pruebas de Comparacin
A1 A2 A3
B1 46.78 43.95 42.65 44.46
B2 42.55 45.25 39.25 42.35
44.66 44.60 40.65

CUADRO ANVA
F.V g.l SC CM Fcal Ftab n.s
Bloq 3 155.291 51.764 15.48 3.29 *
A 2 72.291 36.145 1081 3.68 *
B 1 26.67 26.670 7.98 4.54 *
A*B 2 35.531 17.765 5.31 3.68 *
ERROR 15 50.146 3.343
TOTAL 23 339.930

1. Pruebas de hiptesis Para A.: tiempo que dura el blanqueado

a) Hp : i= 0; Hp : 1=2=3
; Ha: al menos un i es diferente de los dems
b) = 0.05
c) Prueba estadstica:
Fcal= CM(A)/CM(E) = F ( glA ; glE ; 1-)
Ftab(2;15;0.95) =3.68
Fcal = 10.81
Como Fcal es mayor a Ftabular -----Se rechaza Hp
Conclusin: Por lo tanto al menos tiempo de blanqueado produce un rendimiento promedio
observado distinto al del resto
2. Para B: Variedad de papa

a) Hp: 1.=2.
Ha: Al menos un ij es distinto alos dems
b) = 0,05
c) Prueba estadistica: Fcal = CMB/CME ---F ( glB,glE, 1-)
Ftab( 1,15,0.95) = 4.34
Fcal= 7.98
Se rechaza Hp
Conclusin: Por lo menos una de las dos variedades produce un rendimiento promedio observado
distinto del otro.

3. Para A*B
a) Hp: (ab)ij = 0

b) = 0,05
c) Prueba estadstica: Fcal = Cm(A*B)/CME ---F ( glAB,glE, 1-alfa)
Ftab( 2,15,0.95) = 3.68
Fcal= 5.31
Conclusin: Se rechaza Hp
Por lo tanto existe evidencia estadstica aun nivel de significacin de alfa = 0.05 para decir que los
factores variedades de papa con tiempos de duracin del blanqueado si interaccionan
2.4.2 No paramtricas
Prueba para K muestras independientes (Kruskal - Wallis)
Segn UNALM (2011) esta prueba es el equivalente no paramtrico del D.C.A de un factor de
anlisis de varianza. Es decir esta prueba puede ser utilizada cuando no se cumplen los supuestos
de que las poblaciones de las cuales se extraen las muestras no estn distribuidas normalmente
con variancias iguales, o cuando los datos constan solo de rangos.
Supuestos:
- Las muestras a ser evaluadas son aleatorias y mutuamente excluyentes.
- La variable respuesta esta medida en una escala al menos ordinal.
Ejemplo:





Prueba para k muestras relacionadas (Friedman)
Segn UNALM (2011) la prueba de Friedman es equivalente no paramtrico de un anlisis d dos
vas o D.B.C.A.
Esta prueba es apropiada siempre que los datos se midan, al menos, en una escala ordinal y
puedan disponerse significativamente en una clasificacin de dos criterios, como se hace en un
experimento en bloques al azar.
Esta prueba es muy utilizada donde se consideran jueces (bloques) para que evalen diferentes
productos.
Supuestos:
- Los b bloques son mutuamente independientes, es decir los resultados de un bloque no
influyen en los resultados de los otros bloques.
- La escala de medida es al menos ordinal, de modo que las observaciones pueden ser
ordenadas dentro de cada bloque.
Ejemplo:
Se est realizando un experimento para analizar el sabor de una nueva marca de gaseosa sabor
cola antes de que se lance al mercado. Las marcas de gaseosas colas en comparacin fueron dadas
a 5 jueces especializados y se estableci una escala de valores de (1 - 5) donde 1 es el de peor
sabor y 5 el de mejor sabor. Los resultados del experimento se muestran a continuacin.
JUECES MARCAS DE GASEOSAS COLA
A B C
1 4 (3) 3 (2) 1 (1)
2 3 (3) 2 (2) 1 (1)
3 4 (3) 2 (1.5) 2 (1.5)
4 4 (3) 3 (2) 1 (1)
5 3 (3) 1 (1) 2 (2)
Ri 15 8.5 6.5

a) Hiptesis:
H
0
: Las gaseosas de sabor cola en estudio tienen similar preferencia.
H
a
: Las gaseosas de sabor cola en estudio no tienen similar preferencia.
b) = 0.05

A=


A con empates A=


B=


Estadstico de prueba
S=


B=

] = 67.9
S=

=8.316
Criterios de decisin
Si : T

= 5.991 se acepta H
0

Si : T

= 5.991 se rechaza H
0


Como S

= 5.991 se rechaza
Con un nivel de significancia del 5% existe suficiente evidencia estadstica para decir que las tres
marcas de gaseosa cola no tienen similar preferencia.
Prueba de comparaciones mltiples
|

|
(



F=


F=3.26



Criterio de decision
Tratamientos
Comparados
|

| SIGNIFICACION
AyB 6.5 *
AyC 8.5 *
ByC 2 N.S

Con un nivel de significancia del 5% se concluye que las marcas de cola A vs B, a vs C son
significantes.

Prueba para k muestras relacionadas tal que en cada bloque no estn presente los
tratamientos
En el Diseo de Bloques Completamente al Azar cada tratamiento es ubicado en cada bloque,
pero, algunas veces no es prctico, o no es factible, aplicar todos los tratamientos a cada bloque,
especialmente cuando el nmero de tratamientos es grande y el tamao del bloque limitado. Por
ejemplo: si veinte alimentos diferentes estn siendo degustados, cada juez (bloque) puede
encontrar alguna dificultad en ordenar exactamente todos los alimentos en orden de preferencia.
Pero, si cada juez prueba solamente cinco (05) alimentos, la evaluacin resulta ms fcil. Este
diseo experimental, en el que no todos los tratamientos son aplicados a cada bloque, es llamado
Diseo de Bloques Incompletos.
Adems, si el diseo es balanceado, es decir que:
- cada bloque contiene K unidades experimentales,
- cada tratamiento aparece en r bloques, y
- cada tratamiento aparece comparado con otro tratamiento un nmero igual de veces,el
diseo es llamado Diseo de Bloques Incompletos Balanceados.
Para este tipo de problema se emplear la prueba de Durbin, la cual permite probar la hiptesis
nula de no existir diferencias entre tratamientos en un Diseo de Bloques Incompletos
Balanceados. Los mtodos paramtricos de anlisis de datos, obtenidos usando un Diseo de
Bloques Incompletos Balanceados, existen y estn basados en cierta normalidad que no puede ser
explicada fcilmente. La prueba de Durbin puede ser preferida sobre las pruebas paramtricas si la
suposicin de normalidad no es esperada, si se desea un mtodo de anlisis fcil, o si la
observaciones consisten simplemente de rangos ordenados.
La prueba de Durbin es equivalente a la Prueba de Friedman si el nmero de tratamientos (t) es
igual al nmero de unidades experimentales por bloque (K).
- Prueba de Durbin:
En esta prueba los datos son ordenados en un Diseo de Bloques Incompletos Balanceados. Y
ij

permite representar el resultado del tratamiento i en el bloque j, siempre que el tratamiento
i aparezca en el j-simo bloque. Se debe tener en cuenta que solamente son K las
observaciones en el bloque j. Los supuestos de esta prueba son:
- Los bloques son mutuamente independientes uno de otro.
- Dentro de cada bloque las observaciones pueden ser ordenadas en forma creciente segn
criterio de inters (un moderado nmero de empates puede ser tolerado).

La hiptesis es la siguiente:
H
o
: Los tratamientos tienen efectos idnticos.
H
a
: Al menos uno de los tratamientos tiende a producir valores observados mayores que otro
tratamiento.
La notacin empleada es la siguiente:
t = nmero de tratamientos a ser examinados.
K = nmero de unidades experimentales por bloque (K < t).
N = nmero total de bloques.
r = nmero de veces que cada tratamiento es examinado.
= nmero de veces que cada tratamiento es comparado con algn otro tratamiento.
Tambin es el nmero de bloques en los cuales el i-simo tratamiento y el -simo tratamiento
aparecen juntos.
El procedimiento de la prueba es el siguiente:
1. Asignar rangos dentro de cada bloque de 1 a K. En caso de empates, asignar el promedio
de los rangos.
R
ij
= rango asignado a la observacin Y
ij
del tratamiento i en el bloque j, donde Y
ij

existe.
2. Hallar la suma de rangos de cada tratamiento (columna):
R R
i. ij
j=1
N
=


donde solamente r valores de R
ij
existen bajo el tratamiento i; as, solamente r rangos son
sumados para obtener R
i
.
Verificar que: R.. = R =
NK(K + 1)
i.
i=1
t

2

3. Hallar el valor estadstico de la prueba T de Durbin:

( )
( )( )
( )( )
( )
T =
12 t - 1
rt K- 1 K
R
r t - 1 K+1
K- 1

i.
2
i=1
t
t -1 g.l.
+
~

1
3
2
_

que se distribuye, aproximadamente, como chi-cuadrado con t-1 grados de libertad.
4. Si T
calc
s _
2
tab
, se aceptar la hiptesis nula H
o

Si T
calc
> _
2
tab
, se rechazar la hiptesis nula y se aceptar la hiptesis alternante.



_
tab
2


B.-Comparaciones Mltiples:
El siguiente mtodo puede ser usado para comparar pares de tratamientos si la hiptesis nula es
rechazada. Dos tratamientos, i y l, tiene efectos significativamente diferentes si sus sumas de
rangos satisfacen la siguiente desigualdad:
( )
R R t
r(K+1)(K- 1)NK(t - 1) - tT
t - 1)(NK- t - N+1)
i. j. 1-

o 2
1 2
6(


donde T es el valor estadstico de la prueba de Durbin y t
(1-o/2)
es obtenido de la tabla t de
Student con (NK - t - N + 1) grados de libertad.
En caso contrario se dir que no existen diferencias significativas entre i y l.
Ejemplo:
Suponga que un fabricante de helados desea realizar una prueba de preferencias de gustos para
sus siete (07) variedades de helados. A cada persona se le pregunta por el gusto de tres (03)
variedades y se le pide que las ordene del 1 al 3. Se utiliza un esquema cuadrado de Diseo de
Bloques Incompletos Balanceados, de tal manera que cada variedad sea comparada con todas las
otras variedades un igual nmero de veces. Es decir, siete (07) personas han probado, cada una,
tres (03) variedades, y el resultado ordenado es el siguiente:






Zona de
Aceptacin
(H
o
)
o
(t - 1) g.l.
Persona Variedad
1 2 3 4 5 6 7
1
2
3
4
5
6
7
2



3

3
3
3



3


1
2



1
1

1
1

2

2
1


3

2
1



3

2
2

R
i
. 8 9 4 3 5 6 7 42

Se puede afirmar que las variedades de helados son igualmente preferidas? (o =
0.05).
Desarrollo:
1. Asignar rangos R
ij
dentro de cada bloque (persona). Segn este problema:

t = 7 = nmero total de variedades de yogures.
K = 3 = nmero de variedades comparadas o probadas por una misma persona.
N = 7 = nmero de personas (bloques).
r = 3 = nmero de veces que cada variedad es probada.
= 1 = nmero de veces que cada variedad es comparada con otra variedad.
Observar que se cumple: KN = rt (3)(7) = (3)(7), y que:
= = =
r(k - 1)
t - 1
3(3 - 1)
7 - 1
1
2. Hallar R
i
:
R
1
. = 8, R
2
= 9, R
3
. = 4, R
4
. = 3, R
5
. = 5, R
6
. = 6, R
7
. = 7
R.. = 8+9+4+3+5+6+7 = 42
Se cumple que: R.. = 42 =
NK(K+1)
=
7(3)(3+1)
2 2

3. Para hallar el valor estadstico de prueba, primero se halla:
R
i.
2
i=1
7

= + + + + + + = 8 9 4 3 5 6 7 280
2 2 2 2 2 2 2


El valor estadstico de prueba es:

( )
T =
12(t - 1)
rt(K - 1)(K +1)
R
r(t - 1)(K +1)
K - 1

T =
12(6)
3(7)(2)(4)
= 12
i.
2
i=1
t
7-1 g.l.
2

3
280 3
3 6 4
2
_
( )
( )( )( )


4. H
o
: Las siete (07) variedades son igualmente preferidas.
H
a
: Alguna variedad de yogurt es preferida sobre otra variedad.




12.592




Zona de
Aceptacin
(H
o
)
0.05
(t - 1) = 6 g.l.
Como T < 12.592 se acepta la hiptesis nula de que las siete (07) variedades de helados son
igualmente preferidas.

III. BIBLIOGRAFA
- Cazau, P. 2010. Fundamentos de la Estadstica. Disponible en:
http://www.listinet.com/bibliografia-comuna/Cdu311-6247.pdf (Consultado: 10 de
septiembre del 2012).
- Gmez, M. 1998. Elementos de Estadstica Descriptiva . EUNED. Disponible en:
http://books.google.com.pe/books?id=VJNpI4_U9SYC&printsec=frontcover&vq=Medidas+
de+exactitud&hl=es&source=gbs_ge_summary_r&cad=0#v=onepage&q=Medidas%20de%
20exactitud&f=false (Consultado: 10 de septiembre del 2012).
- Hernndez, E. 2006. Manual de estadstica. Universidad Cooperativa de Colombia.
Disponible en:
http://books.google.com.pe/books?id=vahoN_YRn6QC&printsec=frontcover&vq=Medidas
+de+exactitud&hl=es&source=gbs_ge_summary_r&cad=0#v=onepage&q&f=false
(Consultado: 10 de septiembre del 2012).
- Luiz, M. 2005. Estadstica Bsica Para Negocios: Conceptos y aplicaciones. Unidad
Acadmica de Derecho y Ciencias Sociales. Universidad Autnoma de Tamaulipas. Mxico.
- Martn, A. 2004. Bioestadstica para la ciencia de la salud. Ediciones Norma
Capitel. Espaa.
- Ortegon., M. 2010. Estadstica Descriptiva. Escuela de Ciencias Bsicas, Tecnologa e
Ingeniera - UNAD. Segunda versin. Bogot, Colombia.
- Rus, F; Barn, F; Snchez, E.; Parras, L. 2009. Bioestadstica: mtodos y
aplicaciones. Universidad de Mlaga. Disponible en:
http://www.bioestadistica.uma.es/libro/. (Consultado: 10 de septiembre del 2012).
- UNALM. 2012. Libro de texto del curso Estadstica GeneraI. Facultad de Economa y
Planificacin. Lima - Per
- UNALM. 2011. Libro de texto del curso Mtodos Estadsticos para la Investigacin I.
Facultad de Economa y Planificacin. Lima - Per
- Universidad nacional de colombia. 2012. Seminario de investigacin. Disponible en:
http://www.virtual.unal.edu.co/cursos/odontologia/2002890/lecciones/Estadistica_descri
pt%204/estdesc4.htm (Consultado: 10 de septiembre del 2012).
- Velasco S.G. 2001. Probabilidad y estadstica para ingeniera y ciencias. International
Thompson Editores. Mxico.

You might also like