You are on page 1of 5

Distribucin f

La primera aplicacin de f ocurre cuando se pone a prueba la hiptesis de


que la varianza de una poblacin normal es igual a la varianza de otra
poblacin normal.

Sir Ronald Fisher uno de los pioneros de la estadstica actual. Esta


distribucin de probabilidad sirve como la distribucin del estadstico de prueba
en varias situaciones.
Con ella se pone a prueba si dos muestras provienen de poblaciones que tienen
varianzas iguales, y tambin se aplica cuando se desea comparar varias medias
poblacionales en forma simultnea.
La comparacin simultanea de varias medias poblacionales se denomina
anlisis de la varianza (anova).
La poblacin debe seguir una distribucin normal.
Los datos deben de ser al menos de escala de intervalos.
Caractersticas
Existe una familia de distribucin

Cada miembro de la familia se determina mediante dos parmetros:


-los grados de libertad del numerador
-los grados de libertad del denominador
La distribucin es continua

Se supone un nmero infinito de valores entre cero y el infinito positivo.


La distribucin f no puede ser negativa

El menor valor que puede tomar f es cero.


Tiene sesgo positivo

La cola larga de la distribucin es hacia el lado derecho. Cuando el # de gl


aumenta tanto en el numerador como en el denominador, la distribucin se
aproxima a ser normal.
Es asinttica
Cuando los valores de x aumentan la curva F se aproxima al eje, pero nunca lo
toca, este caso es similar al comportamiento de la distribucion normal.
COMPARACION DE DOS VARIANZAS POBLACIONALES

La distribucion de f sirve tambin para probar suposiciones de algunas pruebas


estadsticas.
La distribucion F proporciona un medio para realizar una prueba considerando
las varianzas de dos poblaciones normales.
La hiptesis nula es que la varianza de una poblacin normal es igual a la
varianza de otra poblacin normal.
La hiptesis alternativa seria que las varianzas difieren.
Para realizar una prueba, se selecciona una muestra aleatoria de n1
observaciones de una poblacin y n2 observaciones de una segunda poblacin.

Si la hipotesis nula es verdadera el estadstico de prueba sigue la distrbucion F


con n1-1 y n2-1 grados de libertad.
F es mayor que uno debido a que la varianza mas grande de la muestra se
coloca en el numerador.
El estadstico de prueba se calcula como s21 / s22

SUPOSICIONES EN EL ANALISIS DE LA VARIANZA (ANOVA)


Aqu se comparan tres o ms medias poblacionales para determinar si pueden ser
iguales.
Para emplear anova se supone lo siguiente:
La poblacin sigue la distribucion normal.
Las distribuciones tienen desviaciones estndares iguales.
Las poblaciones son independientes.
Es necesario estudiar anova por que nos permite la comparacin de dos
medias poblacionales a la vez.
Por qu no solo se emplea la prueba de diferencias entre medias
poblacionales como se analiz en el captulo anterior?

La razn ms importante es la acumulacin indeseable del error tipo 1.


Se emplea la prueba t para comparar y esto sera un trabajo muy demoroso y
con un error.
Anova le permite comparar las medias de tratamiento de forma simultnea y
evitar la acumulacin del error tipo 1.
ANOVA se desarroll para aplicaciones en agricultura, y aun se emplean muchos
de los trminos relacionados con este contexto.
Con el termino tratamiento se identifican las diferentes poblaciones que se
examinan.
PRUEBA ANOVA

La estrategia es estimar la varianza de la poblacin de dos formas para despus


determinar la razn de dichas estimaciones.
Si esta estimacin es aproximadamente 1 entonces por lgica las dos
estimaciones son iguales, y se concluye que las medias poblacionales no son
iguales.
La distribucion F sirve como un rbitro para indicar en que instancia la razn de
las varianzas mustrales es mucho que 1 para haber ocurrido por casualidad.
Valoracin total
Suma de las diferencias entre cada observacin y la media global elevadas al
cuadrado.
Valoracin de tratamientos
Suma de las diferencias entre la media de cada tratamiento y la media total o
global elevadas al cuadrado.
Variacin aleatoria
Suma de las diferencias entre cada observacin y su media de tratamiento
elevadas al cuadrado.

Para determinar el SS y SSE se comienza por calcular la media global o total.


Para calcular el trmino SSE se encuentra la desviacin entre cada observacin y su
media de
tratamiento.
El termino media cuadrtica es es otra expresin de la estimacin de la varianza.
SSE= SUMA DE LOS ERRORES TOTAL
SS TOTAL = VARIACION TOTAL
SST= VARIACION DEBIDO A LOS TRATAMIENTOS
SSE= VARIACION DENTRO DE LOS TRATAMIENTOS O EL ERROR ALEATORIO
SSE=SUMA DE LOS ERRORES CUADRADOS

TRATAMIENTO E INFERENCIA SOBRE PARES DE MEDIAS


Suponga que realiza el procedimiento ANOVA y toma la decisin de rechazar la hiptesis
nula.
Esto permite concluir que no todas las medias de tratamiento son iguales. Algunas
veces esta
conclusin sera satisfactoria, pero otras se desea conocer cules medias de tratamiento
difieren.
La distribucion t descrita anteriormente sirve como base en esta prueba.
Recuerde que una de las suposiciones de ANOVA es que las varianzas
poblacionales de todos los tratamientos son las mismas.
Este valor comn de la poblacin es el error medio cuadrtico o MSE,y se
determina mediante :
SSE/(n k). Un intervalo de confianza de la diferenciaentre dos poblaciones se
obtiene mediante:

COMO SE DECIDE SI HAY UNA DIFERENCIA ENTRE LAS MEDIAS DE


TRARTAMIENTO
Si el intervalo de confianza incluye cero no existe diferencia entre ellas.
Si no incluye el cero existe diferencia entre ellas.
ANALISIS DE LA VARIANZA DE DOS VIAS
Tambin se denomin la variacin dentro de los tratamientos como error o
variacin aleatoria.
El beneficio al considerar otros factores es que se reduce la varianza del error. Es
decir si se reduce el denominador del estadstico F (al reducir la varianza del
error o de manera ms directa el termino SSE), el valor de F ser mayor , lo que
ocasionara el rechazo de la hiptesis de tratamiento de medias iguales. En otras
palabras, si se puede explicar ms la variacin habr menos error

VARIABLE DE BLOQUEO
1. Una segunda variable de tratamiento que cuando se incluye en el
anlisis ANOVA tendr el efecto de reducir el termino
SSE(VAIANZA DEL ERROR).
EN ANOVA DE DOS VIAS

2. La suma de los cuadrados debido a los bloqueos se determina


mediante la siguiente formula:

Se utiliza el mismo formato en la tabla ANOVA de dos vas, como en el


caso de una va excepto que hay una fila adicional para la variable de
bloqueo. SS total y SST se calculan como se hizo antes y SSB se
determina con la frmula:

El termino SSE se

calcula mediante una resta.

ANOVA DE DOS VIAS CON INTERACCION


Cuando se emplea ANOVA de dos vas para estudiar la interaccin, en lugar de
emplear
los trminos tratamientos y bloques, ahora a las dos variables se les denominan
factores.
La interaccin tiene lugar si la combinacin de dos factores ejerce algn efecto
sobre la
variable en estudio, adems de hacerlo en cada factor por s mismo. A la
variable en estudio se le llama variable de respuesta.
INTERACCION: El efecto de un factor sobre una variable de respuesta difiere
segn el valor de otro factor.
Una manera de estudiar la interaccin es al graficar medias de factores en una
grfica denominada de interaccin.
PRUEBA DE HIPOTESIS PARA DETECTAR INTERACCION
El siguiente paso es realizar pruebas estadsticas para investigar aun mas los efectos de
interacciones posibles. En resumen el estudio de los tiempos recorridos plantea varias
preguntas:
Hay alguna interaccin entre rutas y conductores?
Los tiempos de recorrido de los conductores son iguales?
Los tiempos de recorrido de las rutas son iguales?
De las tres preguntas, la de mayor inters es sobre la prueba de interacciones.
Estas preguntas se investigan en forma estadstica al ampliar el procedimiento ANOVA
de

dos vas de la seccin anterior. Hay que agregar otra fuente de variacin, la interaccin.
Sin
embargo, a fin de estimar la suma de error de los cuadrados, son necesarias al menos
dos
mediciones para cada combinacin conductor/ruta.
Los clculos de la suma cuadrtica de los factores son muy similares a los clculos de
SST y SSB calculados antes.

You might also like