You are on page 1of 44

¡La universidad para todos!

¡La Universidad para todos!

Tema: ANÁLISIS DE VARIANZA


Docente: Segundo García Flores

Escuela Profesional Periodo académico: 2018-1


ADMINISTRACION Y NEGOCIOS Semestre: 05
INTERNACIONALES Unidad: III
¡La universidad para todos!

TÍTULO DEL TEMA

ANÁLISIS DE VARIANZA DE UN FACTOR (ANOVA)


¡La universidad para todos!

ORIENTACIONES

• Lea las previamente las orientaciones generales


del curso.
• Revise los temas afines a este en la Biblioteca
Virtual de la UAP
• Participe de los foros
¡La universidad para todos!

CONTENIDOS TEMÁTICOS

La distribución “F de Snedecor”


Anova de un factor
Ejemplo

4
¡La universidad para todos!

DESARROLLO DE CONTENIDOS - SUBTÍTULOS DEL


TEMA
¡La universidad para todos!

La distribución “F de Snedecor”
La distribución de F es aquella que se usa para estimar cualquier
cociente de Varianzas.
Al igual que la t es una familia de curvas cuya curva exacta a
usar esta determinada por dos grados de libertad.
• Grados de libertad del numerador
• Grados de libertad del denominador

Familia de F
¡La universidad para todos!

Distribución F:
S12
F0  2
S2
La distribución de referencia apropiada para F0 es la
distribución F con n1 – 1 grados de libertad en el numerador y
n2 -1 grados de libertad en el denominador. La hipótesis nula
se rechazaría si,
Fo  F / 2 ,n1 1,n2 1 o Fo  F1 / 2 ,n1  1,n2  1
Donde F/2 y F1- /2 denotan los puntos porcentuales /2
superior y 1- /2 inferior de la distribución F con (n1 – 1) y (n2
- 1) grados de libertad.
¡La universidad para todos!

Distribución F:
Los puntos de las colas superior e inferior se relacionan por,

1
F1 , v1 , v2

F , v 2 , v1

Así, por ejemplo:

F0, 01; 12; 7  6,47


1 1
F0,99; 7; 12    0,154
F0,01; 12; 7 6,47

8
¡La universidad para todos!

Distribución F:

9
¡La universidad para todos!

Análisis de la Varianza de un factor


(ANOVA)
El análisis de la varianza (ANOVA) es una técnica estadística
paramétrica de contraste de hipótesis. El ANOVA de un factor
sirve para comparar varios grupos en una variable cuantitativa.
Se trata, por tanto, de una generalización de la Prueba t
para dos muestras independientes al caso de diseños
con más de dos muestras.
A la variable categórica (nominal u ordinal) que define los
grupos que deseamos comparar la llamamos independiente
(VI) o factor.
A la variable cuantitativa (de intervalo o razón) en la que
deseamos comparar los grupos la llamamos dependiente (VD).
¡La universidad para todos!

Análisis de la Varianza de un factor: condiciones

1) Cada muestra debe ser independiente de las otras.


2) Cada muestra debe haber sido seleccionada al azar
de la población de donde proviene.
3) Las población de donde provienen las muestras
debe tener distribución normal.
4) Las varianzas de cada población deben ser iguales.
¡La universidad para todos!

¿En que consiste la técnica ANOVA?

• La técnica del ANOVA consiste en descomponer


la variabilidad de una población (representada
por su varianza) en diversos sumandos según los
factores que intervengan en la creación de esa
variabilidad.

20 de octubre de 2012 | MINE José Alejandro López Rentería


¡La universidad para todos!

¿En que consiste la técnica ANOVA?

• La varianza expresa variación, y si podemos


descomponer la varianza, podemos aislar
fuentes de variación. Cuando de los sujetos
tenemos varios tipos de información, el análisis de
varianza nos va a responder a esta pregunta ¿De
dónde vienen las diferencias?

20 de octubre de 2012 | MINE José Alejandro López Rentería


¡La universidad para todos!

¿En que consiste la técnica ANOVA?

• Para dos (o más) muestras, la varianza total


(uniendo las dos muestras en una sola) puede
descomponerse en dos varianzas:

1) Una varianza que indica la variabilidad dentro


de los grupos

2) Otra varianza que expresa la variabilidad


(diferencias) entre los grupos (entre las medias).

20 de octubre de 2012 | MINE José Alejandro López Rentería


¡La universidad para todos!

Análisis de la Varianza de un factor

Caso 1:
Un médico quiere comparar la efectividad de tres tratamientos para
reducir el colesterol de pacientes con altos niveles de colesterol
sanguíneo. Se asignan aleatoriamente 60 individuos a los tres
tratamientos (20 en cada uno) y se registra la reducción de colesterol
de cada paciente.
 Variable respuesta cuantitativa: reducción del colesterol, medida
en varias unidades (personas).
 Esperamos que la respuesta sea Normal.
 Queremos comparar varias poblaciones, tres tratamientos en este
caso.
 Es un experimento en el cual los pacientes son asignados

15 aleatoriamente a los tratamientos.


 Usaremos un análisis de varianza de un factor con 3 niveles.
¡La universidad para todos!

Análisis de la Varianza de un factor

Caso 2:
Una ecóloga está interesada en comparar la concentración de
cadmio en 5 ríos. Recolecta 50 muestras de agua (10 muestras en
cada río) y mide la concentración de cadmio.
 Variable respuesta cuantitativa: concentración de cadmio,
medida en varias unidades (muestras de agua).
 Se espera Respuesta sea Normal.
 Queremos comparar varias poblaciones, 5 ríos en este caso.
 Es un estudio observacional simplemente se toman muestras de
distintos ríos.

16 Usaremos un análisis de varianza de un factor con 5 niveles.


¡La universidad para todos!

Análisis de la Varianza de un factor


(ANOVA)

Procedimiento:

La hipótesis nula que se pone a prueba en el ANOVA de


un factor es que las medias poblacionales (las medias de
la VD en cada nivel de la VI) son iguales.

 H0 : 1   2  ...   k


 H 1 :   1   2  ...   k 

Si las medias poblacionales son iguales, eso significa
que los k grupos no difieren en la VD y que, en
consecuencia, la VI o factor es independiente de la
¡La universidad para todos!

Análisis de la Varianza de un factor


(ANOVA)
Gráficamente estas hipótesis se representa por:

H0: las medias poblacionales son H1: al menos una media es


iguales diferente

18
¡La universidad para todos!

Análisis de la Varianza de un factor


(ANOVA)
Cálculo del valor crítico:
F1 , k 1, k  n 1  ni iguales
F1 , k 1, N - k  ni diferentes

Encuentre el valor crítico en una distribución F,


con k-1 grados de libertad en el numerador (en las
columnas) y n-k grados de libertad en el denominador
(en las filas), que deje una probabilidad de  en la cola
superior de la distribución.
¡La universidad para todos!

Análisis de la Varianza de un factor


(ANOVA)

Tabla de análisis de varianza:


FUENTE GRADOS
DE SUMA DE DE MEDIA DE
VARIACIÓ CUADRADO LIBERTAD CUADRADOS
N S (SC) (gl) (MC) F calculado
FACTOR SC ENTRE k-1 SC Entre / k-1 MCEntre / MCDentro
RESIDUAL SC DENTRO n-k SC Dentro/ n-k
TOTAL SC TOTAL n-1
Rechace la hipótesis nula si el estadístico F calculado
es mayor o igual que el valor crítico F(k- 1, n - k) en la tabla
de F.
¡La universidad para todos!

Reglas de Decisión:

Rechace H0 , si Fobs  F  

No rechace H0 , si Fobs  F  
¡La universidad para todos!

Ejemplo de aplicación de ANOVA


• Una Directora de un colegio, preocupada de explicar los
problemas de comportamiento de sus estudiantes, se dispuso a
hacer un estudio para establecer si existían diferencias en ese
aspecto según estado civil de los padres, entre otras variables.

• Para ese fin, solicitó a los padres de 53 niños la aplicación del


Child Behavior Checklist, versión para padres. El CBCL
(Achenbach, 1991) es un instrumento conformado por 113 ítems
que comprenden problemas específicos, agrupados en síndromes
que exploran dos tipos de anomalías de conducta:
¡La universidad para todos!

Ejemplo
Externalización (agresión, delincuencia y trastornos de
conducta) e Internalización (aislamiento, preocupaciones
somáticas, depresión y ansiedad). Además, (Friedrich et al.,
1986) seis de sus ítems conforman la escala de problemas
sexuales, la que sólo se aplica a niños y niñas mayores.

Los ítems son categorizados:


• 0 = no es cierto o nunca observado,
• 1 = es cierto algunas veces o de cierta manera,
• 2 = muy cierto o a menudo cierto.
El puntaje total se obtiene a partir de la suma de los
parciales.
¡La universidad para todos!

CASADO SEPARADO VIUDO SOLTERO


Paso 1: 10 23 78 22

Obtiene 19 62 70 70

los 36 90 48 48

siguientes 55 30 68 28
45 73 62 45
datos 41 30 29 30
30 40 38 55
41 28 68 45
32 43 60 50
46 54 61 42
38 49 58 66
Paso 2: 15 19 25
Calculo de 30 62 60 ___
la media
de cada
55 28
63
X g

grupo y la nk N = 53
14 15 11 13
media ___

global x k 35,21 46,27 58,18 45,08 45,53


¡La universidad para todos!

CASADO SEPARADO VIUDO SOLTERO Paso 3: Calculo de la


1262,26 507,52 1054,41 553,58
suma de cuadrados de las
703,75 271,32 598,86 598,86
desviaciones de cada
90,79 1977,73 6,11 6,11
89,71 241,13 504,98 307,24
observación respecto a la
0,28 754,69 271,32 0,28 media global:
2
20,51 241,13 273,18 241,13  ___

241,13 30,56 56,68 89,71
SCT    xi  X g 
 
20,51 307,24 504,98 0,28
183,01 6,39 209,43 20,00 Suma de Cuadrados Total
0,22 71,77 239,37 12,45 (SCT) y que refleja la
56,68 12,05 155,54 419,09
variabilidad total. Si se
931,98 703,75 421,41
divide por el tamaño total
241,13 271,32 209,43
89,71 307,24
de muestra se obtiene la
305,26 varianza total.

  x i  45 ,53
2 16695,20
SCT   16695 , 208 8
¡La universidad para todos!

Paso 4: Calculo de la suma de cuadrados de las desviaciones entre


la media de cada grupo y la media general.
2
 ___ ___

SCF   nk  x k  X g 
 
___

siendo: X g  media global


n k  número de sujetos en el grupo k
___

x k  media aritmética del grupo k


Esta es la suma de cuadrados explicada por el factor considerado, a
la que denominaremos Suma de cuadrados del factor (SCF) o
variabilidad explicada.
En la literatura científica también se denomina a la SCF
como SC entre los grupos (SS Between) o SC del Modelo
(SS Model)
¡La universidad para todos!

Cuadro para el cálculo de SCF


MEDIA
SEPARAD GLOBA
CASADO O VIUDO SOLTERO L
MEDIA n k
35,21 46,27 58,18 45,08 45,53
2
 ___ ___  14 15 11 13
 xk  X 
 g
 

 ___ ___ 
2 106,38 0,55 160,11 0,20
nk  xk  X 
 g
 
1489,305 8,178 1761,226 2,649 3261,358
2
 ___ 
SCF  n x 
k k
 45 ,53   3261, 358

 
¡La universidad para todos!

Paso 5: Calculamos la suma de cuadrados de las desviaciones


entre cada dato y la media de su grupo.
SCR   xik  xk 
2

siendo x ik  cada dato i del grupo k


: ___

x k  media aritmética del grupo k


Esta es la suma de cuadrados no explicada, a la que
denominaremos Suma de cuadrados residual (SCR) o
variabilidad residual.
En la literatura científica también se denomina a la SCR como
SC Dentro de los grupos (SS Within)

SCT  SCF  SCR  SCR  SCT  SCF


¡La universidad para todos!

CASADO SEPARADO VIUDO SOLTERO


635,76 541,34 392,76 532,54
262,90 247,54 139,67 621,16
0,62 1912,60 103,67 8,54
391,47 264,60 96,40 291,62
95,76 714,67 14,58 0,01
33,47 264,60 851,58 227,31
27,19 39,27 407,31 98,47
33,47 333,67 96,40 0,01
10,33 10,67 3,31 24,24
116,33 59,80 7,94 9,47
7,76 7,47 0,03 437,78
408,62 743,47 403,08
27,19 247,54 222,70
391,47 333,67
280,00
2
 ___  13433,850
SCR   x x

 ik
  13433 ,850
k
 
¡La universidad para todos!

Paso 6: Calculamos las medias cuadráticas.


Cada suma de cuadrados tiene sus propios grados de libertad.
• gl SCT = número total de casos menos uno, es decir n -1;
• gl SCF = número de grupos menos uno, es decir, k-1 y
• gl SCR = número total de datos menos k, es decir, n-k.
glSCT  glSCF  glSCR
En nuestro ejemplo los grados de libertad:
• Factor, entre los grupos (between)
(k - 1) = 4 - 1 = 3
• Residual, dentro de los grupos (within)
(n - k) = 53 - 4 = 49
• Total = (n – 1) = 53 - 1 = 52
¡La universidad para todos!

En ANOVA, se define una media cuadrática como el


cociente entre la suma de cuadrados y sus
correspondientes grados de libertad.

SCF
MCF   MCF 
3261, 358
 1087 ,119
k 1 3

SCR 13433,850
MCR   MCR   274 ,160
nk 49

SCT 16695,208
MCT   MCT 
n 1 52
¡La universidad para todos!

Paso 7: Calculamos el estadístico F de Fisher-Snedecor.

SCF En nuestro
2 ejemplo:
 k 1  2
MCF S
F
F
1087 ,119
MCR SCR S R F   3,965
274,160
nk
Paso 8: Con el fin de informar los resultados, se procede a
generar el cuadro resumen del ANOVA. En nuestro ejemplo
tenemos:
GRADOS
SUMA DE DE MEDIA DE
FUENTE DE CUADRADOS LIBERTAD CUADRADOS
VARIACIÓN (SC) (gl) (MC) Fcalculado
FACTOR 3 261358 3 1 087119 3,965
RESIDUAL 13 433850 49 274160
TOTAL 16 695208 52
¡La universidad para todos!

Paso 9. Se procede a establecer la probabilidad de error tipo I


o alfa asociada a nuestro valor F.
En la tabla correspondiente, ubicamos los valores (k-1) en las
columnas; y (n-k) en las filas y el punto de intersección nos informa
el valor Fa con el cual compararemos el Fobs
En nuestro
ejemplo, tenemos
los siguientes
valores:
glF (k 1)  3
glR (n  k )  49
F  3,965
¡La universidad para todos!

Los valores críticos de F son:

F0.01  5,24 F0.025  3,59


F0.05  2,92 F0.10  2,28
Paso 10. Se concluye sobre la Hipótesis nula.

Al realizar la comparación de Fobs con F, se observa


que
Fobs  F0.05  3 ,965  2 ,920
Por lo tanto, podemos rechazar la hipótesis nula, al 2,5% y
aceptamos que existe evidencia empírica suficiente para afirmar
que existen diferencias significativas entre las medias de, al
menos, dos de los grupos de padres.
¡La universidad para todos!

A partir de los resultados expuestos sabemos que las cuatro


categorías de la variable independiente presentan resultados
diferentes.

Pero no sabemos exactamente entre que categoría se presentan


dichas diferencias, pues ANOVA no nos informa al respecto.
Nos dice que hay diferencias significativas, pero no
entre que pares.
¡La universidad para todos!

ANOVA

Podemos tener varias preguntas:


• ¿Los hijos de padres casados
presentan menos problemas
específicos que los de padres
separados?

• ¿Los hijos de padres viudos


presentan más problemas
específicos que los de padres
separados?

• ¿Existen diferencias entre los


hijos de padres solteros y los
de padres separados

•El ANOVA de un factor no responde estas


preguntas
¡La universidad para todos!

ANOVA

• Podemos probar la significación estadística de las


diferencias entre pares individuales de
condiciones.
• Estas pruebas son conocidas como
comparaciones post-hoc.
• Se calcula un valor crítico de diferencias a través
del procedimiento que explicaremos a
continuación.
¡La universidad para todos!

Ejemplo de aplicación de ANOVA


El director de entrenamiento escoge al azar 16
empleados nuevos asignados a los tres métodos y
registra su producción diaria después que terminaron
sus programas de entrenamiento:

Metodo 1 15 18 19 22 11

Metodo 2 22 27 18 21 17

Metodo 3 18 24 19 16 22 15

El director pregunta si existen diferencias en cuanto a la


efectividad entre los tres métodos.

Cortesía: Material de Clases © Jorge Córdova Egocheaga.


¡La universidad para todos!

Solución
1. Planteamiento de hipótesis:
H0 : 1= 2= 3
Ha : - (1= 2= 3) (no todas las medias son iguales)
2. Nivel de significación
 = 0,05
3. Prueba estadística
CMetrat
Fc 
CMeee
¡La universidad para todos!

4. Criterios de decisión

RA(H0) RR(H0)
1,35 3,81

Si Fc > 3,3158 se rechaza la H0, en caso contrario se


acepta.

4. Cálculos
Excel nos brinda los siguientes resultados:
ANÁLISIS DE VARIANZA
Fuentes de
Variabilidad SC GL CMe F cal p-valor F tabular
Entre grupos 40 2 20 1,35 0,29 3,81
Dentro de los 14,769230
grupos 192 13 8

Total 232 15
¡La universidad para todos!

6. Conclusiones
A. Se acepta la hipótesis planteada, se rechaza la
hipótesis alterna a un nivel de significación de 0,05.
La prueba no resultó significativa.
B. Los datos muestrales no proporcionan evidencia para
afirmar que los tratamientos son diferentes.
¡La universidad para todos!

20 de octubre de 2012 | MINE José Alejandro López Rentería


¡La universidad para todos!

CONCLUSIONES Y/O ACTIVIDADES DE


INVESTIGACIÓN SUGERIDAS

Test child behavior checklist version padres

• http://books.google.com.pe/books?hl=es&lr=&id=YxCXh5ZvTk
sC&oi=fnd&pg=PA372&dq=child+behavior+checklist++version
+padres&ots=uFfTcU0eVt&sig=Tqwg_x-
Xd7pgytnxl0PTNheycDk#v=onepage&q=child%20behavior%2
0checklist%20%20version%20padres&f=false

43
¡La universidad para todos!

¡Gracias!

Cortesía: Curso de Metodología de la Investigación


Profesor Manuel Lobos González
Año 2011

You might also like