You are on page 1of 28

TEMA 3 EAIQ

TEMA 3
CONTRASTES DE HIPTESIS

Fuente Grados de Suma de Media cuadrtica


(Source) libertad cuadrados (Mean s quare)
(Degrees of (Sum of squares)
F
freedom)
Entre columnas
(Between) k-1 SSA SSA / (k 1) MSA / MS R

Dentro columnas
(Within) n-k SSR SSR / (n k )

TOTAL n-1 SST

TEMA 3: CONTRASTE DE HIPTESIS

1. COMPROBACIN DE HIPTESIS ESTADSTICAS


2. TEST ESTADSTICOS
2.1 COMPARACIN DE VARIANZAS (TEST F)
2.2 COMPARACIN DE UNA MEDIA EXPERIMENTAL CON UN VALOR
CONOCIDO
2.3 COMPARACIN DE DOS MEDIAS EXPERIMENTALES
2.4 COMPARACIN DE RESULTADOS EMPAREJADOS

2.5 RECHAZO DE VALORES ANMALOS (TEST Q)


2.6 EL CONTRASTE CHI-CUADRADO
2.7 EL CONTRASTE DE LA NORMALIDAD DE UNA DISTRIBUCIN

3.COMPARACIN DE VARIAS MEDIAS (ANOVA)

1
TEMA 3 EAIQ

1. COMPROBACIN DE HIPOTESIS ESTADSTICAS


Ensayos estadsticos o ensayos de significacin. Son la base de
muchas decisiones cientficas, en ingeniera, etc

Slo son aplicables si suponemos que los datos tienen una


distribucin normal o gaussiana

Sistemtica a seguir:

Formular claramente la cuestin


Seleccionar el test estadstico apropiado
Decidir el nivel de significacin,
Establecer hiptesis (nula y alternativa)
Clculo del valor experimental
Comparacin con valores tabulados tericos
Toma de decisin

TIPOS DE HIPTESIS

Se propone una hiptesis que es la suposicin que se realiza sobre


un determinado suceso.
Hiptesis nula (H0) Hiptesis alternativa (H1)

-No hay diferencia entre los -Establece que existe una


valores que se comparan, y si diferencia entre el valor
la hay es debida a errores experimental encontrado y
aleatorios el valor conocido para la
poblacin.
-La diferencia encontrada
entre los valores experimental
y terico es debida a la
casualidad.

Al plantear la H0 podemos tomar 2 decisiones: Aceptarla o rechazarla


Y dicha hiptesis puede ser : Cierta o falsa

Si aceptamos la hiptesis nula, no significa que se haya probado que sea


verdadera sino que no se ha demostrado que sea falsa.

2
TEMA 3 EAIQ

= 0.05

H0 H1
cierta cierta

Error Error

xc

Si la muestra cae por encima del valor crtico se rechaza H0 aun siendo
cierta error de tipo , tipo I

Si la muestra cae por debajo del valor crtico se acepta H0 siendo H1


verdadera error tipo , tipo II

El nivel de significacin : la probabilidad de cometer un error (0.05


0.01), es decir, de rechazar una hiptesis nula que es verdadera.

Nivel de confianza: (1- ) x 100

CONSECUENCIAS:

Ejemplo: H0 : UN ATLETA NO TOMA ANABOLIZANTES

Si H0 es cierta (NO toma) pero se rechaza al dar positivo el


anlisis de orina error el atleta es descalificado
aunque no tome anabolizantes: FALSO POSITIVO

Si H0 es falsa (SI Toma) pero se acepta al no detectarse el


dopaje error no se descalifica al atleta dopado

Tiene mayor trascendencia rechazar una hiptesis cierta


que aceptar una falsa (error )

3
TEMA 3 EAIQ

TEST DE UNA COLA Y DOS COLAS


Comparar y X

Planteamiento de hiptesis H0:

Zona de
Test de dos colas aceptacin de H0

H0 = Los valores son iguales Zona de rechazo Zona de rechazo


de H0 de H0

H1 = Los valores son distintos

/2 /2

Test de una cola

H0 = Los valores son iguales Zona de aceptacin


de H0
H1 = es mayor Zona de
rechazo de H0
H1 = es menor

TEST ESTADSTICOS
2.1- COMPARACIN DE VARIANZAS

Para comparar la precisin de dos mtodos de medida podemos utilizar el


test F
S12
Fexp = Fexp > 1
S 22

La varianza del proceso que se supone ms preciso se pone en el


denominador y la varianza del proceso menos preciso se pone en el
numerador

Si Fexp < Fcrtico las varianzas son comparables

Fcrtico aparece tabulado y depende de: , 1, 2 (grados de libertad del


conjunto de datos en el numerador y del denominador) : Ftabulado (, 1, 2 )

4
TEMA 3 EAIQ

Ejemplo:
En una comparacin de dos mtodos para la determinacin de boro en muestras de
plantas se obtuvieron los siguientes resultados (g/g)
Mtodo espectrofotomtrico: media = 28,0; desviacin estndar = 0,3
Mtodo fluorimtrico: media = 26,25 ; desviacin estndar = 0,23
Para cada mtodo se realizaron 10 determinaciones. Es la precisin de ambos
mtodos comparables?

H0 : La precisin de los mtodos es estadsticamente comparable

0,32
Fexp = = 1,7
0,23 2

Ftabulado (0.05, 9,9) = 4,026


Fexp > F tabulado , se acepta la hiptesis nula,
no existe diferencia entre las
varianzas a un nivel del 5%

Valores crticos de F para una prueba de dos colas (P=0.05)

5
TEMA 3 EAIQ

2.2.- COMPARACIN DE UNA MEDIA EXPERIMENTAL CON UN VALOR


CONOCIDO

Ejemplo:
Evaluar la validez de un mtodo nuevo de anlisis comparar el
valor medio obtenido experimentalmente con el mtodo nuevo para una
muestra de Material de Referencia Certificado (MRC) con el valor
certificado de ese material de referencia.

Hacer un test t de Student:


X
t exp = n
S
ttabulado (, n-1)

Si texp < t tabulado se confirma la exactitud del nuevo mtodo empleado

Ejemplo:
En un mtodo para determinar mercurio por la tcnica de
absorcin atmica de vapor fro, se obtuvieron los
siguientes valores para un material de referencia que
contiene 38,9% de mercurio:
38,9;37,4;37,1
Hay alguna evidencia de error sistemtico?
La media de estos valores es : 37.8 %
La desviacin estndar : 0.964 %

Hiptesis nula H0 : no hay error sistemtico, el valor experimental y el


valor verdadero =38.9% coinciden

X 37,8 38,9
t exp = n= 3 = 1,98
S 0,964
ttabulado (0.05, 2) = 4.3 , tabla de dos colas

texp < t tabulado , no se rechaza la hiptesis nula,


se confirma la exactitud de la tcnica de vapor fro

6
TEMA 3 EAIQ

Valores de t de Student para varios niveles de confianza y diversos grados de


libertad (2 colas)

Valores de t de
Student para
varios niveles de
confianza y
diversos grados
de libertad (1 y 2
colas)

7
TEMA 3 EAIQ

Ejemplo:
En el ciclismo profesional, un hematocrito superior al 50%
implica sancin por dopaje por EPO (eritropoyetina). Para la
siguiente serie de medidas se quiere decidir para = 0,05 si se ha
sobrepasado el lmite legal.
51,9; 50,6; 50,8; 49,3; 50,0; 51,2;51,7; 50,9

Hiptesis nula H0 : el valor de EPO para el ciclista no es mayor que el lmite legal

(X ) 50,8 50 )
t exp = n= 8 = 2,65
S 0,855
ttabulado (0.05, 7) = 1,89 , tabla de dos colas

texp > t tabulado , se rechaza H0, la media es superior al lmite legal

Si = 0.01, t=3.00, no se rechazara H0 , evitaramos falsos positivos pero aumentara el riesgo de falsos negativos.
Para reducir el error sin aumentar el , habra que aumentar la precisin del mtodo (reducir s)

Criterios para la aceptacin o rechazo de la hiptesis nula

8
TEMA 3 EAIQ

2.3.- COMPARACIN DE LAS MEDIAS DE DOS MUESTRAS


P.ej. para comprobar la validez de los resultados de un mtodo analtico nuevo
pueden compararse los resultados obtenidos con un segundo mtodo (mtodo
de referencia).

Importancia de la incertidumbre para comparar resultados

Lo primero que haremos es aplicar un test F de comparacin de varianzas

Caso A: Si las varianzas son comparables

1.- Se calcula una varianza conjunta:


( n1 1) S12 + ( n2 1) S 22
S2 =
n1 + n2 2

(X )
2.- Se calcula t:
X2
t exp = 1

1 1
S +
n1 n2

El nmero de grados de libertad para buscar t en las tablas es n1+ n2-2


Si texp ttab los valores son comparables

9
TEMA 3 EAIQ

Ejemplo:
En una comparacin de dos mtodos para la determinacin de boro en muestras de
plantas se obtuvieron los siguientes resultados (g/g)
Mtodo espectrofotomtrico: media = 28,0; desviacin estndar = 0,3
Mtodo fluorimtrico: media = 26,25 ; desviacin estndar = 0,23
Para cada mtodo se realizaron 10 determinaciones. Estos mtodos dan resultados
cuyas medidas difieran significativamente?
H0 : La media de los resultados dada por ambos mtodos es la misma
(9 0,3 2 + 9 0, 23 2 )
S = 2
= 0,0715 S = 0.267
10 + 10 2

X1 X 2 ) (28,0 26,25) =14,7


t exp = =
1 1 1 1
S + S +
n1 n2 10 10

ttabulado (0.05, 18) = 2,1


texp > t tabulado , se rechaza la hiptesis nula,
la diferencia es significativa al nivel del 5%

Caso B: Si las varianzas no son comparables

texp =
(X 1 X2 )
S12 S 22
+
n1 n2
2
S12 S 22
+
n1 n2
Grados de libertad: = 2 2
(
S1 n1
2
) (
+
S 22 n2
2
)
n1 + 1 n2 + 1

El resultado de esta ecuacin se redondea al nmero entero ms


cercano, y se compara la texp con la ttab(, )

10
TEMA 3 EAIQ

Ejemplo:
Queremos comparar las emisiones de SO2 de una planta
trmica durante 2015 y 2016, saber si difieren o no. La
concentracin correspondiente a 2015 fue 5.5 0.6
g/m3 (media desviacin estndar, n= 12 medidas
mensuales), y la concentracin en 2016 fue 4.6 1.4
g/m3 (n = 10).
F-test:
H0 : Las precisiones son estadsticamente comparables
1 .4 2
Fexp = = 5.4
0.6 2
Ftab (0.05, 9 , 11) = 3.588
Fexp > F tab ; H0 se rechaza. The precisiones no son comparables

t-test:
H0 : Las emisiones de SO2 en 2015 and 2016 son estadsticamente comparables
texp = 1.89
d.f. = 12.3 12 g.l.
ttab (0.05, 12) = 2.179
texp < t tab , H0 se acepta, las emisiones son comparables

Utilizando los mismos datos, y teniendo en cuenta que la


centra trmica quema carbn en 2016 con un contenido
ms bajo en azufre. Si la pregunta fuera:
La concentracin media anual se ha reducido en 2016?

Existen razones objetivas para creer que la contaminacin no


puede haber aumentado, y se aplica el ensayo de un lado
t-test:
H0 : Las emisiones de SO2 en 2016 no es menor que en 2015
H1: La emisin es menor

texp = 1.89
ttab (0.05, 12) = 1.78 en la tabla de un lado

Se rechaza H0. La respuesta sera que la concentracin se ha reducido

11
TEMA 3 EAIQ

2.4.- COMPARACIN DE RESULTADOS APAREADOS


Se utiliza habitualmente cuando deben compararse dos mtodos de anlisis
por medio del estudio de muestras que contienen cantidades distintas de
analito

1.- Se calcula la diferencia para cada par de valores di

2.- Se calcula la media aritmtica y la desviacin estndar de las


diferencias

3.- Calcular texp y se compara con ttab(0.05, n-1 g.l.)

Xd n
t exp =
Sd
Si ItexpI ttab los resultados obtenidos por ambos mtodos son
comparables

Ejemplo. En un ensayo de comparacin de dos motores, se tomaron muestras de


aceite lubricante a distintos tiempos de funcionamiento. Las concentraciones de
estao encontradas (mg/L) son:
Horas [Sn], motor 1 [Sn], motor 2
100 0.218 0.244
200 0.312 0.299
300 0.365 0.353
500 0.373 0.379
750 0.379 0.388
1000 0.383 0.394

Se desea saber si los motores se desgastan de forma similar o distinta


H0 : No existen diferencias en las concentraciones medias dadas por los mtodos
Media de las diferencias: -0.0045
Desv. Estndar de las diferencias: 0.0149

En valor X d n 0.0045 6
absoluto: t exp = = = 0.74
Sd 0 .0149
ttabulado (0.05, 5) = 2.57
texp < t tabulado , se acepta la hiptesis nula

12
TEMA 3 EAIQ

2.5 .- RECHAZO DE VALORES SOSPECHOSOS, ANMALOS O DISCREPANTES

Existen procedimientos estadsticos para suministrar criterios de rechazo o


retencin de discrepantes p.ej.: test Q de Dixon

Etapas:
1. Ordenar de forma creciente o decreciente los datos
2. Calcular la diferencia en valor absoluto entre el valor dudoso y el vecino
mas prximo
3. Calcular el recorrido R de toda la serie, es decir la diferencia entre el valor
mayor y el menor
X d X d 1
4. Calcular Qexp: Qexp =
R
5. Buscar en la tabla el valor de Q terico para n determinaciones y un nivel
de significacin

6. Si Qexp > Q,n rechazar el valor dudoso para el nivel de significacin


elegido

13
TEMA 3 EAIQ

Ejemplo:
Se obtuvieron los siguientes valores para la concentracin de nitrito (mg/L)
en una muestra de agua de ro:
0,403; 0,410; 0,380; 0,403; 0,400; 0,413; 0,411
El valor de 0,380 debera ser rechazado?

X d X d 1 0,400 0,380
Qexp = = = 0,606
R (0,413 0,380)

Qtabulado (0,05, 7) = 0,568

Qexp > Q tabulado , la medida sospechosa se rechaza a un nivel de significacin


del 5%

2.6.- EL CONTRASTE CHI-CUADRADO


En este test se trata con FRECUENCIAS (el nmero de veces que sucede un
suceso dado). Se supone que las medidas se extraen de una poblacin que
se distribuye normalmente

1.- Se utiliza para contrastar si las frecuencias observadas concuerdan con


las esperadas

2.- Se calcula un estadstico X2

(Oi Ei ) 2
X = 2

i Ei

3.- Se compara con un X2 tabulado para (habitualmente 0.05), y n-1


grados de libertad

14
TEMA 3 EAIQ

Ejemplo:
El nmero de roturas en el material de vidrio de cuatro trabajadores de un
laboratorio a lo largo de un periodo de tiempo es el siguiente:
Nmero de roturas: 24,17,11,9
Hay alguna diferencia de que los trabajadores difieran en su habilidad?

H0 : No existen diferencias entre la habilidad de los trabajadores


Frecuencia Frecuencia O-E (O-E)2/E
observada, O esperada, E
24 15,25 8,75 5,020
17 15,25 1,75 0,201
11 15,25 -4.25 1,184
9 15,25 -6.25 2,561
Totales 61 0 X2= 8,966

X2tabulado (0,05,3) = 7.81

X2exp > X2tab , se rechaza la H0 , los trabajadores difieren en su habilidad

2.7.- EL CONTRASTE DE NORMALIDAD DE UNA DISTRIBUCIN

REPRESENTAR LA CURVA DE FRECUENCIAS ACUMULADAS. Representacin en PAPEL DE


PROBABILIDAD NORMAL

Medida Frecuencia % Frecuencia


acumulada acumulada
74 1 6.25
Ejemplo. Comprobar si 86 2 12.50
los valores siguientes 88 3 18.75
proceden de una poblacin 89 4 25.00
normal: 109, 89, 99, 99, 99 6 37.50
107, 111, 86, 74, 115, 107,
104 7 43.75
134, 113, 110, 88, 104
107 9 56.25
109 10 62.50
110 11 68.75
Se utiliza la frmula: 110 12 75.00
% frecuencia acumulada = 100 x 113 13 81.25
frecuencia acumulada /(n+1)
115 14 87.50
134 15 93.75

15
TEMA 3 EAIQ

Al hacer as el clculo, la frecuencia acumulada del 50% cae en la mitad de la


serie de datos, y si estos proceden de una distribucin normal, se obtendr una
representacin en forma de S

Frecuencia acumulada para una distribucin normal

Al hacer la representacin en papel de probabilidad normal con una escala no


lineal, la S se convierte en una lnea recta

Representacin de los datos del ejercicio en papel de


probabilidad normal (los datos se ajustan bastante bien a una lnea recta)

16
TEMA 3 EAIQ

EL CONTRASTE DE LA BONDAD DEL AJUSTE DE KOLMOGOROV

Para contrastar la procedencia de una muestra de observaciones de una


distribucin normal. El contraste de chi cuadrado puede utilizarse cuando se
trata con frecuencias y ms de 50 observaciones.

El contraste de Kolmogorov-Smirnov se emplea con datos continuos

1.- Se compara la curva de frecuencias acumuladas terica con la


curva de frecuencias acumuladas de los datos que se desean
contrastar

2.- Se busca la mayor diferencia vertical entre ambas

3.- Se compara la diferencia mayor con el parmetro estadstico tabulado


de Kolmogorov para y n (nmero de medidas)

Empleo del mtodo de Kolmogorov para contrastar la distribucin


normal
(Las flechas indican las diferencias mximas entre la curva de frecuencias acumuladas
terica y las dos distribuciones)

17
TEMA 3 EAIQ

Ejemplo. Se realizaron ocho valoraciones, con los resultados 25.13, 25.02, 25.11,
25.07, 25.03, 24.97, 25.14, 25.09
a) Podran dichos resultados proceder de una distribucin normal con media
25.00 y desviacin estndar 0.05 mL? b) Y de cualquier otra poblacin normal? :
distancias
H0 : Los resultados proceden de una distribucin normal
xi zi FEi fOi FOi IFEi-FOiI IFEi-FOi-1I
24.97 -0.6 0.2743 0.125 0.125 0.1493 0.2743
25.02 0.4 0.6554 0.125 0.25 0.4054 0.5304
25.03 0.6 0.7257 0.125 0.375 0.3507 0.4757
25.07 1.4 0.9192 0.125 0.5 0.4192 0.5442
25.09 1.8 0.9641 0.125 0.625 0.3391 0.4641
25.11 2.2 0.9861 0.125 0.75 0.2361 0.3611
25.13 2.6 0.9953 0.125 0.875 0.1203 0.2453
25.14 2.8 0.9974 0.125 1 -0.0026 0.1224

Diferencia experimental mayor: 0.5442 Se rechaza H0, los datos no proceden


de una distribucin normal de media
Valor tabulado (0.05, 8)= 0.288 25.00 y s = 0.05 mL

b) La media es 25.07 y s= 0.059 mL, si la diferencia mxima < 0.288, se aceptara H0

3. ANOVA: COMPARACIONES DE VARIAS MEDIAS


Ejemplos:
Comparar la concentracin de un reactivo almacenado en condiciones diferentes
Comparar los resultados analticos obtenidos sobre una muestra analizada por
distintos analistas o laboratorios
Comparar la homogeneidad de distintas partes de un material
Comparar la concentracin de colesterol en sangre, en individuos clasificados por
intervalos de edad

Dos posibles fuentes de variacin en los datos:

El error aleatorio en la medida

El efecto del factor controlado o de efecto fijo

18
TEMA 3 EAIQ

El anlisis de varianza (ANOVA : Analysis of Variance) es una tcnica estadstica


que se utiliza para:
separar y estimar las diferentes causas de variacin: VARIACIN DEBIDA AL
FACTOR DE EFECTO ALEATORIO Y AL FACTOR DE CONTROL

Se estudia si la alteracin del factor ocasiona diferencias significativas entre


los valores medios obtenidos.

Si consideramos un slo factor: ANOVA de un factor

Diversos factores independientes: ANOVA de dos o ms factores

Ejemplo: Fluorescencia de disoluciones almacenadas en diferentes


condiciones

j Preparacin 1h 1 hora luz tenue 1 hora luz


reciente (R) oscuridad brillante

102 101 97 90
100 101 95 92
101 104 99 94
xj 101 102 97 92
sj 1.0 1.73 2.0 2.0
sj2 1.0 3.0 4.0 4.0

Media total: x
: 98 unidades
Influye el tipo de
Desv. St.: S: 4.37 unidades
almacenamiento en la
Varianza: 19.09 unidades2 intensidad de fluorescencia?

19
TEMA 3 EAIQ

Podran hacerse test-t comparando las columnas 2 a 2, o plantear una


cuestin ms general:
afecta el FACTOR (estudiante analista) a la media de los resultados
obtenidos?
todos los procedimientos llevan al mismo resultado?

Para utilizar ANOVA debe cumplirse que:

Cada conjunto de datos debe ser independiente del resto


Los resultados obtenidos para cada conjunto deben seguir una
distribucin normal
Las varianzas de cada conjunto de datos no deben diferir de forma
significativa

1) Los datos de cada conjunto deben seguir una DISTRIBUCIN NORMAL:

1) Coeficientes de asimetra y curtosis estandarizados entre -2 y +2


Donde g1 y g2 son los coeficientes de asimetra y curtosis respectivamente,
y n el nmero de datos considerados

2) Las diferencias entre cada dato y el valor medio de la columna


(Residuales, eij ) deben ajustarse a una distribucin normal
( residual: eij = xij x j )

Grfico de dispersin
Grfico de residuales

20
TEMA 3 EAIQ

2) Comprobar homogeneidad de varianzaIMPLICITAS


SUPOSICIONES (HOMOCEDASTICIDAD)
DE ANOVA
Test de Cochran: Comparar la varianza mxima dentro columnas con la
suma de las varianzas

Ho= Las varianzas (dentro columnas o grupos) son homogneas


H1= Las varianzas (dentro columnas) no son homogneas
s R2 = 1 . 0
2
2
s Osc =3 smax
C=
2
s tenue = 4
2
smax =4 y s 2j = 12, as que C = 4 / 12 = 0.33 sj
2
j
2
s brillante = 4

Ctab(0.05, nj , k) = C(0.05,3,4)= 0.7679

Como C < Ctab Homocedasticidad

El test de Cochran requiere que todas las columnas contengan el mismo n de


resultados (nj). (si los nj no difieren demasiado el valor ms frecuente).

Adems como P = 1.0 >0.05 no hay diferencia estadsticamente


significativa entre las varianzas para un nivel de confianza del 95,0%.

Tabla test Cochran

21
TEMA 3 EAIQ

3) DESCOMPOSICIN DE LA VARIANZA TOTAL DEL CONJUNTO DE DATOS


EN SUS COMPONENTES

ANOVA divide la varianza total del conjunto de datos en sus componentes:

1 2 ... j ... k
Muestra 1 x11 x12 x1 j x1k
Muestra 2 x21 x22 x2 j x1k
Muestrai xi1 xi 2 xij xik
Muestran
j xn11 xn2 2 xn j j xnk k
Media x1 x2 xj xk
Varianza s12 s 22 s 2j s k2
Media Total : x Donde:
k : n total de columnas
j : Indicativo de columna. j = 1 ..... k ( n de columnas)
i= indicativo de fila i = 1 ...... n j
n j : n de datos de una determinada columna
x : media de una determinada columna
j

CONCEPTO DE VARIANZA :

Es el valor medio de la suma de cuadrados de las desviaciones:

s = (xij x )
k nj
2
T
2
(n 1) = SST /(n 1)
j =1 i =1

k
donde n = nj
j =1

La varianza total es la suma de las diferencias al cuadrado entre cada uno


de los datos y la media total dividido entre (n-1) grados de libertad, donde

n es el n total de datos en la tabla (n x k) j

22
TEMA 3 EAIQ

La suma de los cuadrados (sum of squares) puede descomponerse en:

SST = (xij x j ) + n j (x j x )
2 2

j i j

SST = SSR + SSA


suma residual de cuadrados = suma de cuadrados debida al efecto
SS within = SS dentro del factor= SS between = SS
columnas entre columnas

Incluye:

La diferencia de cada dato respecto a la media de la columna a la que


pertenece

La diferencia de esa media (de la columna) respecto a la global

Para estimar la varianza (MS), a partir de la suma de cuadrados, se


divide esta por el n de grados de libertad: MST = SST / df

Aplicado a SSR y SSA : MSA = SS A / (k 1 ) MSR = SS R / (n k )

ANLISIS DE VARIANZA: Se compara la media


cuadrtica debida al factor (MSA) con la media
cuadrtica debida al residual (MSR).

Se realiza un test F:
MS A SS A (k 1)
Fexp = =
MS R SS R (n k )

Fexp se compara Ftab para k 1 y n k grados de libertad (1 cola)

23
TEMA 3 EAIQ

CLCULOS:
La suma de los cuadrados total es:

SST = sT2 (n 1) = 19,09 (12 1) = 210,0

La suma de los cuadrados debida al efecto del factor (entre grupos):


k
SS A = n j ( x j x ) 2 = 3 (101 98) 2 + 3 (102 98) 2
j =1

+ 3 (97 98) 2 + 3 (92 98) 2 = 186


La suma de los cuadrados residual (dentro de grupos):

SS R = SST SS A = 210,1 186 = 24,1


Las medias cuadrticas:

MS A 186
MS A = = = 62
k 1 3 MS A 62
Fexp = = = 20,7
MS R 3
MS R 24,1
MS R = = = 3,0
n k 12 4

La tabla de ANOVA
Consta de 5 columnas.
La primera se refiere a la fuente o causa de variacin en el conjunto de datos
La segunda y tercera a los grados de libertad y a la suma de cuadrados
.
La cuarta a la media cuadrtica
.
Y la quinta al valor de F (Test Fisher).

El valor de probabilidad (P) suele venir dado en una sexta columna.

Tabla de ANOVA de una va

Fuente Grados de Suma de Media cuadrtica


(Source) libertad cuadrados (Mean square)
(Degrees of (Sum of squares)
F
freedom)
Entre columnas
(Between) k-1 SSA SSA / (k 1) MSA / MSR
Dentro columnas
(Within) n-k SSR SSR / (n k )

TOTAL n-1 SST

F 0.05; k-1 ; n-k = ....... conclusin sobre la significacin de A (el factor)

24
TEMA 3 EAIQ

TABLA ANOVA

Fuente Suma de Cuadrados g.l. Cuadrado Medio Razn-F Valor-P

Entre grupos 186 3 62 20.7 0,0000


Intra grupos 24 8 3
Total (Corr.) 210 11

H0= MSA no es mayor que MSR (la varianza asociada a entre


grupos, al factor no es mayor que la varianza debida al residual
(dentro grupos)

H1= MSA es mayor que MSR (La varianza asociada a entre grupos,
al factor es mayor que la varianza debida al residual (dentro
grupos),

F exp. = 62/3.0= 20.7 >> F tabulada (0.05, 3, 8)= 4.066, tabla 1 cola

Adems tambin P = 0,0004 < = 0.05

Por tanto se rechaza H0 Al menos uno de los estudiantes


proporciona resultados diferentes de los otros

25
TEMA 3 EAIQ

4) CLCULO DE INTERVALOS LSD ; PRUEBA DE RANGOS MLTIPLES

Puede ocurrir que:

Una media sea diferente de todas las dems


Todas las medias pueden diferir entre s
Las medias pueden repartirse en varios grupos distintos.

Para averiguar la razn de un resultado significativo: se ordenan las


medias en orden creciente y se comparan las diferencias entre valores
adyacentes mediante una cantidad denominada la mnima diferencia
significativa: least significant difference (LSD)

Es un mtodo simple: normalmente conduce a demasiadas diferencias


significativas.

Tabla de Medias

Error estndar de cada


Media para cada media (variabilidad)
nivel de Mtodo Intervalo LSD
Error Est.
Almacenamiento Casos Media (s agrupada) Lmite Inferior Lmite Superior

1h luz bril 3 92,0 1,0 90,3694 93,6306


1h luz suave 3 97,0 1,0 95,3694 98,6306
1h osc 3 102,0 1,0 100,369 103,631
R 3 101,0 1,0 99,3694 102,631
Total 12 98,0

El error estndar: resultado de dividir la raz de MSR por la raz


cuadrada del nmero de observaciones en cada nivel
MS R 3
Error estndar = = =1
nj 3

Mnima diferencia LSD = 2 Error estd t ( 0 . 05 , n k = 8 ) =


significativa
(LSD) = 2 1 , 0 2 , 306 = 3 , 26

La t se mira en la tabla de dos colas, porque cualquier media puede ser ms grande o pequea que otra

26
TEMA 3 EAIQ

Diferencia mnima significativa (LSD) de Fisher: Intervalos construidos de tal


manera que, si dos medias son iguales, sus intervalos se solaparn un 95,0% de
las veces

Contraste Mltiple de Rango

Grupos homogneos segn la


alineacin del signo X.
Mtodo: 95,0 porcentaje LSD
Almacenamiento Casos Media Grupos
Homogneos
Forman un grupo de medias
1h luz brilllante 3 92,0 X
entre las cuales no hay
1h luz suave 3 97,0 X
diferencias estadsticamente
Reciente 3 101,0 X
significativas.
1h oscuridad 3 102,0 X

Determinacin de las medias


Contraste Sig. Diferencia +/- Lmites que son significativamente
1h luz bril - 1h luz sua * -5,0 3,26119 diferentes unas de otras.
1h luz bril - 1h osc * -10,0 3,26119 Diferencia estimada entre cada
1h luz bril - R * -9,0 3,26119 par de medias usando
1h luz suave - 1h osc * -5,0 3,26119 intervalos LSD
1h luz suave - R * -4,0 3,26119
1h osc - R 1,0 3,26119 * El asterisco, indica que
existen diferencias
* indica una diferencia significativa. estadsticamente
significativas a un nivel
de confianza 95,0%.

27
TEMA 3 EAIQ

CONCLUSIONES

Segn la tabla de ANOVA: los distintos tipos de


almacenamiento no proporcionan iguales resultados en cuanto
a la intensidad de fluorescencia del compuesto almacenado

Segn el test de Rangos Mltiples: El almacenamiento a la luz


produce un descenso en la intensidad de fluorescencia

BIBLIOGRAFA

Miller, J.N.; Miller, J.C.: "Statistics and chemometrics for analytical chemistry,
6th Ed.", Prentice Hall, 2010.
Ramis Ramos, G.; Garca lvarez-Coque, M.C.: "Quimiometra", Sntesis, 2001
Mongay Fernndez, C.: Quimiometra, Servicio Publicaciones Universidad de
Valencia, 2005.
Skoog y col.: Fundamentos de qumica analtica, Thomson-Paraninfo, Madrid,
2005.
Harris, D.C. Quantitative Chemical Analysis, 8th ed., W.H. Freeman, N.Y., 2010.
Harvey, D.: Qumica Analtica Moderna, Interamericana, Madrid, 2000
https://chem.libretexts.org/Textbook_Maps/Analytical_Chemistry_Textbook_
Maps/Map%3A_Analytical_Chemistry_2.0_(Harvey) Data consulta: 3/4/2017

28

You might also like