Professional Documents
Culture Documents
QUIMIOMETRIA Y
CONTROL DE CALIDAD EN
QUI MICA ANALITICA
f---.!
II
f---.!
Estudio recuperacion
I
I
>-------ol
~
Estudio interferencias
c._____-----+1 propcrcionales
(efectos de matriz y otros)
I
,
CONCEPTOS BASICOS DE
QUIMIOMETRIA Y CONTROL DE
CALIDAD EN QUIMICA ANALITICA
'-"'-'1 I
L-1.&..._,'-1'
1
1
4
15
37
53
53
53
55
58
62
64
67
70
73
73
74
75
78
81
84
86
87
91
91
92
93
102
105
109
__,.
QUIMICA
-A~N::=-cA'=L"'=IT=I=-=C~A,------~~
INFORMACION
UTIL
(RESULTADO)
Esta vision de Ia Quimica Analitica supera a Ia tradicional en Ia que habia simplemente una
muestra (noun sistema material) que era analizada (no de Ia que se extraia informacion) para nose sabia
que fm (en Iugar de en respuesta a un problema). Por tanto los principales protagonistas de nuestra
historia son los sistemas materiales, los interrogantes que sobre ellos se formulan, y Ia informacion que
ha de generarse para resolverlos. Esta informacion habra de responder a ciertos requisitos de calidad y
cantidad que iremos viendo posteriormente, y ademas habra de haberse obtenido a un coste razonable.
Por tanto, un requisito adicional de Ia tarea de Ia Quimica Analitica es el proporcionar Ia informacion
requerida al menor coste posible.
Otra cuestion subyacente a Ia anterior es Ia diferencia entre lo que es un simple analisis,
entendido como una operacion eventual realizada en un laboratorio, de lo que es un sistema de analisis y
medida que funciona de manera continua o semicontinua. En dicho sistema Ia informacion tiene que fluir
en un continuo (ya que dicha informacion puede ser parte de una cadena de operaciones exterior al
laboratorio) a un ritmo determinado, y siempre manteniendo bajo control su coste y su calidad. Esto
afiade una novedad mas. La tarea de un quimico analitico ya no es solo saber analizar (o generar
informacion), sino saber gestionar un sistema de analisis y medida.
Un ejemplo:
Los ayuntamientos de las ciudades estan obligados a velar por la seguridad e higiene de sus ciudadanos, lo que
incluye el asegurarse de que en el casco urbano no hay acumulacion importante de algunos productos que se sabe
contaminantes, particulannente los oxidos de Nitrogeno y el Ozono.
Sistema: Atmosfera urbana; Problema planteado: Vigilancia de niveles de oxidos de nitrogeno y de ozono;
Informacion requerida: a) Concentracion promedio de oxidos de Nitrogeno en la ciudad (contaminacion a largo
plazo); b) Determinacion del riesgo de que en alguna zona se supere el nivel de exposicion maximo permitido.
Observa que para resolver esta cuestion es preciso el concurso de numerosos profesionales (quimicos, politicos,
estadisticos, medicos, especialistas medioambientales ...)
Observa tambien que la informacion requerida es cuantitativa pero no se limita solo a un dato de concentracion.
Observa, ademas, que no se trata de realizar un analisis eventual, sino de montar un sistema de medicion y control
que habra de funcionar de forma continua y en un plazo determinado (no tiene sentido que la respuesta se produzca
despues de haber pasado la alerta.
Observa, finalmente, que los contribuyentes quieren estar protegidos del peligro de la contaminacion, pero no
quieren que su dinero se gaste en experimentos.
Ejercicio.- Busca unos cuantos ejemplos mas, identificando en todos los casas el problema, el sistema a
estudio, Ia informacion requerida y su posible inserci6n en una cadena exterior allaboratorio, la
periodicidad de los ana/isis y las dificultades de gesti6n de dicho sistema. Resalta las diferencias
entre el sistema material y Ia muestra, entre Ia informacion requerida y el dato de
concentracion, entre el amilisis y el sistema de medida.
En RESUMEN: La Quimica Analitica es Ia ciencia que se ocupa de Ia generacwn de
informacion de sistemas materiales sobre los que se ha planteado una cuestion o problema. La
informacion generada debe ser la necesaria y suficiente para resolver el problema, y debe ajustarse en
tiempo, calidad y coste a los requerimientos. Dicha informacion se producira en un sistema que
funcionara de manera continua o semicontinua y que debe ser gestionado de forma adecuada. La
informacion que Ia Quimica Analitica suministra puede ser de caracter quimico basico, o elaborada. La
informacion quimica basica puede ser de naturaleza cualitativa, cuantitativa o estructural. AI atomo,
molecula o especie objeto de Ia investigacion analitica se le conoce como analito. Pero tambien Ia
informacion generada puede ser mas elaborada, como ocurre por ejemplo, en el control antifraude. En
estos casos la informacion quimica no es relevante, se emplea la informacion quimica para obtener una
identidad de origen, marca o tipo, por ejemplo.
Tabla sinopsis de las diferencias entre la vision clasica y la actual de la Quimica Analitica y de su tarea
Parametro
Vision clasica
Analizar
Conocimiento
Muestra
lndiferente
Metoda de analisis
Presencia o concentracion
Veracidad
Eventual
Funci6n
Raz6n
Objeto
Sujeto
Herramienta
Resu/tado
Criteria de evaluaci6n
Frecuencia
Calibracion
Forma de control
Vision actual
Proporcionar informacion optima
Resolver un problema
Sistema material
Cliente
Sistema de medida
Informacion
Utilidad/Coste
Continua o semicontinua
Continua, sistematizada
retroalimentada
V.Ferreira
pasar un control aduanero o conseguir un certificado sanitario. La mayor parte de estos analisis se ha de
realizar siguiendo unas normas muy estrictas sometidas a control legal. Trabajar en estas areas es lo que
denominamos trabajo en entomos regulados, lo que exige una forma muy rigurosa de planificar, ejecutar,
controlar, evaluar y registrar todos los pasos y datos de un analisis.
Protecci6n al consumidor: Los alimentos pueden contener sustancias no autorizadas que pueden
dafiar al consumidor, que no estan permitidas, o que son simplemente distintas de Io especificado
(fraude). Tambien es cada vez mayor el mimero de parametros a determinar: drogas veterinarias
(anabolizantes no autorizados), conservantes ilegales en alimentos, niveles maximos de conservantes y de
ciertas sustancias toxicas, contaminacion bacteriana, presencia de transgenicos, etc. Esta area de trabajo,
es tambien un area sensible sometida a control legal y el trabajo se ha de desempefiar en un entomo
regulado.
Certificaci6n y peritaje: En muchas transacciones comerciales, el precio de un producto es
funcion de su contenido en cierto metal, o en cierto compuesto. Su determinacion con exactitud es una
cuestion clave que se realiza en laboratories oficiales o acreditados.
Otras muchas areas en donde el analisis es fundamental son la quimica forense y de aduanas, el
control antifraude, el control antidoping, la quimica agricola, etc.
Parametro
~Que
mide?
Comparaci6n
Caracteristicas
~Como?
~D6nde?
Sistemas guimicos
Analitos
~?
requisitos de mantenimiento y preparacion de la muestra que llevan asociadas. Esto implica, por lo
general, que en la medicion quimica seni preciso incluir etapas de reduccion y pretratamiento de la
muestra. Otra caracteristica diferencial importante es que en la medicion quimica se precisa de la
participacion humana en un grado mayor, y ademas el tipo de profesional requerido es de una alta
cualificacion.
V.Ferreira
sistemas HPLC,
sistemas GC,
analizadores de iones, y
sistemas GC-MS y HPLC-MS.
sistemas autoanalizadores, que generalmente hacen uso de una reaccion y de una determinacion
espectrofotometrica uv-vis, pero lo hacen de forma automatica.
analizadores multicomponente. Cada vez mas frecuentes en las empresas. Se trata de sistemas
basados en la medicion de parametros cromaticos (uv-vis, IR, NIR. MIR ... ), en la presencia de
una serie de sensores de distinta selectividad (oxidos metalicos, oxidos polimericos), o incluso en
la deteccion rapida del espectro de masas, que captan gran cantidad de informacion en poco
tiempo y que es procesada por sistemas inteligentes para dar una informacion elaborada o
cuantitativa.
Tecnicas Chisicas
Gravimetrias
De precipitacion
De volatilizacion
Electrodeposicion
Volumetricas
Miden un volumen de
reactivo que reacciona
estequiometricamente con el
analito
Acido Base
Complexometrias
Redox
Precipitacion
Tecnicas Instrumentales
Cromatograticas
I
HPLC (Cromatografia
Liquida de Alta
Resolucion)
Analizadores de iones
Miden Ia Absorcion,
Emision, Fluorescencia,
Dispersion de luz
de Particulas
Tecnicas
potenciometricas
Tecnicas
voltamperometricas
V.Ferreira
Medici6n de densidad,
de indice de
refracci6n, de
conductividad
electrica, de rotaci6n
de luz polarizada,
Determinacion de la composici6n de
mezclas muy sencillas y bien conocidas
(arucar, alcohol, mezclas de disolventes).
Algunos se pueden emplear como
detectores cromatognificos (caso del indice
de refracci6n o del de conductividad
electrica)
Puesto que un analito puede poseer distintas propiedades analiticas, puede ser analizado mediante
diferentes tecnicas. Por ejemplo, el hierro presente en una aleacion o en un mineral puede ser
determinado a traves de sus propiedades redox (tras ser disuelto) con una dicromatometria, o mediante
una polarografia (voltamperometria). Podriamos tambien hacer uso de sus propiedades opticas y
determinarlo a traves de la absorcion molecular uv-vis de alguno de sus complejos (ferrocianuro, o
tiocianato, ... ), o bien a traves de sus propiedades opticas atomicas y determinarlo por absorcion atomica
a la llama, o por emision atomica. Como puede verse, surgen muchas posibilidades de analisis y eso que
no las hemos agotado todas. Para poder elegir es preciso establecer terminos de comparacion entre las
tecnicas, lo que da origen a los parametros de calidad analiticos de los que hablaremos posteriormente.
implica que como todo sistema, debe ser continuamente controlado para asegurar que se mantiene bajo
control, y que el control debe estar disefiado de forma que pueda ser facilmente revisado y mejorado.
Por todas estas razones, el proceso de medicion analitica suele ser mas complejo que el expuesto
anteriormente, tal y como refleja la figura siguiente. En general habran de incluirse las siguientes etapas:
1. Muestreo. Etapa cuya mision es proporcionar una fraccion del sistema representativa de
la propiedad a estudio.
2. Reduccion de la muestra. Etapa importante solo en sistemas materiales grandes (tipico de
solidos), en los que se hade triturar y mezclar los elementos que componen la muestra a
fm de irla reduciendo en tamafio.
3. Acondicionamiento y preparacion de la muestra. Una etapa o conjunto de etapas que en
muchos metodos pueden ser la parte mas complicada. Pueden incluir desde eliminacion
de humedad, hasta procesos de digestion, de puesta en disolucion, extraccion,
concentracion, transformacion quimica, etc
4. Medida. El proceso de medicion en el instrumento analitico en si. Esta etapa suele incluir
procesos de pretratamiento de la sefial.
5. Calculo de la concentracion. En el caso mas com(m, es la interpolacion en una recta de
calibrado.
6. Procesado de la informacion. El conjunto de operaciones necesarias para transformar el
dato de concentracion (o directamente la sefial) en la informacion requerida.
7. Evaluacion del sistema. El conjunto de actividades que se realizan de forma continua y
que permiten determinar que la medicion se realiza en condiciones satisfactorias,
establecer su calidad y programar mejoras en el sistema.
A este proceso en etapas seguido por la Quimica Analitica para medir lo denominamos proceso
analitico, y al conjunto de instrucciones concretas para la realizacion de un analisis particular, metodo de
analisis.
INFORMACION
UTIL
(RESULTADO)
~i
INFORMACION
bruta
r:::::::==-~~SrA (DATO)
Muestra
preparada
PROCESO ANALITICO
INFORMACION
BRUTA (SENAL)
10
V.Ferreira
2.4.- Definiciones
PROCESO ANALITICO: Es el conjunto de etapas secuenciales que la Quimica Analitica sigue
para cumplir su mision, esto es, la de proporcionar la informacion requerida de un sistema material al
minima coste.
TECNICA ANALITICA: Es el principia de medida elegido para la realizacion de un analisis.
Par ejemplo, tecnica cromatogratica, o tecnica potenciometrica.
INSTRUMENTO ANALITICO: Es el sistema fisico empleado para realizar una medicion
analitica, es par tanto la materializacion de una tecnica analitica.
PRESENTACION de la muestra: Es la forma fisica en la que se debe encontrar la muestra que
va a medirse mediante una tecnica determinada, para que la medicion pueda realizarse con garantias de
exito y sin producir dafios al instrumento.
METODO ANALITICO: Es el conjunto de instrucciories necesarias para realizar un analisis
completo. Muy a menudo se equipara a PROTOCOLO, aunque este ultimo es mucho mas detallado.
PLAN DE MUESTREO: Es el conjunto de instrucciones y acciones necesarias para llevar a
cabo las operaciones asociadas a la toma de muestra.
ANALITO: Es la especie quimica (atomo, molecula, ion, especie radical, agregado molecular,
macromolecula, etc ... ) que es objeto de un analisis.
11
12
V.Ferreira
una cerveza) y tambien se practican en miles de laboratorios. Tambien nos encontramos con problemas
mucho mas especificos o mucho mas recientes que tan solo son resueltos analiticamente en uno o dos
laboratories, o que solo han sido abordados de forma experimental en laboratories universitarios o de
investigacion.
Ademas de Ia clasificacion anterior se pueden proponer muchas otras clasificaciones de tipos de
metodos analiticos. Por ejemplo podemos citar metodos de uso intemo, que son metodos disefiados para
el control de procesos o para el control intemo de una empresa y cuyo dato es simplemente orientativo,
podemos hablar de metodos de rutina, de metodos de screening 0 rastreo, metodos modificados, metodos
automaticos, etc.
1.)
Las tecnicas de amilisis poseen una sensibilidad y selectividad intrinsecas, pero la sensibilidad y
selectividad del metoda puede mejorarse mediante el usa de etapas de tratamiento de la muestra o de
tratamiento de la informacion. Formas de mejorar la selectividad: incluir una etapa de separaci6n de
interferencias, derivatizar al analito (transformandolo par reacci6n quimica) para poder emplear una
tecnica mas selectiva, enmascarar las interferencias, emplear estrategias matematicas para separar sefiales
superpuestas. Formas de mejorar la sensibilidad: lntroducir etapas de preconcentraci6n, derivatizar al
analito para poder emplear una tecnica (o unas condiciones de trabajo) mas sensible, o emplear
algoritmos matematicos para reducir el ruido de fonda.
2.7.- Cuestiones:
1.- Hemos dividido las tecnicas y metodos analiticos en clasicos e instrumentales, pero desde otro punta
de vista pueden dividirse en metodos absolutos (miden directamente la masa de analito ), estequiometricos
(miden la masa o volumen de un derivado de estequiometria conocida), o relativos (miden un parametro
que esta relacionado con la concentraci6n de analito). Razona cual de ellos puede ser mas exacto.
2.- Trata de relacionar la clasificaci6n anterior de tecnicas (absolutos, estequiometricos y relativos) con
Ia que hicimos anteriormente (clasica e instrumental). Razona Ia respuesta.
3.- La selecci6n de un metoda de analisis es un asunto bastante delicado y cuyo comienzo siempre es Ia
elecci6n de la tecnica de medida. Lo que se hace de acuerdo con criterios combinadas de caracteristicas
analiticas de cada tecnica y de asequibilidad y coste de las mismas. Una vez que se ha determinado Ia
tecnica de analisis que se ha de emplear, cual sera Ia cuesti6n clave siguiente en Ia selecci6n o disefio del
metoda.
4.- De los casas presentados a continuacion, nombra Ia tecnica de ami/isis, el analito y el instrumento
con que se realiza Ia medicion:
Determinacion del contenido de azucar de un zumo de frutas par medicion de Ia densidad.
Determinacion de Hierro par medicion del color generado al formar un complejo con tiocianato.
Determinacion de Calcio par medicion del color generado al meter Ia disolucion en una llama.
Determinacion de Cloruro empleando un electrodo selectivo
Determinacion de pesticidas organoclorados par separacion en cromatografia gaseosa
empleando un detector selectivo de masas
Determinacion de cloruros del agua par pesada del precipitado de cloruro de plata obtenido
5.- Haz una visita a Ia pagina web de Ia asociaci6n ISO (b.ttp:!lwww.iso.ch/) y determina si hay a/gUn
metoda de ana/isis quimico para alimentos regulado par una norma ISO. iQue tipo de metodos?
6.- En Ia OCDE (b.ttp://www.oecd.org) hay un capitulo dedicado al tema de seguridad alimentaria. i Que
tipo de aspecto preocupa mas a Ia OCDE?
7.- iQue norma ASTM (b.ttp:/lwww.astm.org) tendrias que consultar para realizar un ana/isis de oxido
de cobre-I en tintas?
8.- iEn que esta basado el metoda propuesto par Ia EPA (b.ttp://www.epa.gov/) para determinar aniones
inorganicos en agua potable?
9.- iQue directiva de Ia UE (b.ttp://europa.eu.int!) aborda el ana/isis de dioxinas y PCBs en piensos?
i Que recomienda esta directiva?
10.- i Como define Ia precision y Ia exactitud de un metoda bioanalitico Ia FDA (b.ttp:/lwww.(da.gov/)?
(una pista, busca validacion)
lJ
DE
LA
Todas las decisiones que tomamos estan basadas en datos y el acierto de una decision depende de
Ia correcta interpretacion de estos datos. Un cientifico, al seguir el "metoda cientifico" busca disefiar un
experirnento que le proporcione los datos necesarios para aceptar o rechazar una hipotesis. El profesional
de una empresa recaba datos de composicion para aceptar o rechazar un lote de materia prima, o para
reformular un producto, o para cualquier otra cuestion, pero siempre se apoya en datos. El precio de
numerosos productos naturales e industriales se fija en funcion del contenido en ciertas sustancias, cuya
medicion puede resultar compleja, en fm, en un largo etcetera de actividades hay decisiones que deben
tomarse en funcion de datos obtenidos en un laboratorio o instrumento quimico de medida. Silos datos
fueran inequivocos tamar una decision seria facil, sin embargo, esto no es asi: los resultados de un
proceso analitico no son inequivocos, sino que existe una cierta probabilidad de que no coincidan
totalmente con los valores reales, por toda una serie de razones que vamos a estudiar. Las distintas causas
que pueden hacer que un resultado no concuerde exactamente con el valor cierto son analizadas,
clasificadas y tratadas por Ia teoria de los errores y de las medidas repetidas.
incertidumbre
R U
exactitud
+ t
precision
V Ferreira
16
AI realizarse los ana/isis por duplicado, detectaremos Ia presencia de dicho tipo de error si observamos
una divergencia de mas del 10% entre los valores de las replicas. Tan solo podria pasarnos inadvertido un error
de este tipo, si el fallo del inyector ocurre de forma simultanea en las dos replicas (Y ademas fuera de Ia misma
magnitud). Esto ocurrira 1/(75/ de las veces. Por tanto, Ia probabilidad de que el resultado vaya afectado de
dicho error craso sera inferior a/ 0, 17 por mil.
Un error sistematico ( o determinado) es aquel que introduce una desviacion del resultado frente
al valor real como consecuencia de un paso del analisis defectuoso: por ejemplo una mala calibracion,
una interferencia, adsorcion y perdida de analitos por almacenar las muestras en recipientes inadecuados.
Como puede verse, no son errores fortuitos, sino que si no se corrigen afectaran aproximadamente por
igual a TODAS las muestras que se analicen siguiendo el mismo protocolo (por eso se Haman
sistematicos). Tienen un signo defmido (haran que los resultados se desvien del valor real por exceso o
por defecto ). Se Haman sistematicos porque afectim a una parte del sistema de medida, o sea a un metodo
de analisis (p.e. un metodo de analisis que no tenga en cuenta la existencia de una interferencia) o a su
implantacion concreta en un laboratorio (p.e. Un laboratorio que tenga contaminado el patron de
referenda, o que tenga mal calibrada la balanza). Afectan a Ia exactitud. (afectan al resultado
directamente). Algunos errores sistematicos se corrigen mediante una calibracion, pero otros requeriran
distintas acciones correctivas que pueden implicar el cambio de m6todo o incluso de tecnica.
Por ejemplo, los errores sistematicos consecuencia de contaminaciones en los materiales o
reactivos requieren el analisis de lo que se denomina "blanco" de analisis para poder detectarse y
corregirse. Finalmente, hay otros errores sistematicos cuyo descubrimiento y correccion son bastante mas
complicados. Se trata de errores asociados a Ia contaminacion del propio patron (que solo se corrige
conociendo su pureza), a Ia presencia de interferencias (cuya correccion muy probablemente requiera el
cambio de metodo), o a Ia presencia de lo que denominamos efectos de Ia matriz (cuya presencia se
detecta y corrige con mucho esfuerzo mediante una tecnica de calibracion denominada adicion estandar).
26
)'~
I
27
).~
Un mundo sin incertidumbre: nuestro
conocimiento sabre cualquier resultado
o medida tiene claridad absoluta
215
)\,
27
I I..,..., I
)~
Un mundo con incertidumbre: nuestro
conocimiento sabre cualquier resultado
admite que en sus cercanias es
probable que se encuentre el valor
cierto
La existencia de incertidumbre es una ley natural, y en el limite particular viene expresada por el
principio de Incertidumbre de Heissenberg, que establece que nuestro conocimiento sobre un sistema
particular nunca puede ser total, ya que al medir debemos interaccionar sobre nuestro sistema, lo que
provoca su cambio de estado. Este concepto puede chocar con algunas de nuestras experiencias con Ia
medicion, sobre todo si nos hemos desenvuelto desde el comienzo en un entomo digital. AI tomar el peso
1 I
de un objeto de forma repetida, la balanza arroja el mismo resultado, lo que falsamente nos puede hacer
creer que no hay incertidumbre en esta medicion. La hay, lo que pasa es que en este caso es muy
pequefia, para detectarla solo tendremos que emplear una balanza mucho mas precisa.
En realidad, el proceso de medicion debe ser considerado como un proceso de reduccion de la
incertidumbre (mejora de nuestro conocimiento) del sistema objeto de la medicion. Antes de realizar la
medicion nuestra incertidumbre sobre la composicion de un sistema puede ser muy grande (aunque casi
nunca es infmita). Tras la medicion, nuestra incertidumbre acerca del conocimiento de ese sistema se
hace menor. En todos los casos incertidumbre hace referenda al intervalo de valores en el cual esperamos
que se encuentre el verdadero resultado de la medicion. Este intervalo de valores sera tanto mas estrecho
(y la incertidumbre sera menor) cuanto con mas cuidado realicemos la medicion, esto es, cuanto mas
control ejerzamos sobre el proceso de medicion. Este aumento del control requiere complicar y encarecer
de forma progresiva el proceso de medicion, lo que implica que debe alcanzarse siempre un punto de
equilibrio en el que el esfuerzo invertido proporcione la reduccion de incertidumbre imprescindible para
que el resultado de la medicion sea util. Una incertidumbre mas pequefia de la realmente necesaria
siempre supone un sobreprecio innecesario. Por el contrario, una incertidumbre mayor de la requerida
puede arruinar la fmalidad del analisis.
Un ejemp/o, en una determinacion volume/rica est(mdar (cuya incertidumbre o precision en terminos relativos se
situa en torno a/ 0.5-1%), Ia pesada de muestra suele estar entre 0,1 y 1 g, y se realiza en una balanza
analitica cuya precision es de 0, 0001 g. La incertidumbre de Ia pes ada en terminos re/ativos es por tanto
menor de un 1 por mil, suficiente para considerarla despreciable frente a otras fuentes de incertidumbre
(por ejemplo Ia determinacion del punto final). No tendria sentido emplear una ba/anza de alta precision
(hay balanzas con precisiones 0, 00001 g e inferiores), que es mucho mas cara y en Ia que Ia medicion es
mas lenta. Pero tampoco tendria sentido emplear un granatario (cuya precision se situa en torno a 0, OJ g),
ya que esto aumentaria de forma indebida Ia incertidumbre del ana/isis.
tipo de error
afecta a:
Sistematico
(analitico)
exactitud
Aleatorio
(analitico)
precision
Sistematico (de
muestreo)
exactitud
V Ferreira
18
Aleatorio y
sistematico
(analitico)
precision y
exactitud
Sistematico (de
muestreo)
exactitud
Sistematico
(analitico)
exactitud
Aleatorio (de
muestreo)
precision
Craso
exactitud
Tanto los errores crasos como los sistematicos se pueden eliminar (o al menos reducir) siguiendo
un trabajo riguroso y empleando metodos de analisis bien conocidos. Los errores aleatorios siempre
existiran y haran que el resultado tenga una cierta incertidumbre. Esta incertidumbre afecta a las
decisiones que tomamos en base a los resultados, como lo demuestran las siguientes cuestiones:
Supongamos que la incertidumbre del resultado del ejemplo anterior fuera 1 ppm (esto quiere decir que, evaluadas
las posibles fuentes de error aleatorio, el valor real de concentracion se encuentra con probabilidad en el intervalo
resultado obtenido1 ppm). Si el nivel toxico de los oxidos deN es de 2,71 ppm, l,accionarias la alarma? l,Y si
fuera la incertidumbre de 0,001 ppm?
Reducir Ia incertidumbre cuesta esfuerzo y dinero. Una forma obvia de reducir Ia incertidumbre
en Ia toma de muestra es colocar mas sondas en muchos puntos de Ia ciudad, pero esto implica una mayor
inversion en sondas y un mayor esfuerzo derivado de Ia recolecci6n y manipulaci6n de un conjunto
mayor de datos y del mantenimiento de un sistema de medida mas complejo.
Si el nivel toxico fuera 100 ppm, no tendria mucho sentido invertir dinero para que la incertidumbre del resultado
fuera 0,001 ppm. l,Cual es la incertidumbre que mejor se adapta al coste y a las necesidades?
Todas estas cuestiones las iremos resolviendo en esta secci6n.
1.- Clasifica los siguientes errores en las categorias craso, sistematico y aleatorio:
a) El matraz de aforo utilizado en un ana/isis contenia en realidad 250, 7 mL (en Iugar de 250, 0) debido
a haber sido conge/ado.
b) En un ana/isis dado se estan utilizando disolventes organicos de tension superficial, viscosidad y
densidad muy distintas a las del agua. Se emplea material volumetrico normal (disenado y calibrado
para trabajar con disoluciones acuosas). Se observan los siguientes fen6menos:
1.- Quedan gotitas de disolvente agarradas a las paredes del material volumetrico.
2.- No ocurre lo anterior, pero el volumen remanente en la punta de la pipeta es casi nulo.
c) Tras realizar una medida en un instrumento cientifico, percibes que Ia celda (del detector) se
encuentra a una temperatura de trabajo incorrecta.
d) AI concentrar una muestra por evaporaci6n del disolvente, se observa que el ana/ito que se esta
analizando se co-evapora perdiendose parte. Haces cinco experiencias y encuentras que la cantidad
perdida es el 25, 26, 30, 24, y 22%.
e) Se desea determinar el contenido en Fe de un vag6n de piritas, y Ia sonda con que Ia que se extrae Ia
muestra del vag6n es excesivamente estrecha, de forma que los trozos de mineral mas grandes no cab en
(el contenido en mena de un mineral no es el mismo en particulas grandes que en las pequenas).
f) En el caso anterior, Ia sonda es del tamano adecuado. El vag6n contiene 30 Tm de mineral y se extrae
una muestra de 1 Kg para su ana/isis.
tema
1; llllfUUUI.:I,;lUll
a Ja \,lUlllllU!llCU li:l
1bis.- Enumera y clasi.fica seg-Un su importancia relativa todas las fuentes de incertidumbre que puede
haber en la determinacion de:
a) tu propio peso
b) el contenido en Sn de una aleaci6n
c) Ia temperatura de una habitaci6n
d) las dioxinas presentes en el agua de un rio
e) las dioxinas presentes en un tipo de productos alimenticios
Otro parlimetro relacionado con la exactitud de los metodos de analisis es la robustez, que se
defme como la resistencia al cambio de la sefial al cambiar alguno de los parlimetros de analisis. Este
termino sera defmido con mayor precision posteriormente y aqui solo haremos un uso intuitivo del
mismo. Hay metodos analiticos que son muy robustos, 16 que significa que su aplicacion a un laboratorio
concreto no representa mayores problemas. Por el contrario, hay metodos analiticos muy poco robustos
que requieren un elevado control de las condiciones operacionales y ambientales, un elevado
adiestramiento de los operadores de laboratorio y un esfuerzo de calibracion muy riguroso. La
transferencia de un metodo poco robusto de un laboratorio a otro puede ser muy costosa.
La exactitud del trabajo de un laboratorio concreto (que emplea un metodo previamente validado)
se puede verificar mediante el uso de muestras certificadas, de estlindares quirnicos, por comparacion con
metodos contrastados (oficiales o estlindares), o mediante ensayos de colaboracion. Se mide comparando
el resultado medio con el valor real. La forma mas directa es, desde luego, el uso de una muestra
certificada, aunque no existen muestras para todos los problemas posibles. Una muestra certificada es una
V Ferreira
20
muestra tipo cuyas propiedades de composicion son perfectamente conocidas. Por ejemplo, una muestra
de polvo de granito con contenido certificado en Estafio. Las muestras certificadas son producidas por
alguno de los organismos de acreditacion y normalizacion y se pueden adquirir solicitandolas a dichos
organismos, o bien a alguna empresa especificamente dedicada a ello (podnis encontrar un directorio en
la pagina http://www.labcompliance.com/ref-compounds/suppliers.htm). Los dos organismos mas
importantes que producen muestras certificadas son el americana y el europeo, cuyos datos se facilitan a
continuacion.
''National Institute of Standards and Technology (NIST)", que produce mas de 1200 SRM
(Standard Reference Materials) URL: http://ts.nist.gov/srm
Bureau Commounaitaire de Reference (BCR) - Certified Reference Materials; Institute of
Reference Materials and Measurements (IRMM) http://www.irmm.jrc.be/
Otros, Laboratorio del "Government Chemist", http://www.lgc.co.uk/; Laboratorio Nacional de
Ensayos (Francia), http://www.lne.fr/.
Para que el trabajo de un laboratorio sea satisfactorio, es preciso que la organizacion y forma de
trabajo del mismo se ajusten a una serie de normas de calidad. En particular, es preciso que ellaboratorio
garantice que la sefi.al de analito obtenida en el analisis de una muestra se pueda relacionar de forma
inequivoca con la sefial de estandares de concentracion perfectamente conocida. A este concepto se le
denomina TRAZABILIDAD del resultado. Para garantizar la trazabilidad del resultado es preciso
introducir todo el sistema analitico en un sistema de calidad (proceso de acreditacion de un laboratorio o
de un metodo particular). Este proceso puede ser largo pero supone determinar cuales son los puntos
criticos del sistema y establecer los controles de calidad y de verificacion que se consideren pertinentes,
ademas del establecimiento de una cadena jerarquica, de estructuras de responsabilidad, etc... Puede
considerarse necesario el establecimiento de auditorias extemas (una empresa experta en calibracion que
periodicamente revisa el material de vidrio, las balanzas, instrumentos, etc, .. ), ademas de establecer
controles propios (muestras de referenda intema, blancos, controles de pesada.... ).
Hablaremos con mas extension en el capitulo 4.
S=
n-l
[1]
.lQ
estandar se expresa a menudo como tanto por ciento de la media, y entonces se le denomina Coeficiente
de Variaci6n o RSD (Relative Standard Deviation).
En ocasiones puede ocurrir que la desviaci6n estandar de una serie replicada de medidas sea cero.
Esto no quiere decir que la precision analitica sea infmita y la incertidumbre sea cero, lo U.nico que quiere
decir es que la incertidumbre de dicho proceso de medici6n es muy pequefia y nose ha podido medir.
Ejemplo. AI medir de forma replicada el peso de una moneda (cuyo peso real es 0,4500 g) en un
granatario, se obtiene Ia siguiente serie de medidas: 0,45; 0,45; 0,45; 0,45; 0,45; 0,45. La
media de esta serie es 0,45 y su desviacion estandar 0. Esto no quiere decir que Ia medicion en
el granatario no tenga imprecision, lo unico que quiere decir es que su imprecision es inferior
a 0, 01 g y no Ia hemos podido medir.
Ejercicios:
2.- Cinco laboratorios distintos estan realizando un ensayo de colaboracion en el que se analizan par
sextuplicado unas muestras certificadas con un contenido de 16.5 Jig L-1 de un pesticida organofosforado (metilparation) . La tabla siguiente resume los resultados obtenidos par los distintos
laboratorios:
A
15,8
15,3
16,3
15,9
16,0
16,2
17,9
18,3
18,2
17,9
18,0
18,1
15,1
16, 7
17,1
15,9
16,9
16,9
12,8
10,9
13,5
11,3
12,0
11,9
16,6
16,9
16,4
16,6
16,5
16,4
15,8
15,3
16,3
15,9
16,0
16,2
17,9
18,3
18,2
17,9
18,0
18,1
15,1
16,7
17,1
15,9
16,9
16,9
iCual es el reactor que produce mayor rendimiento? iCual es el que genera un producto de
calidad mas uniforme? iA que piensas que pueden deberse las diferencias encontradas? iCual es Ia
diferencia entre Ia variabilidad (aleatoria) analitica y Ia muestral?
4 La siguiente tabla muestra los resultados obtenidos en Ia medicion repetida de Ia Absorbancia de una
muestra. Construye el histograma correspondiente a Ia distribucion de los resultados y calcula su valor
central (promedio) y su dispersion (desviacion estandar).
medida
1
2
3
4
5
valor
0.341
0.335
0.347
0.359
0.353
medida
7
8
9
10
11
valor
0.347
0.346
0.343
0.342
0.356
medida
13
14
15
valor
0.363
0.353
0.348
22
V Ferreira
6
0.346
0.350
12
N(30,1'2)
~ 0 , 8 +---------------~~-------A~----~
:E
~ 0,6
-j----------------1--+------+-+-----------1
..c
10
20
30
40
\,lUJlVllLf\
f\1~1\Llll\...f\ f \
V f\l~Li"ti-1./'"\
Ia \,{U1111lVUlto..U. JU
exactamente 30,0 mg, sino que apareceni una distribuci6n parecida a alguna de las de la figura, mas o
menos ancha segful sea la homogeneidad dellote.
L,Siempre aparece una distribuci6n gaussiana?
No. Hay ocasiones en las que no aparece una distribuci6n gaussiana, pero esto siempre es debido
ados posibles razones. En primer Iugar, existe la posibilidad de que los datos no pertenezcan a una unica
misma serie (poblaci6n). Par ejemplo, si en el caso del metoda analitico en el que has analizado
repetidamente una muestra certificada, este analisis se realiza en dos dias distintos y el metodo se
descalibra, obtendrias una distribuci6n suma de dos distribuciones. Lo mismo ocurriria si el late de
pastillas incluyera pastillas producidas por dos fabricantes distintos. Este efecto se puede observar en la
figura siguiente. Observa que la distribuci6n de resultados suma de las dos distribuciones individuales es
marcadamente asimetrica. Decimos que los resultados no se distribuyen de forma normal.
1,2
suma
-g
;g
1\
I\ A
0,8
:g
0,6
.c
[ 0,4
\ N(32'5,1 5)
h\
}) \\
N(30,1 ,2)
0,2
0
10
20
30
40
Figura 6: Una funci6n suma de 2 gaussianas de distinto centro noes una gaussiana
Existe una segunda posibilidad. Hay ocasiones en las que son otras distribuciones de
probabilidad las que aparecen. Por ejemplo, en distribuciones de atributos que par naturaleza no pueden
ser simetricas aparece una distribuci6n muy importante denominada log-normal. Este es el caso de la
distribuci6n del atributo "peso" en la poblaci6n humana. Esta distribuci6n no puede ser simetrica ya que
sabemos que siendo el peso medio 70Kg, existen individuos cuyo peso es superior a 140Kg, pero no
pueden existir individuos con peso negativo (que tendrian que existir para que la distribuci6n fuera
simetrica). La distribuci6n del peso tiene que ser una distribuci6n asimetrica con una cola hacia la
derecha, tal y como muestra la figura 7. Sin embargo, la distribuci6n dellogaritmo del peso si que es una
distribuci6n normal (par eso se llama log-normal).
0,4
0,35
0,3
..
..
"0
;g
:c
.c
ec.
0,25
0,2
0,15
0,1
0,05
0
-0,05
10
20
30
24
V Ferreira
que tuvieran mas mena que ganga darian contenidos muy superiores. Otra distribuci6n posible es Ia
binomial, que es Ia que aparece cuando hay dos sucesos posibles (por ejemplo, blanco o negro) cada uno
con una probabilidad asociada, y realizamos extracciones de N elementos. Una comparativa de estas
distribuciones se puede ver en Ia figura 7.
Aparte de porque se trata de una distribuci6n "natural", Ia distribuci6n gaussiana es muy
importante porque Ia mayor parte de los tests estadisticos estan basados en esta distribuci6n o en otras de
ella derivada. Ademas, y como veremos posteriormente, bajo ciertas circunstancias, incluso
distribuciones marcadamente asimetricas pueden ser convertidas en distribuciones normales. Por todas
estas razones es vital para cualquier cientifico (mas para aquel cuyo trabajo este relacionado con datos y
mediciones) el comprender y saber manejar las propiedades de esta distribuci6n.
La formula de Ia distribuci6n gaussiana es Ia siguiente:
~u
0,3
..
;g
0,25
.8
0,15
Q.
0,1
"C
:c
!:!
0,2
0,05
0
15,9%
'\
.___;.
_/f
15,9%
6%
2 3%
~
J.L+2a
X I
f.1
[3]
Este parametro no es mas que Ia distancia al centroide normalizada por Ia desviaci6n tipica de Ia
distribuci6n (distancia al centro normalizada por el error) y si ahora para cada z representamos su
probabilidad de ocurrencia, obtenemos Ia distribuci6n normal estandarizada o distribuci6n z.
.z
.........
/ '
-3
-----
-2
\
\
, &
\
\.,
:,.,
/
-5
'
"
-1
--.........
4
(z/{)
2
p(y) = - e -
[4]
-&
Lo que nos muestra, tal y como se ve tambien en la figura 9, que la distribuci6n z es una
distribuci6n normal de cr=l y centroide f-1.=0.
Cualquier hoja de calculo o paquete estadistico nos permite conocer cual es el porcentaje de
individuos de dicha distribuci6n que se encuentran a una cierta distancia z del centroide. La tabla de z
adjunta a este material tambien permite conocer este valor. De manera similar, es posible conocer el
porcentaje de individuos que se encuentra en un cierto intervalo, simetrico o no, en tomo al centroide.
Ejemplo. En la distribucion N(30,1 '2) que manejamos anteriormente, el 67% de los elementos se
encuentran en torno a 301,2, y el 95% de los elementos en torno a 302,4. Si queremos saber
cuimtos elementos (que porcentaje) son mayores de 32, es preciso hacer el siguiente calculo. La
distancia a[ centroide es 2. Esta distancia expresada en unidades de sigma es la que denominamos
z yes z=211,2=1,67. Buscando en la tabla zen lafila de z 1,6, columna 0,07, se obtiene un valor
0,0475, lo que quiere decir que un 4, 75% de elementos son mayores de 32. Si desearamos conocer
la proporcion de elementos que estan en el entorno 302, solo hay que descontar los que estan a
la derecha de J-L+1,6a- (4, 75%) y los que estan ala izquierda de J-L-1,6a- (4,75%), por lo que el
90,50% de elementos se encuentran en el intervalo pedido.
En general, el intervalo simetrico que contiene a un cierto porcentaje de individuos en tomo al valor
central se calcula con la ayuda de la tabla y la formula,
x=pza-
[5]
Conocido este intervalo podemos inferir que si de la poblaci6n normal extraemos al azar un elemento, la
probabilidad de que se encuentre en el intervalo anterior es la asociada a z.
SO.- Si el nivel diario de impurezas de un deposito de agua se distribuye de forma normal con una media
4, 0 giL y con una desviacion estandar 0, 3 giL:
a) ;, Que porcentaje de dias encontraremos una concentracion comprendida entre 3, 7 y 4,3 giL?
b);, Y entre 3,4 y 4,6 giL?
c);, Y que porcentaje de dias encontraremos un nivel de impurezas superior a 4,9 giL?
6.- Si un metodo para la determinacion de Cloruros en agua tiene una precision de 0, 02 giL y
analizamos un estandar certificado de 1,28 giL; ;,Cual es la probabilidad de que por causas puramente
aleatorias obtengamos un valor inferior a 1,24 giL?
V Ferreira
26
r.- La poblacion de marcianos tiene un tamano que se distribuye norma/mente con media 6 em y
desviacion estandar 1. 1, Cual es Ia probabilidad de que el primer marciano que encuentre Ia NASA tenga
un tamano comprendido entre 5 y 7 em?
3.5.- Teorema del limite central
La siguiente propiedad fundamental de las poblaciones normales es la conocida como teorema
del limite central. Esta propiedad establece que si de una poblacion dada con valor central J..l. y
desviacion cr, extraemos grupos de n elementos y determinamos su media, la nueva poblacion formada
por las medias de dichos grupos se distribuye tambien de forma normal, con un valor medio J..l. y con una
desviacion cr/...Jn. Esto es, la distribucion de las medias tiene el mismo valor central, y una dispersion que
se ha reducido en un factor ...Jn.
Por ello, en la distribucion de las medias, se cumple que:
- aproximadamente 2/3 de todas las medias de n individuos estan en el intervalo f.Jcr/...Jn
- aproximadamente el 95% de todas las medias de n individuos estan en el intervalo f..l2cr/...Jn
- aproximadamente el99,7% de todas las medias den individuos estan en el intervalo f.J3cr/...Jn
- en general, el x% de todas las medias de n individuos estan en el intervalo f.Jzcr/...Jn , donde z es
un valor que se encuentra tabulado en tablas estadisticas.
Lo que se expresa, de manera analoga a como hicimos anteriormente, mediante la formula:
8.- 1, Cuales seran las nuevas J1. y a de los niveles semanales (en Iugar de diarios) de impurezas del
deposito de agua del problema 4 (JL = 4,0 y a= 0,3 giL)?
9.- 1, Cual es el intervala de concentraciones que se espera que se encuentren los niveles de impurezas
del deposito el 95% de las semanas?
10.- Si los marcianos del ejercicio 6~ via}an siempre en grupos de cuatro, 1, cual sera Ia probabilidad de
que Ia media de tamano del primer cuarteto encontrado par Ia NASA sea inferior a 5 em?
El teorema del limite central tiene una consecuencia practica de gran importancia para la
medicion: Es posible regular la incertidumbre de un resultado controlando el nfunero de mediciones
replicadas realizadas sobre una misma muestra, o en su caso, controlando el nfunero de incrementos
muestrales extraidos de un sistema para estimar su composicion media.
~I
Observa que estamos diferenciando la precision del metoda de analisis de la incertidumbre del
resultado. Igualmente, estamos diferenciando entre la precision de un metoda de muestreo y la
incertidumbre de la muestra fmal recogida.
Un segundo efecto de gran importancia que se observa en las distribuciones de las medias de
poblaciones que no se distribuyen de una forma normal es que la distribucion de las medias es siempre
mucho mas "normal" que la distribucion de partida y tanto mas cercana a la normal cuanto mayor es el
nllinero de elementos que componen la media.
Esta aflrmacion puede ser ilustrada con algunos ejemplos. En primer lugar consideremos la
distribucion derivada dellanzamiento de un dado. Se trata de una distribucion uniforme con 6 resultados
posibles y equiprobables. Bastante lejos de una distribucion normal. Si lanzamos el dado dos veces y
sacamos la media del resultado obtenido, la distribucion deja de ser uniforme, ya que algunos resultados
son mas probables que otros como consecuencia del juego de combinatoria. Par ejemplo, el resultado 1
solo se obtiene si tanto el primer dado como el segundo sacan 1. Su probabilidad es 1/36 (ya que hay 36
resultados posibles). Par el contrario, el resultado 3,5 se obtiene con mas combinaciones de dados (1 y 6,
2 y 5, 3 y 4, 4 y 3, 5 y 2, 6 y 1). Su probabilidad es 1/6. Si lanzamos el dado 5 veces, el nllinero de
resultados posibles es 56= 15625 par lo que la probabilidad de sacar un 1 (o un 6) pasan a ser
practicamente nulas mientras que la probabilidad de ocurrencia de los hechos centrales es superior.
Tambien muchas distribuciones marcadamente asimetricas se convierten en distribuciones
simetricas muy similares ala normal. Considera el ejemplo de una distribucion tipo Poisson, como la que
se obtiene al muestrear particulas de un mineral que contiene particulas de mena y particulas de ganga,
siendo las primeras 999 veces mas frecuentes que las segundas. Si extraemos al azar 1000 particulas (que
podrian ser las que caben en la punta de espatula que empleamos para pesar y comenzar el analisis), el
nllinero de particulas de mena presentes en el analisis sigue una distribucion muy sesgada denominada
distribucion de Poisson que es la que se ve en la flgura 9-1 mostrada a continuaci6n. Como puede verse,
aunque la media de la distribucion es 1, la probabilidad de extraer 0 particulas es exactamente igual a la
de extraer 1, que representaria el 1lnico resultado correcto. Extraer dos particulas pasa aproximadamente 2
de cada 6 veces (dariamos un resultado doble del real), y extraer 3 ocurre todavia un 6,1% de las
ocasiones.
Extrocci6n de 1000 portlculos
2 replicas
0,4
0,3
0,35
11-
0,3
0,25
0,15
0,25
11
:!!
~ 0,15
1-
0,2
0,1
0,05
.::
0
1
0,2
l l
r- -
-=-
f-
0,1
0,05
10
0,5
n partfculas mena
2,5
Figura 10-2
10 replicas
20 replicas
3,5
4,5
0,1
0,09
0,08
11 0,07
:!! 0,06
0,1
0,08
-g
.: 0 ,1)5
0
G.
Figura 10-1
0,12
11
1,5
0, 14
-n n
0,()4
nil~
0,02
0
"'
,'1-
"'~
"'~
0,05
0,04
a o,oJ
,'!>
~'~-
~~
~~
Figura 10-3
~"
n1
n1 11
0,02
0,01
0
itn- llnn
'\.
1~~i111n
, nil IIII I
~" ,'?
"' "''
"'
"'~
"''""
Figura 10-4
~"
5,5
V Ferreira
28
Si este analisis lo replicarnos (esto es, para carla muestra de mineral realizarnos dos
determinaciones que comienzan cogiendo 1000 particulas carla una). La distribucion de resultados
posibles pasa a ser la mostrada en la figura 9-2, si realizarnos 10 replicas del analisis, la distribucion de
resultados (expresada como nfunero de particulas de mena carla 1000 particulas) seria la que se muestra
en la figura 9-3, y si lo replicararnos 20 veces, obtendriarnos la distribucion de resultados mostrados en 94. Las dos ultimas distribuciones de resultados son muy parecidas a la normal, a pesar de que dado el
ejemplo escogido, se trata de distribuciones discontinuas. Como quiera que sea, su consecuencia es de
gran importancia practica, ya que si realizarnos el nfunero suficiente de replicas, la distribucion de
resultados va a ser normal. Esto refuerza la importancia de esta distribucion y de su uso practico.
x = J.1 z
(j'
(j'
[7]
Par ejemplo, en el deposito de agua de los ejemplos anteriores, sabemos que de forma natural, el 99, 7%
de las semanas el nivel de impurezas estara en el intervala 4, 0 0, 34 giL (que es el intervala de
confianza de la media semanal del 99, 7%). Si una semana en particular encontramos un nivel de
impurezas de 4, 5 giL sabemos que es tan poco probable que de forma natural se encuentre un
nivel tan alto (Ia sabemos despues de estudiar dicho sistema durante mucho tiempo, obviamente),
que es practicamente seguro que ha pasado alga en el sistema; como que se han obturado los
filtros, a que el metoda de ana/isis esta fallando; par lo que el data nos indicaria que debemos
iniciar alguna acci6n al respecto.
1JD.- Sabemos que un matraz aforado de 20 mL tipo B tiene una tolerancia (que podemos asimilar ala
desviaci6n de la poblaci6n) de 0, 03 mL. Deseamos saber si el matraz se ha descalibrado par su usa.
Para ella lo aforamos con agua (densidad 1,0000 glmL) y determinamos supeso: 20,0610 g. ;,Cual es la
probabilidad de que el matraz se haya descalibrado?
3.7.- distribuci6n t
La cuestion siguiente es que en ocasiones no conocemos los parametros que defmen a la
poblacion. En realidad es justarnente al reves: si mido es para averiguarlos. Esto nos obliga a estimar la
desviacion estandar poblacional, cr, a partir de la desviacion estandar de un numero limitado de
mediciones, s (desde el punto de vista practico, podemos considerar a como una s con mas de 50 grados
de libertad). Ahora bien, al realizar esta estimacion aumenta mi incertidumbre, por lo que cuando manejo
desviaciones estandar, s, ya no puedo emplear la distribucion normal, sino una muy parecida que se
denomina funcion de distribucion t. Para comprender su origen y uso es conveniente que resolvamos
primero el siguiente ejercicio:
II bis.- ;, Que tipo de distribuci6n se obtiene si de una poblaci6n que en cierto parametro se distribuye de
forma normal (con centro J1 y desviaci6n tipica CY), extraemos n elementos, calculamos su media y
calculamos el cociente
t =--
[8]
fFn
:F:\.
',1/. ~\\
..,..
!de 1
,//1 ".\\
l!;
'\\
..~,
1~:<
..
f :'
;g
--tde2
:a
.a
Q.
- -dens idad z
'-
/
~
-~
- - - - t deS
-tde50
~--
-" ' r
V Ferreira
30
Figura 11
Las dos expresiones que defmen los resultados mas probables de una determinacion (para una
medida y para una media) se convierten en:
x = J1 t Fn
J1
= x ts
[11] y J1
= x t
Fn [12], respectivamente.
En estas formulas, t depende tanto del nivel de probabilidad empleado (al igual que z) como del
nfunero de medidas que hay amos empleado en Ia estimacion de s: (en realidad del nfunero de grados de
libertad empleado en el calculo de s =no de medidas empleadas -1 ).
12.- En Ia determinacion de Sn en un vegetal, seis determinaciones han dado los siguientes resultados
(expresados en ppm): 24,4; 24,0; 24,1; 24,3; 24,2; 24,5 ;,Cwil es el intervalo de valores en el que existe
un 95% de probabilidades de que se encuentre Ia concentracion real de Sn en el vegetal?
La media es 24,25 ppm, y Ia desviacion estandar 0,187 ppm. El numero de grados de libertad es
el numero de datos empleados en Ia determinacion de s menos 1, esto es, 5. Para un 95% de
probabilidades y 5 grados de libertad, el valor de t es 2,571 (el valor de z era aproximadamente 2). El
intervalo de confianza de Ia media es par tanto ts/ J;z = 2,571 0,1871
= 0,196 ppm. Par tanto
en el intervalo comprendido entre 24,05 y 24,45 tenemos un 95% de probabilidad de que se encuentre el
valor real de Sn.
.J6
13.-t,Cuimtas mediciones mas del vegetal anterior tendrias que r_ealizar para reducir Ia longitud de este
intervalo a Ia mitad?
14.-t,Cual es Ia diferencia existente entre JlY
que? 1, Yunidades?
15.- Nos dice el analista que el contenido de un colorante en un alimento es de 5 ppm. 1, Que mas datos
necesitamos para conocer Ia precision del data? 1, Y para Ia exactitud?
16.- En un Espectrofotometro de Absorcion Atomica estamos midiendo el contenido en Cu de un
mineral. Obtenemos los siguientes valores de Absorbancia:
0,546; 0,560; 0,576; 0,551; 0,556; 0,549;
;,Cual es el valor media, cualla precision, y cuales los intervalos de confianza al 95% y al 99%. ;,Que
quieren decir estos parametros?
17.- Un quimico necesita hacer unos ana/isis de un producta industrial que se encuentra en varias ppm.
El error tolerado es de 1,0 ppm. En una muestra patron ensayada 10 veces se obtienen los siguientes
resultados:
Lt::IIH:l 1 :
~uu UUU~\,;1UH
i:1 1a \,{UUJ.uuuu.. u ta
25,8; 26,3; 25,0; 24,9; 25,6; 25,9; 26,2; 25,3; 25,5; 25,0
a) 1, Cucintos datos tendrci que tamar cada vez para tener Ia conjianza (P=O, 05) de que el valor real se
encuentra en el intervalo requerido?; b) 1, Y si el error tolerado fuera de 0,3 ppm?; c) 1, Y si siguiera
siendo de 1,0 ppm pero se requiriera el 99,9% de probabilidad?; d) t,Despues de esto que pensarias al
descubrir que el analista para ahorrar tiempo solo tomaba uno de los datos?
18.- Se tomo Ia temperatura en puntas distintos de un bio-reactor, dando los siguientes resultados: 33, 0;
33, 7; 32,5; 33,9t,Cucil es Ia temperatura real del reactor con sus intervalos de confianza a/95 y a/99%?
19.- t,Bajo que circunstancias podemos conocer el intervalo de conjianza de un ana/isis del que solo se
ha realizado una replica?
La cuestion planteada en el ejercicio 19 es de gran importancia para la Quimica Analitica, ya que
a menudo los analisis son caros y dificiles de replicar. Suele ser comlin entre los quimicos no muy
familiarizados con la quimiometria pensar que si no se han hecho replicas de una medida, no es posible
obtener una estimacion de su incertidumbre. Seglin esta concepcion no tendria valor realizar analisis con
una linica replica. Esto es cierto, sin embargo, tan solo en el caso de que no se tenga realmente ninguna
estimacion de Ia incertidumbre, lo cual ocurre las primeras veces en que se emplea un metodo de analisis.
No hay que olvidar, sin embargo, que muy a menudo si que disponemos de una evaluacion de la
incertidumbre con base en Ia experiencia previa y que como dijimos en la introduccion, los metodos
analiticos se hacen funcionar de forma semicontinua para formar autenticos sistemas analiticos de los que
estamos siempre aprendiendo.
Cuando empleamos una distribucion t es porque asumimos que no tenemos un conocimiento
preciso de la desviacion tipica de la poblacion y manejamos una s, desviacion estandar, que es una
estimacion de a con n-1 grados de libertad. Dicha estimacion puede servir para mediciones subsiguientes
siempre que sea razonable pensar que ambos sets de datos proceden de una poblacion con identica sigma.
Esto es, si al poner en marcha un metodo de analisis en ellaboratorio se realiza un estudio de su precision
analizando de forma replicada 6 muestras, las obtenida (vamos a llamarla s 1) puede considerarse que es
una estimacion de la precision del metodo con 5 grados de libertad. Si se emplea ese metodo para analizar
una segunda muestra (con resultado x 2), y no se tienen razones para pensar que Ia precision del metodo
vaya a ser diferente en esa segunda muestra, se puede (y debe) aprovechar la estimacion anterior de la
precision para establecer los intervalos de confianza de esta segunda medicion:
De la misma manera, si a continuacion se analiza una muestra 3 y en esta ocasion se realizan dos
replicas (de media
y desviacion s3), podria pensarse que la expresion del intervalo de confianza para
x3
Donde t se mide con un grado de libertad, lo que haria que el intervalo de confianza fuera muy
ancho. Sin embargo esta aproximacion no es correcta, ya que obvia el conocimiento previo de sigma que
tenemos. Si s3 y s 1 son ambas estimaciones de la misma a, no hay razon para emplear la que es una
estimacion mas debil (basada en menos grados de libertad). Seria mas correcto escribir entonces:
(Observa que el nfunero de grados de libertad de t siempre se corresponde con el de s, y raiz de n se corresponde con el nfunero
de mediciones empleadas para obtener Ia media).
V Ferreira
32
l,Que entendemos por cifras significativas? Las cifras de un resultado que conocemos con certeza
suficiente. Si obtenemos un resultado 16,5412 ppb y nuestra incertidumbre es 1,3, debemos expresar el
resultado como 16,5 i.,Por que? Porque aceptamos que nuestro intervalo de confianza tiene una extension
de 1,3 unidades y su centro lo situamos en 16,5. Si lo situamos en 16, nos distanciamos
innecesariamente media unidad del centro mas probable. Si lo situamos en 16,54 lo estamos situando con
una precision muy superior a la que en realidad somos capaces, lo cuallleva a engafio. Siguiendo con el
mismo razonamiento, si nuestra incertidumbre es 0,13, el resultado debe expresarse como 16,54. Si
nuestra incertidumbre es 0,013, lo escribiremos como 16,541.
Observa que el nl1mero de cifras significativas no coincide con el nl1mero de cifras decirnales.
Por ejemplo, el resultado anterior expresado en ppm es 0,0165, 0,01654 o 0,016542, segnn sea la
precision. Esta es Ia utilidad de Ia notacion denominada cientifica, en la que las cifras significativas se
incluyen como prefijo y se afiade un exponente para indicar Ia posicion de la coma. En los tres casos
anteriores, el resultado en notacion cientifica seria 1,6 10'2 ; 1,65 102 y 1,654 102 ppm, respectivamente o
1,6 101; 1,65 101 y 1,654 101
tema
1:
mtroauccwn a Ja l.,lUimwmema
JJ
El mantener la coherencia de las cifras significativas nos obligani a prescindir de algunas cifras
obtenidas en nuestras mediciones y en ocasiones a redondear. Ambas cosas deben realizarse
exclusivamente al presentar los resultados. Nunca debe prescindirse durante los ca.lculos previos de cifras
cuya falta pudiera afectar al resultado. En la pnictica esto quiere decir que para los calculos debemos
preservar tantas cifras como las significativas mas dos.
21.-1, Tiene sentido sis
En cuanto a las desviaciones estandar y las incertidumbres, no tiene sentido expresarlas con mas
de dos cifras significativas. La razon es clara: una desviacion estandar es una medida de la incertidumbre
de una medicion, es por naturaleza un algo. Por ejemplo 13,21,1 tiene sentido y nos indica que la cifra
3 oscila una unidad y algo mas, pero 13 ,2 1,12 no tiene sentido, ya que no tenemos en realidad ninguna
posibilidad efectiva real de conocer la segunda cifra decimal (cuarta significativa) del resultado.
AI expresar la desviaci6n estandar o la incertidumbre en forma relativa, la cuestion se simplifica.
Si nuestra imprecision es superior al 10%, solo podremos dar dos cifras significativas. Si esta entre 1 y
10%, podremos dar 3, y si esta entre 0,1 y 1%, podremos dar 4.
cr2 = cr2I
V Ferreira
34
.--------------------------------2
2
2
2
=~0,001
0 0001
02
0 04
0 028
2 +0,002 2 +0,004 2 +0,0014 2 =0,48%
Inc.Global= (
] +( ] +( ] +(
]
0,1
100
10
20
Este resultado nos indica que la incertidumbre de la operaci6n global (expresado como RSD(%)) es el
0,48% y que pnicticamente toda la incertidumbre se ha introducido en la etapa de pipeteo.
23.- Calcula el efecto que sabre la precision global tendria en el caso anterior: a) sustituir Ia pipeta de
tipo B (tolerancia 0,04) por una tipo A (tolerancia 0,02), b) sustituir el matraz aforado tipo B
(tolerancia 0,2) por uno tipo A (tolerancia 0, 1).
Este mismo razonamiento puede aplicarse para el calculo de la incertidumbre de una operaci6n de
medida compuesta de una toma de muestra y de una determinacion analitica.
Ejemplo. En una determinacion volumetrica la pesada de muestra se realiza con un error sistematico del
-1% (por una mala calibraci6n de la balanza) y el aforo a volumen con un error del+ 1% (por
una mala calibraci6n del matraz aforado). Determina cual es el error del resultado si el resto
de la valoraci6n (pipeteo, titulaci6n y calculo de los equivalentes) ya no va afectada de mas
errores.
Un error sistematico del -1% en la pesada, quiere decir que la masa medida es un 1% inferior
a la real. Un error sistematico del + 1% en el aforo a volumen, quiere decir que el volumen
contenido en el matraz de aforo es un 1% superior al nominal. Veamos como afectan estos
errores al numero de equivalentes de ana/ito presentes en la alicuota de muestra analizada:
Si tomamos una masa real de 100 mg, Ia lectura de Ia balanza sera de 99 mg; Esta masa se
disuelve ahara en un matraz de 100 mL nominales, que contiene en realidad 101 mL. A
continuaci6n se taman por ejemplo 10 mL de este volumen y se valoran con agente valorante,
dandonos un resultado de X mequivalentes. Nuestro resultado sera que Ia cantidad total de
equivalentes seran 1OXpresentes en 99 mg de muestra.
Sin embargo, el numero de equivalentes presentes rea/mente seran 10, IX en 100 mg de
muestra. El error final cometido es:
q1
c 01
0 /J1"l
) '"
Esto es, el Error relativo final es aproximadamente Ia suma de los errores relativos.
Si el matraz de aforo tuviera un error del -1%, el resultado seria sin embargo un error por
exceso del 2, 03%. Calculalo como ejercicio.
E-
\0 1"\l
'y )(,_
'
tema
1: lnlTUUUl:l:IUH
a Ja \,lUlliiiUIIlt;U 1<1
.J.J
dy=~dxl
Ahora bien, como las varianzas estan relacionadas con el cuadrado de las variaciones:
una variacion diferencial en cada uno de los factores, introduce una variacion en el resultado dada por:
dy =
ldx ~ + dx
1
tlxl
~ + ..... + dxm bY I, lo que conlleva que la varianza del resultado se relaciona con la
tlx2
&m
siempre que los factores m sean independientes (solo en este caso podemos despreciar los productos
cruzados que aparecerian al elevar al cuadrado la expresion diferencial.
La aplicacion de la expresion anterior a distintas relaciones matematicas entre y y x nos lleva a
las expresiones que se muestran en la tabla mostrada en la pagina siguiente.
26.- En los metodos opticas, lo que se mide rea/mente es el porcentaje de luz absorb ida par Ia muestra
(I'= Trcmsmitancia), pero el parametro que manejamos par ser lineal con Ia concentracion es Ia
Absorbancia, que se define como A =-logT. Calcula el intervala en el que Ia desviacion estandar relativa
es minima. 1, Que implicaciones tiene esto?
27.- Se hade determinar una constante de reparto de un equilibria de extraccion de un ana/ito entre dos
fases. Para ella medimos las concentraciones en el equilibria de ana/ito en ambas fases. Para Ia
determinacion del ana/ito en fase organica se emplea un metoda de RSD conocida del 10%. Para Ia
V Ferreira
36
determinacion enfase acuosa se emplea un metoda de RSD del 5%. ;,Cual es Ia imprecision (en RSD) de
Ia K determinada?
27bis.- Aplica Ia expresion para deducir que Ia varianza de una poblacion de medias de n elementos
(que se distribuyen norma/mente con sigma Ci) es igual a Ia varianza de Ia poblacion original reducida
en n.
TIPODE
RELACION
y = X1 + X2
y = X1- X2
y= X1 X2
y = X1/X2
y=log x
FORMA DE LA
INCERTIDUMBRE
jf
V Ferreira
38
prueba bilateral
prueba unilateral
Figura 11
Con esta regia de decision nos podemos encontrar con las siguientes situaciones:
Decidimos
H 0 verdadera
AceptarHo
decision correcta
H 1 verdadera
Error de tipo IT
P(error tipo II)=
Rechazar Hoy
Error de tipo I
aceptar H 1
P(error tipo I) = a.
decision correcta
:J:7
plantea la hipotesis altemativa, H~, que es que esos dos valores pertenecen a distribuciones distintas, el
segundo a una distribucion de centro conocido e igual a 20,0000, y el primero a una distribucion con
centro diferente.
En tercer Iugar se debe elegir el test estadistico y el nivel de significacion. Puesto que conocemos
la distribucion de la poblacion (J..L=20,0000; a=0,03 mL), escogeremos un test z.
En cuanto al nivel de significacion, comunmente se toma el nivel del 95%. Esto quiere decir que
si la probabilidad de que el valor medido pertenezca a la distribucion de referenda es inferior al 5%
(a=0,05), rechazaremos la hipotesis nula. Dicho de otra forma, vamos a considerar tan solo el 95% de los
individuos centrales de la poblacion, y vamos a despreciar como "poco normales o poco probables" el 5%
de los individuos situados en los extremos, segun se mostro en esquema en la figura 11.
El cuarto paso es determinar las regiones de aceptacion y rechazo de la hipotesis nula. En nuestro
caso, y puesto que hemos decidido realizar un test z, lo que tenemos que determinar es que valores de z
son los que delirnitan el 95% de elementos centrales de la poblacion de los dos sectores (colas) que
consideramos marginales. En nuestro caso z=1,96.
El quinto paso es el calculo del estadistico de contraste, esto es, el valor experimental de z. En el
caso que nos ocupa, lo que tenemos que calcular es cual es la distancia normalizada en terminos del error
mediante la formula [3].
Z =X;- J1
(J
= 0,0610 = 2 03
0,03
'
Esto es, nuestro valor se encuentra separado 2,03 a del valor central y queda por tanto fuera de la
zona de aceptacion, que quedaba confinada para valores de z inferiores a 1,96. En la tabla de la
distribucion z se aprecia que tan solo un 2x0,0212=4,24% de puntas de la poblacion estan separados
tanto (o mas) del valor central. Dicho de otra forma, la probabilidad de que de una poblacion con centro
20,0000 y a 0,03 extraigamos un valor 20,0610 es inferior al 5%. Par tanto rechazamos la hipotesis nula
y concluirnos que el matraz esta descalibrado. La probabilidad de equivocamos al decir esto es inferior al
5% (lo que se denomina error a o error de tipo I que es el error de rechazar una hipotesis nula cierta).
V Ferreira
40
probable que aceptemos una hipotesis nula falsa (error tipo II o error j3), pero sera mucho mas facil que
rechacemos una hipotesis nula cierta (error tipo I o error a).
Para responder a ambas cuestiones necesitamos conocer los intervalos de confianza de los
resultados obtenidos, por lo que sera preciso realizar determinaciones repetidas (de muestras distintas en
el primer caso, de Ia misma muestra en el segundo) para estimar las variabilidades aleatorias (de muestreo
en el primer caso, de analisis en el segundo). Partiendo por tanto de un set de n resultados de media X: y
de desviacion estandar s,
El intervalo de confianza viene dado por:
x=pt.J;z
y podemos considerar que el valor conocido difiere del valor medido si Ia longitud del intervalo ts/..Jn es
inferior a Ia diferencia entre ambos valores. Esto es, si no hay posibilidad de que ambos valores esten en
el mismo intervalo. En notacion matematica:
Despejando t se tiene:
s
La t que aparece a la derecha de la desigualdad es la que se encuentra en las tablas al nivel de
probabilidad escogido y con los grados de libertad con que se conoce s. Por tanto, lo fulico que hay que
hacer es verificar si la desigualdad se cumple (se rechaza Ia hipotesis nula y queda probado que hay
diferencias significativas) o no (nose rechaza la hipotesis nula).
En la practica, al termino izquierdo de la desigualdad se le denomina t experimental, y a Ia t de Ia
derecha (la tabulada) t critico.
[21]
rema
1:
muoouccwn a 1a 1..,/UHUJumt:mii
~ tc ,
Te hago notar que lo que has demostrado es que la probabilidad de que las diferencias observadas
sean debidas a causas aleatorias y no a diferencias reales, es inferior a la considerada como nivel de
confianza adecuado (habitualmente el 5%). Otra observacion importante, es que t, como ya comentamos
en su momento, no es nada mas que una medida de la diferencia entre dos parametros (en este caso una
media y un valor conocido) normalizada por el error o imprecision (en este caso s/raiz(n)).
Para aclarar la mecanica resolvamos el ejemplo 21:
En el ami/isis de Ia muestra de referencia, el analista obtuvo un resultado media de 26, 07 ppm, con una
desviaci6n estimdar de 0,46. El valor certificado (conocido) es 25,3 ppm. El ctilculo de t experimental
aplicando /a formula anterior, da un resultado de:
t =
e
El valor de t que aparece en las tab/as para el 95% de confianza y 6 grados de libertad es 2,45,
inferior al calculado experimentalmente. Esto quiere decir que la probabilidad de que las diferencias
entre el valor conocido y el determinado sean debidas a errores aleatorios son inferiores a/ 5%. Por
tanto existe una gran probabilidad (> 95%) de que sean debidos a errores sistemtiticos.
s=
(nt-1) sy+(n2-l) s~
n1+n2-2
[22]
te =
CXt-xv
sv i& +"
[23]
V Ferreira
42
29.- Para la determinacion del grado alcoh6lico se utiliza un metoda basado en la rejlexi6n de
ultrasonidos. Este metoda no es oficial y debe ser calibrado peri6dicamente utilizando el metoda de
picnometria. Para la calibraci6n se analiza un vino 6 veces par ambas tecnicas. Los resultados fueron:
Metoda instrumental: 12,21; 12,23; 12,19; 12,26; 12,20; 12,29
Picn6metro: 12,31; 12,27; 12,23; 12,29; 12,32; 12,34
;_Debe volver a calibrarse el instrumento? Nota: Se conoce que las precisiones de ambos metodos son
practicamente iguales.
29bis.- Deduce la expresi6n para el test t anterior basandote en la forma en la que se propagan los
errores.
b) Las varianzas no son similares (Nota: La similaridad en este caso se debe evaluar mediante un test
estadistico que veremos posteriormente)
En este caso no es valido realizar una estimaci6n conjunta de la varianza, y la t experimental debe
calcularse de forma directa (aunque solo aproximada) a traves de la ecuaci6n:
(st + nzs~) _2
.1.=
g
{st)
(s~)2
nt +
2
nt
ll2
nt +1
nz+ 1
[25]
30.- La tabla siguiente expresa la concentraci6n de albumina en giL en el suero sanguineo de 8 hombres
y 8 mujeres adultos sanos. ;_Difieren ambas medias?
Hombres
37
39
37
42
39
45
39
42
Mujeres
44
40
39
45
47
47
43
41
31.- La siguiente tabla proporciona la concentraci6n de tiol (mM) en sangre de dos grupos de
voluntarios, el primer grupo es normal y el segundo sufre artritis reumatoide. ;_Difieren
significativamente ambos grupos en su contenido de tiol?
Normal
1.84
1.92
1.94
1.92
1.85
1.91
Reumatico
2.81
4.06
3.62
3.27
3.27
3.76
2.07
del metoda clasico habitualmente utilizado. Puesto que las muestras analiticas pueden ser tremendamente
diferentes, (maiz, cocos, peras, remolacha, algarrobas ... ), nos interesa que el contraste se realice no sobre
el analisis repetido de un tipo de muestra (por ejemplo maiz), sino que abarque un amplio rango de
muestras. Cogemos entonces muestras de todos estos materiales y cada una de elias se analiza una vez
con cada uno de los metodos.
La estrategia a seguir consiste en hacer el test t sobre las diferencias entre los resultados
proporcionados por los metodos para cada muestra. Si los metodos conducen a respuestas
estadisticamente comparables, la media de las diferencias no debe diferir significativamente de cero.
Entonces ~ es cero y aplicamos la comparacion de una media con un valor conocido.
Metoda de derivadas
Metoda oficial
2.964
2.913
3.030
3.000
2.994
3.024
32bis.- Si el factor peso se distribuye de forma normal en una cadena de producci6n de tornillos, con
una media 0.1500 g y con desviaci6n estimdar 0.0070 g, determina cual sera el rango de tamanos que
consideraremos normales para establecer una prueba de una cola (a=0.05). Tras realizar una
reparaci6n en Ia cadena de producci6n, se sospecha que se producen tornillos mayores. Un tornillo
tornado al azar peso 0.1616 g 1,Conjirma esta medici6n dicha sospecha?
Es conveniente comprender bien estos conceptos para no cometer errores al emplear las tablas.
Muchas de las tablas mas habitualmente empleadas proporcionan los valores de t correspondientes
directamente a la suma de las dos colas. Esto es, cuando tomamos la t del 95%, es la que corresponde a
dos areas de cola del 2,5% por cada uno de los !ados de la distribucion. Debemos escoger la
correspondiente a una P doble. Si solo nos interesa una cola, el valor tabulado que hemos de tomar es el
del 90% (dos colas del 5% de area). El tomar una cola o dos colas depende de la pregunta que nos
hacemos antes del experimento. Si la pregunta es (,SOn diferentes ... ?, entonces dos colas; si la pregunta es
(,es este valor mayor (o menor) que este otro ... ), entonces una cola.
33.- Algunos alcoholes alilicos pueden determinarse par formaci6n de un derivado coloreado con Ia
vainillina. Se desea estudiar si el aumento de Ia temperatura de reacci6n ejerce una mejora sabre el
44
V Ferreira
rendimiento de esta. Para ella, una misma muestrafue procesada a temperatura ambiente y a 60C y se
midi6 Ia Absorbancia del complejo formado a 608 nm. Los datos obtenidos se muestran a continuaci6n:
25C
0,209
0,212
0,223
0,215
0,217
60C
0,232
0,219
0,224
0,220
0,21 7
1, Cual seria el resultado si nuestro interes hubiera sido determinar si Ia temperatura altera (en cualquier
sentido) el rendimiento de la reacci6n?
F=~
s22
[27]
donde las varianzas se colocan de forma que el valor de F sea siempre mayor que 1.
Recuerda que las desviaciones estandar no son mas que estimaciones realizadas con pocas
muestras, del parametro de dispersi6n de la poblaci6n, cr. Si no existiera incertidumbre en la estimaci6n
de a a partir de s, y los metodos tuvieran Ia misma precision (la misma cr), el cociente F seria
exactamente 1. Si encontraramos, en este caso hipotetico, un cociente distinto de 1 (> 1 por convenio)
seria sin Iugar a dudas, sefial inequivoca de que las precisiones son distintas. Pero desafortunadamente,
existe una incertidumbre en Ia estimaci6n de cr a partir de s. Como consecuencia de lo cual aunque el
cociente no sea 1 no podemos decir que sean significativamente distintas. Ahara bien, no es lo mismo que
dicho cociente F sea mucho mayor que 1 que solo un "poco" mayor que 1. Si el cociente fuera mucho
mayor, seria casi seguro que si que son distintas las precisiones. Como siempre, es posible determinar
cuanto mayor que 1 tiene que ser el cociente anterior para decidir si son distintas asumiendo una cierta
probabilidad de equivocarse. Este valor estadistico de F esta tabulado, y se trabaja con el de forma
parecida a como lo haciamos con Ia distribucion t. Por supuesto dicho valor sera tanto mayor cuanto
peores sean nuestras estimaciones ( cuantos menos grados de libertad), y cuanto mayor nivel de confianza
se requiera. El cociente F es tambien una distribuci6n de probabilidades derivada de la normal. Como las
distribuciones z y t, se encuentra en tablas estadisticas (una de elias en el anexo a estos apuntes), de forma
"tJ
que se puede conocer el valor F critico para un experimento deterrninado. El F critico es el valor del
cociente por encima del cual solo existe una probabilidad dada pequefia de aparici6n de dicho valor por
causas aleatorias.
Habitualmente se trabaja con un nivel de confianza del 95%(p<0,05), y de nuevo se aplica el
concepto de 1 o 2 colas. La estrategia a seguir en estos problemas es:
a) Deterrninar las medias y las desviaciones estandar.
b) Calcular el cociente F (recordar que F siempre > 1)
c) Buscar en la tabla el valor de F que se corresponde con los grados de libertad empleados en las
estimaciones de s1 (numerador) y s2 (denominador).
d) Si dicho valor F de Ia tabla es mayor que el F calculado, las diferencias observadas entre las
dos varianzas pueden ser aleatorias (no se rechaza la hip6tesis nula), si es menor, las diferencias son con
un 95% de probabilidad (o con el nivel de confianza empleado), debidas a causas reales no aleatorias
(rechazamos la hip6tesis nula).
34.- Se propane un nuevo metoda para Ia determinacion de Pb. Se obtuvieron los siguientes resultados
para una muestra de aguas residuales que fue analizada 6 veces par cada uno de los metodos
considerados, el estcmdar y el propuesto:
Media (ppb) s (ppb)
518
9,3
Metodo estcmdar
521
4,2
Metodo Propuesto
t,Es Ia precision del metodo propuesto significativamente mejor que Ia del metodo estandar?
35.- Prueba con los datos del problema 33 si Ia temperatura causa variaciones significativas en Ia
precision del metodo.
Q = (Valor sospechoso-Valor mas cercano)/ (Valor mas grande- Valor mas pequefio)
[28]
De nuevo los valores Q estan tabulados para una P = 0.05, y si se supera el valor tabulado
(critico) podemos rechazar el valor an6malo con una probabilidad del 95% de no cometer un error.
36.- La siguiente lista de valores se obtuvo a/ medir el contenido de Zn de unas muestras determinadas.
59,2; 60,3; 59,8; 58,6; 56,3;
Pruebe si el valor anomalo 56,3 puede ser descartado.
V Ferreira
46
1, Y sial repetir las medidas encuentra los siguientes datos? 59,8; 60,5; 58,9; 59,5?
Otros ejercicios.
37.- En una cata de productos alimenticios 9 catadores estan valorando de 0 (estimulo nulo) a 5
(estimulo maximo) la caracteristica ''frutal" de un alimento y comparandola con la del mismo alimento
al que se le ha aplicado un cierto tratamiento que deberia revertir en una mayor caracteristicafrutal.
Catador
Producto base
I.5
0.5
2.5
0.5
2.5
0.5
Producto tratado
2.5
2.5
2.5
I.5
2.5
777
790
759
790
770
758
764
Pepino
782
773
778
765
789
797
782
'+I
directamente algful test estadistico, y que los resultados deban ser transformados (por ejemplo trabajar
con sus logaritrnos). En otras ocasiones, el averiguar que una serie de datos no esta normalmente
distribuida constituye una evidencia de que debe haber algun factor no aleatorio incidiendo sobre el
sistema, por lo que este tipo de test nos permitiria confrrmar la incidencia de esos factores.
Una primera posibilidad es, por supuesto, una inspeccion de la curva (tabla) de frecuencias de los
datos, que nos revelara si los datos se distribuyen de una forma uniforme en tomo a una media, o si por el
contrario, la distribucion muestra conjuntos de datos separados entre si. Esta apreciacion visual puede
materializarse en dos parametros cuantitativos utiles para evaluar si la distribucion es significativamente
diferente de la normal. Estos parametros son dos caracteristicas de toda distribucion poblacional (al igual
que la media y la desviacion estandar), pero estan relacionados con la "forma" de la distribucion.
El primero de estos parametros se denomina coeficiente de asimetria, ah y mide la simetria de la
poblacion. Para cualquier atributo de una poblacion que se distribuya de forma simetrica, el coeficiente
de asimetria es 0, y su intervalo de confianza es t raiz(6/n). En la distribucion gaussiana este parametro
es obviamente 0. En las distribuciones con "cola" hacia la derecha, este parametro es mayor que 0, y si la
"cola" es hacia la izquierda, menor que cero. Matematicamente esta relacionado con la tercera derivada
de la funcion de distribucion.
El segundo parametro esta relacionado con la cuarta derivada de la funcion de distribucion y se
denomina curtosis muestral. La curtosis mide la "altura" o "grado de achaparramiento" de una
distribucion. Poblaciones de datos con la misma media, desviacion estandar y coeficiente de asimetria se
pueden diferenciar en su curtosis. Una funcion de distribucion normal tiene una curtosis 3, las funciones
mas bajas, como la distribucion uniforme, tienen curtosis inferiores a 3, y las funciones de distribucion
mas "altas" (que concentran mas puntas en tomo a la media para una misma S) tienen curtosis superiores
a 3. En la practica, los programas estadisticos suelen trabajar con el coeficiente de curtosis muestral,
a 2 =curtosis-3, de manera que la gaussiana tenga su a 2=0. El intervalo de confianza de este parametro es
t raiz(24/n)
Hay otras estrategias estadisticas de gran importancia para verificar si los datos de una poblacion
se distribuyen de acuerdo con una cierta distribuci6n de referencia (no solo con la normal). Estos tests
tienen una gran importancia en la formulaci6n y contraste de hipotesis y estan basados en el estudio de
las frecuencias acurnuladas. El objetivo basico es comparar las frecuencias acurnuladas observadas con
las esperadas en la distribucion de referencia, por ejemplo una distribucion normal. Los dos tests que
presentaremos son el de la chi cuadrado (X2) y el test de Kolmogorov-Smimov. El primero esta basado en
la distribucion chi-cuadrado que es una distribuci6n muy importante derivada de la normal y que se
emplea fundamentalmente en aquellas investigaciones en las que se mide la frecuencia con la que ocurre
un cierto hecho (por ejemplo en investigaciones medicas). Desafortunadamente solo puede emplearse
cuando el ntimero de datos en el set es relativamente grande (habitualmente n>50). El test de
Kolmogorov-Smirnov es un test no parametrico (que no presupone que los datos se deban distribuir
normalmente) que puede emplearse en cualquier caso y que esta bas ado en el calculo de probabilidades.
Para aplicar el test de la chi cuadrado, segmentamos el set de datos en j intervalos consecutivos y
calculamos el ntimero de observaciones dentro de cada intervalo (frecuencia Yi) A continuaci6n,
calculamos el ntimero de observaciones esperadas por intervalo, t;. Este ntimero de observaciones
esperadas por intervalo sera el correspondiente al que daria una distribucion normal (si es esta la
distribucion que queremos comprobar) y lo podemos obtener a partir de la tabla de Ia distribucion z.
Posteriormente, calculamos el parametro x2 mediante la expresi6n:
x2 = _:_J_ _ _ __
J;
[29]
Y comparamos este valor de chi cuadrado con la correspondiente distribucion con j-1 grados de
libertad. Una tabla chi cuadrado se encuentra en el anexo. El ejemplo siguiente muestra Ia forma de
operar.
V Ferreira
48
42.- En el ami/isis de 50 vinos se han obtenido los siguientes valores de grado alcoholico. Se quiere
saber si podemos considerar que el grado alcoholico de un vino se distribuye de forma normal.
Muestra
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
Grado
12,0
11,0
11,3
11,5
12,1
10,8
13,1
13,2
12,0
12,5
14,0
11,3
11,2
10,8
12,6
12,7
13,5
Muestra
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
Grado
13,2
14,0
12,4
12,1
11,9
14,2
12,9
12,0
12,1
12,5
11,2
12,4
12,7
13,8
13,2
12,3
12,3
grado
12,6
13,0
14,1
11,2
11,5
11,7
11,5
13,4
13,0
12,6
12,8
12,9
14,2
12,3
12,7
12,4
Muestra
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
Lo primero que debemos hacer es ordenar los datos, y determinar el maximo, el minima, la
media y la desviacion estandar. El minima es 10,8, el maximo14,2, la media es 12,5 y la desviacion 0,9.
Ahara debemos determinar el numero de intervalos y su extension en que vamos a dividir a la poblacion.
Cuando el numero de elementos es muy grande (n> 400) se suelen hacer 20 grupos. Cuando es mas
pequeno se calcula Ia extension de los intervalos dividiendo el rango par Ia raiz del numero de datos. En
nuestro caso (14,2-1 0,8/raiz(50)=0,48::::{),5, y dividiremos Ia poblacion en los siguientes intervalas:
Intervala
10,5 a 11,0
11,0 a 11,5
11,5 a 12,0
Free
2
6
5
Intervala
12,0 a 12,5
12,5 a 13,0
13,0 a 13,5
Free
12
11
7
Intervalo
13,5 a 14,0
14,0a 14,5
14,5 a 15,0
.free
2
5
0
Lo siguiente es contrastar esta distribucion con Ia normal, para lo que debemos conocer cual
seria Ia frecuencia esperada en cada uno de los intervalas en una distribucion normal cuyo centro fuera
12,5 y su desviacion 0,9. Esto esfacil de hacer, ya que lo unico que debemos hacer es convertir los datos
de cada intervalo en coordenadas z. Por ejemplo, el intervalo 10,5 a 11,0, se corresponde con el
intervala - 2,20 a -1,67 en coordenadas z. La probabilidad de este intervalo es 4, 75-1,39=3,36%. Como
tenemos 50 elementos, lafrecuencia esperada sera 1, 7. En Ia tabla siguiente se muestran estos calculos:
Izda int
10,5
11,0
11,5
12,0
12,5
13,0
13,5
14,0
14,5
Dcha int
11,0
11,5
12,0
12,5
13,0
13,5
14,0
14,5
15,0
Prob izq
0,013
0,048
0,133
0,289
0,500
0,711
0,867
0,952
0,987
Prob. dcha
0,048
0,133
0,289
0,500
0,711
0,867
0,952
0,987
0,997
free. Esp.
1,7
4,3
7,8
10,5
10,5
7,8
4,3
1,7
0,5
x2=
9,94
Como el valor critico de ;( para 7 grados de libertad es 14, 1, no puede decirse que la
distribuci6n no sea normal. Todos estos calculos se pueden realizar facilmente en una hoja de calculo o
directamente en un programa estadistico.
43.- Un jefe de producci6n de una empresa quimica desea comprobar si la riqueza de una materia prima
que le suministra un tercero se distribuye de forma normal con una media 72,5 y una desviaci6n 2,5.
Para ella ha recopilado los am:ilisis de los lotes de materia prima recibidos durante los dos ultimos anos.
Los resultados, ya ordenados par frecuencias son los siguientes:
Riqueza
Menos de 70%
Entre 70y 71%
Entre 71 y 72%
Entre 72 y 73%
Entre 73 y 74%
Entre 74 y 75%
Entre 75 y 76%
Mas de 76%
Total
No de casas
8
12
14
16
19
14
9
1
93
La distribuci6n chi tambien la podemos emplear para ver si nuestros datos se ajustan a cualquier
otra distribuci6n. Esto es muy util para determinar si sobre conjuntos de datos agrupados por frecuencias
hay factores que inciden de forma significativa.
44.- Se ha realizado un seguimiento del numero de averias observadas en un ana en cada 100
cromat6grafos de distintas marcas. Los resultados han sido 24, 17, 11 y 9 para las marcas A, B, C y D.
;,Puede asumirse que unas marcas son mas robustas que otras, o dichas frecuencias corresponden al
azar?
Si las averias ocurrieran par azar, esperariamos que fueran iguales para cada fabric ante y podriamos
suponer que el numero de averias observada al ana sigue una distribuci6n normal con Ia misma media
en todos los casas y una cierta desviaci61}. Una estimaci6n de dicha media es el promedio de averias par
fabricante: (24+ 17+ 11 +9)/4=61/4= 15,25
Como en este caso nuestra hip6tesis nula es que el numero de roturas par fabricante y ana es el mismo
para todos los fabric antes, la frecuencia esperada es 15,25.
Ahara se construye la tabla chi como anteriormente
Fabricante
A
B
Como el valor critico de~ para 3 grados de libertad es 7,81, queda demostrado que las averias no han
ocurrido puramente par azar, y par tanto hay que concluir que las averias dependen del fabricante.
45.- Una industria tiene 5 tanques de reacci6n para la preparaci6n de un mismo producto, y se desea
saber si los tanques funcionan de forma similar. Para ella se ha medido el numero de veces que ha sido
necesario interrumpir la operaci6n de cada tanque a lo largo de 2 anos de trabajo (10 veces el tanque 1,
15 el 2, 8 el 3, 19 el 4 y 22 el 5). Determina si hay evidencias de que unos tanques funcionan pear que
otros.
Por ultimo veremos la prueba de Kolmogorov-Smirnov. Se trata de una prueba sencilla en la que
lo que se comparan son las curvas de frecuencia acumulada entre la distribuci6n esperada (que puede ser
la normal, o puede ser otra distinta) y la distribuci6n esperada. Ellistado de datos se ordena de menor a
mayor y se calcula para cada data su frecuencia relativa acumulada (frecuencia observada). A
continuaci6n, se calcula la distancia z de cada data y la frecuencia relativa acumulada correspondiente a
dicho z (frecuencia esperada). Finalmente se computa la diferencia entre los valores de frecuencia
observada y esperada. La diferencia maxima se compara con el valor critico que se muestra en las tablas.
V Ferreira
50
Veamos su aplicaci6n con un ejemplo.
45bis.- En una industria de sintesis un cierto producto se fabrica por lotes. Se ha medido Ia
riqueza de los ultimos 10 lotes y se de sea saber si Ia variable riqueza sigue una distribuci6n normal. Los
datos han sido:
10,5
14,9
9,8
9,6
9,3
10,2
8,8
9,1
15,3
13,8
(media= 11,13 desviaci6n=2,51)
La hip6tesis nula es que Ia distribuci6n es normal con media 11,13 y cr=2,51. Los datos se ordenan y se
presentan como en Ia tabla mostrada a continuaci6n
Datos
ordenados
Frecuencia
acumulada
observada
8,8
9,1
9,3
9,6
9,8
10,2
10,5
13,8
14,9
15,3
10,0%
20,0%
30,0%
40,0%
50,0%
60,0%
70,0%
80,0%
90,0%
100,0%
Frecuencia
acumulada
esperada
diferencias
-0,93
-0,81
-0,73
-0,61
-0,53
-0,37
-0,25
1,06
1,50
1,66
17,7%
21,0%
23,4%
27,2%
29,9%
35,6%
40,1%
85,6%
93,3%
95,1%
7,73%
0,99%
-6,64%
-12,8%
-20,1%
-24,4%
-29,9%
5,56%
3,29%
-4,88%
Diferencia maxima=29 ,9
Diferencia critica=24,1 (a.=0,05)
Por tanto, se rechaza Ia hip6tesis nula
46.- Estudia los valores de absorbancia del ejemplo 4 (pagina 21), y aplicando Ia prueba de
Kolmogorov-Smirnov, determina si se distribuyen de forma normal.
A'
n~
I
0,11 dmax
'f.?.'
/'---.....
An'~
~n'..,
Distribuci6n de referencia
L/
n~
1 ~z
-........
-........
.......
Distribuci6n experimental
-2
-1 ,5
-1
-0,5
0,5
1,5
coordenada z
47.- Aplica el test de Kolmogorov-Smirnov para verificar silos 20 primeros datos de contenido en grado
alcoh6lico del ejercicio 42 se distribuyen de forma normal.
En primer lugar porque la forma de pensar ANOVA esta ligada ala forma en la
que han de conducirse las experimentaciones, cualquier experimentacion, lo cual
es de necesario conocimiento para cualquier quimico o cientifico experimental. La
contribucion mas importante del ANOVA y del analisis factorial es que cualquier
diseiio experimental debe permitir una adecuada evaluacion del error experimental
o aleatoric.
54
V. Ferreira
normalidad, dicha dispersion se podria medir a traves de la desviacion estandar de todos los
elementos del grupo. Podemos imaginar esa dispersion como el resultado aditivo de la
presencia de las distintas fuentes de variacion que acruan sabre dicho grupo de datos.
Tomemos como ejemplo el conjunto de pares de datos obtenido del seguimiento de un
reactor industrial durante varios dias y en varios puntas del reactor (los datos indican
rendimiento en%):
punta A
punta B
punta C
dia 1
replica 1
26
30
27
dia 1
replica 2
27
29
27
dia 2
replica 1
32
35
29
dia 2
replica 2
32
36
30
dia 3
replica 1
28
33
28
dia 3
replica 2
27
32
28
3.- Descomposicion de las distintas fuentes de variacion del ejemplo del reactor
Las 3 fuentes de variacion que actUan sobre el reactor pueden ordenarse segtin su
facilidad para ser aisladas. La variacion analitica (precision) es la que mas facilmente se
puede aislar, ya que basta realizar una serie de medidas repetidas de una rnisma muestra para
deterrninarla. La segunda de ellas es la causada por la heterogeneidad del reactor. No es
posible conocerla si antes no hemos deterrninado la analitica, ya que para medir la
heterogeneidad hemos de tomar muestras de distintas partes del reactor y analizarlas, por lo
que los datos en los que nos basamos llevan incluida la incertidumbre derivada de la
imprecision analitica. Finalmente, la variabilidad temporal del reactor es lamas compleja en
el sentido de que para poder deterrninarla hemos de conocer previamente las otras dos, ya que
inevitablemente para comparar la composicion del reactor en dias distintos hemos de tener en
cuenta la heterogeneidad muestral y la imprecision analitica.
Este hecho es el que motiva el diseiio experimental aplicado en este caso. Se hacen
replicas analiticas de cada una de las muestras extraidas del reactor para poder deterrninar
previamente la variabilidad analitica, y cada dia se toman 3 muestras del reactor para poder
medir la heterogeneidad muestral. A este disefio experimental se le denornina FACTORIAL.
En este caso de dos factores (factor espacio y factor tiempo).
Veamos como se deterrninan las distintas variabilidades.
a) Aislarniento de la variabilidad analitica
De cada una de las 9 muestras (3 par dia) extraidas del reactor se han realizado dos
analisis. Par tanto, en ausencia de errores sistematicos o crasos, las diferencias que existan
entre cada par de replicas han de deberse entera y exclusivamente a la imprecision del metoda
analitico. Esto es, cada una de las 9 desviaciones estandar calculadas a partir de las 9 parejas
de replicas analiticas rnide el rnismo parametro: la imprecision analitica. Por tanto, la mejor
estimacion de la variabilidad analitica la obtendremos si ponderamos esos 9 valores.
Sustituyamos cada pareja de datos por una media y calculamos su desviacion estandar, con lo
que la tabla de datos original queda de la siguiente manera:
Punta A
Punta B
Punta C
Dia 1*
26,5 '(0, 707)
29,5 (0,707)
27,0 (0,000)
Dia2*
32,0 (0,000)
35,5 (0,707)
29,5 (0,707)
Dia3*
27,5 (0,707)
32,5 (0,707)
28,0 (0,000)
V. Ferreira
56
que estas medias (por ejemplo 26.5; 29,5 y 27,0, para el primer dia), no difieren solo por
representar la composicion de tres muestras extraidas de distintas partes del reactor, sino
tambien como consecuencia de la imprecision analitica en su determinacion. Para verlo claro
piensa en que hubieras cogido una Unica muestra y la hubieras analizado tres pares de veces.
Las tres medias no tendrian porque ser iguales, y de hecho el teorema central del limite nos
dice que la desviacion estandar de esas tres medias sera la de la poblacion original dividida
por la raiz del nllinero de elementos que componen esa media. Esto es, si la composicion no
variara espacialmente dentro del reactor (la variabilidad muestral es cero), la varianza de las
medias seria
S~d = 8?{ .Por otra parte, sabemos que el intervale de confianza de cada una
donde f.l se refiere al valor cierto de composicion de la muestra analizada. Por el contrario, si
la variabilidad analitica fuera cero, las medias obtenidas en el analisis replicado (las replicas
serian iguales en este caso) serian justamente el valor cierto de composicion de cada una de
las muestras extraidas. En ese caso, esta claro que la varianza de estas tres medias seria la
varianza muestral, s?nd = s?n,o . En el caso general en que ni la variabilidad analitica sea cero
(que nunca lo es), ni la muestral sea nula, la desviacion estandar que obtenemos de las tres
medias (26,5; 29,5 y 27,0), sera una estimacion de la variabilidad muestral aumentada en la
analitica corregida por dos.
En concreto:
2
2
Sa
-s mto + -2
2
S md-
Ahora bien, esta observacion se repetira en los tres trios de medias que tenemos (un
trio por dia), por lo que la mejor estimacion de la desviacion de las medias (y por tanto de la
muestral) sera la combinacion de las tres. Vamos a hallarlas, reduciendo la tabla anterior a
tres medias y tres desviaciones estandar:
Smd
= 2 53
'
S mto S md
Sa = 2 53 2 2
'
0 333
= 6 234 =>
= 2 49
2
'
S mto
'
- + S md - - +
x_t.fj-x_t
stz
.J3
S mto
Esto es, las tres medias de esta tabla son diferentes entre si por dos razones, una
porque corresponden a distintos dias (variabilidad temporal que quiero determinar), y otra
porque cada una viene afectada de una incertidumbre combinada de la muestral y la analitica.
(El mismo razonamiento de antes valdria: imagina que las tres medias procedieran de 3
grupos de 3 muestras analizadas por duplicado que hubieran sido sacadas en el mismo
instante)
La desviaci6n estandar de estas tres medias esta por tanto relacionada de la siguiente
manera con las tres fuentes de variaci6n:
2
2
Smd2
Stemp
Moraleja: Todo disefio experimental tiene que permitir separar las fuentes de
variaci6n aleatoria de las que pueda producir el factor a estudio. Mediante un disefio
experimental adecuado, y si los presupuestos de normalidad se cumplen, el ANOVA nos
permitira aislar las distintas fuentes de variaci6n que acttlan sobre el conjunto de datos.
El disefio de experimentos debe tener en cuenta la existencia de todas las fuentes de
variaci6n que existen en un determinado sistema y tratar de obtener una estimaci6n de su
magnitud mediante el uso adecuado de replicas. A cada fuente de variaci6n que acrua sobre el
sistema se le denomina FACTOR. AI conjunto de variaciones aleatorias (que son las de
medici6n mas otras variabilidades ambientales) se le denomina habitualmente ERROR. Los
factores pueden ser de efecto fijo (que son los factores que habitualmente queremos estudiar,
por ejemplo el efecto de la temperatura o del pH en una reacci6n quimica, o el efecto de un
tipo de abonado en el rendimiento de una plantaci6n), o aleatorios, que son tipicamente los
relacionados con la heterogeneidad muestral y el muestreo (en terminos tanto de espacio
como de tiempo). El nfunero de valores de un factor que consideramos se denominan
NIVELES de dicho factor. Por ejemplo, si para evaluar el efecto de la temperatura
realizamos mediciones a tres temperaturas diferentes, el factor temperatura decimos que tiene
tres niveles. Para evaluar el efecto de un factor hace falta, como minimo, dos niveles.
AI tipo de disefio experimental derivado del reconocirniento de la existencia de
factores y de la necesidad de aislar la influencia de los factores jerarquicamente inferiores, se
le denomina disefio factorial. El ejemplo con el que hemos comenzado el capitulo es un
disefio factorial complete de dos factores (espacio y tiempo), ya que el tercer factor (error
experimental o aleatoric) no se cuenta porque siempre existe. Los factores espacio y tiempo
58
V. Ferreira
pH
3,20
3,25
3,30
3,35
Rep 1
(lunes)
18 8j
'
18 8 1
'
18 62
18 ' 2'~
Rep2
(martes)
19 23
'
19,04
18 52
' 1
18 0
'
'
Rep3
(miercoles)
18 7 1
'
18 72
'
18 44
'
18 13
'
Rep4
(jueves)
19
'
18 63
'
18 74
'
17 9 1
'
Todas las variaciones que aparecen en Ia tabla se deben solo a los errores a/eatorios
(esto es: el pH ejerce una influencia NULA sabre e/ sistema).
A partir de este memento, el ANOVA va a seguir un proceso de descomposici6n de
varianzas similar al que ya realizamos anteriormente. En primer lugar calcularemos la
varianza analitica ponderando las cuatro varianzas de los cuatro grupos de replicas (uno por
pH). En segundo lugar calcularemos la varianza de las cuatro medias de los cuatro grupos.
Esa varianza, de acuerdo con lo que expusimos anteriormente, deberia descomponerse de la
siguiente manera:
2
2
Sa
-s pH + -4
2
S md
Ahora bien, si la hip6tesis nula es cierta, entonces SpH es cero y la expresi6n anterior
se convertiria en:
2
Sa
Smd= 4
2
Por tanto, si la hip6tesis nula es cierta, la varianza de las medias (multiplicada por 4)
deber ser equivalente (o sea no significativamente diferente) de la varianza analitica. Para
comprobar este extreme tan solo tendremos que aplicar un test F. Si el test F nos indicara que
60
V. Ferreira
existen diferencias significativas entre ambas varianzas, esto quiere decir que la hipotesis
nula no puede ser cierta. Entonces y solo entonces podremos decir que hemos demostrado
que el pH ejerce una influencia significativa sobre la sefial analitica. Una vez demostrado
esto, se puede aplicar el test t para comparar entre las distintas medias.
Vamos a realizar el proceso paso a paso.
pH
3,20
3,25
3,30
3,35
media
18,95
18,77
18,55
18,05
s
0,238
0,171
0,129
0,129
s2
0,0567
0,0292
0,0167
0,0167
Calculo ahora la media ponderada de todas estas varianzas, que es la mejor estimacion
de la variabilidad analitica, y si la hipotesis nula fuera cierta, seria tambien una buena
estimacion de la varianza de la poblacion original.
Esta estimacion tiene h (n-1) grados de libertad, siendo h el nillnero de grupos y n el
2 = LS~; = 0,0567 + 0,0292 + 0,0167 + 0,0167 = 0 0298
Sa
h
4
'
nillnero de elementos dentro de cada grupo. En este caso esta estimacion de la varianza
analitica tiene 12 grados de libertad.
SpH
es
F 3 12 =
'
0 609
= 20 44
0 0298
'
'
El valor critico encontrado en las tablas de F para una cola (ya que solo nos interesa
comprobar si la varianza entre grupos es mayor que lade dentro de grupos) es 3,49.
Por tanto la varianza entre grupos es significativamente mayor que la varianza entre
grupos y eso quiere decir que la hipotesis nula es falsa, esto es; que el factor controlado pH
ejerce una influencia significativa y real sobre el sistema.
En concreto sabemos que la variabilidad asociada al pH es:
2
SpH
_Sa=0152-0,0298=0144
Smd
4
'
4
'
2
Puesto que el termino s (2/n)0 5 es el mismo para todos los casos, y puesto que la tc es
la misma tambien para todas las medias, en Iugar de calcular el t experimental para cada par
de medias, lo que se hace es calcular la minima diferencia que tiene que haber entre las
medias para que pueda ser considerada significativa. En la ecuacion anterior el numerador se
convierte en D, y sustituimos 1:e: por el tc encontrado en las tablas (con h (n-1) grados de
libertad):
D=
sVI
th(n-1)
En nuestro caso:
D=
0,173~
2,18 = 0,27
Ahora podemos construir una tabla de doble entrada para calcular todas las diferencias
entre las medias, marcando con un asterisco las que sobrepasan D:
62
V.Ferreira
pH
3,2
3,25
3,3
3,35
pH
medias
18,95
18,775
18,55
18,05
3,2
18,95
0
-0,175
-0,4*
-0,9*
3,25
18,775
3,3
18,55
3,35
18,05
0
-0,225
-0,725*
0
-0,5*
Puede verse que de las cuatro medias de que disponemos, tan solo las diferencias entre
las medias correspondientes a las parejas de pHs 3,20 y 3,25 y 3,25 y 3,30 no superan la
Minima Diferencia Significativa, pero que entre 3,30 y 3,35 ya hay una diferencia
significativa y si la diferencia de pH es superior a 0,05 siempre hay diferencias. Por tanto no
solo hemos demostrado que el pH ejerce un efecto significative, sino que debe ser controlado
con una precision superior a las cinco centesimas para evitar que afecte de forma negativa a
la precision del metodo. En cuanto a cual es el pH optimo, si el objetivo es obtener una sefial
maxima, el pH mejor de los ensayados es el inferior.
5.- La tabla del Amilisis de Ia Varianza
- l[ x)'~
)
'------------'
El numerador se denomina
suma de cuadrados.
s- /L(x;
A la varianza se le denomina
cuadrado medio
La forma de operar la podemos ilustrar con el ejemplo que acabamos de ver acerca del
efecto del pH. La tabla de datos queda de la siguiente forma:
pH
3,2
3,25
3,3
3,35
Rep 1
18,8
18,8
18,6
18,2
Rep2
19,2
19
18,5
18
Rep3
18,7
18,7
18,4
18,1
Rep4
19,1
18,6
18,7
17,9
media global
medias
18,95
18,775
18,55
18,05
18,58125
Rep 1
-0, 15
Rep 2
0,25
Rep3
-0,25
Rep4
0,15
3,25
3,3
3,35
0,025
0,05
0,15
0,225
-0,05
-0,05
-0,075
-0,15
0,05
-0,175
0,15
-0,15
Rep 1
Rep2
0,0225
0,000625
0,0025
0,0225
3,2
3,25
3,3
3,35
Rep 3
0,0625
0,050625
0,0025
0,0025
Rep4
0,0625
0,005625
0,0225
0,0025
sumas
0,0225
0,030625
0,0225
0,0225
Suma global
0,17
0,0875
0,05
0,05
0,3575
Esta suma de cuadrados dentro de grupos tiene 12 grades de libertad. Al dividirla por
este dato obtenemos la varianza, que en la nomenclatura ANOVA se denomina cuadrado
medio:
Cuadrado medio dentro grupos es 0,3575/12=0,02979
b) La variabilidad entre grupos la calculamos sustituyendo cada dato por la diferencia
que hay entre su media de grupo y la media global:
pH
3,2
3,25
3,3
3,35
Rep 1
0,36875
0,19375
-0,03125
-0,53125
Rep 2
0,36875
0,19375
-0,03125
-0,53125
Rep3
0,36875
0,19375
-0,03125
-0,53125
Rep4
0,36875
0,19375
-0,03125
-0,53125
Rep 1
Rep2
Rep4
Rep 3
cuadrados
0,13598
0,13598
0,13598
0,13598
0,54391
0,03754
0,03754
0,03754
0,03754
0,15016
0,00098
0,00098
0,00098
0,00098
0,00391
0,28223
0,28223
0,28223
0,28223
1,12891
1,82688
Esta suma de cuadrados entre grupos tiene 3 grados de libertad. Como anteriormente,
al dividir la suma de cuadrados por los grados de libertad obtenemos el cuadrado medio entre
grupos:
Cuadrado medio entre grupos = 1,82688/3=0,60896
Dato que coincide con la varianza entre grupos anteriormente calculada.
El cociente F coincide con el cociente entre el cuadrado medic entre grupos por el
cuadrado medic dentro de grupos:
F=0,60896/0,02979=20,4405, con 3 y 12 grados de libertad.
Todos estes resultados se ordenan en una tabla como la siguiente que es la tradicional
tabla de analisis de la varianza, yes la que nos proporcionara cualquier programa estadistico.
64
V. Ferreira
Fuente de variaci6n
Entre grupos
Dentro grupos (error)
TOTAL
Grados de
Libertad
3
12
15
Sumade
Cuadrados
1,82688
0,3575
2,18438
Cuadrado Medio
0,60896
0,02979
20,4405
P=0,0001
La fila encabezada por TOTAL, es Uri calculo de la variabilidad total del sistema.
Como es facil de comprender, esta variabilidad es simplemente la suma de los cuadrados de
las diferencias entre cada uno de los 16 datos individuales y la media global, y se calcula tal y
como se explic6 anteriormente. Primero calculamos las correspondientes diferencias:
pH
3,2
3,25
3,3
3,35
Rep 1
0,21875
0,21875
0,01875
-0,38125
Rep 2
0,61875
0,41875
-0,08125
-0,58125
Rep 3
0,11875
0,11875
-0,18125
-0,48125
Rep 4
0,51875
0,01875
0,11875
-0,68125
Rep 1
0,04785
0,04785
0,00035
0,14535
Rep2
0,38285
0,17535
0,00660
0,33785
Rep3
0,01410
0,01410
0,03285
0,23160
Rep4
0,26910
0,00035
0,01410
0,46410
cuadrados
0,71391
0,23766
0,05391
1,17891
2,18438
De forma que el dato yij, que corresponde al dato n j del tratamiento (pH) i, puede
considerarse como la media global, mas la contribuci6n del tratamiento (pH) i
correspondiente, mas su termino de error o residual. En terminos matriciales:
18,8
18,8
18,6
[
18,2
19,2
19,0
18,5
18,0
18,7
18,7
18,4
18,1
19,11
18,6
18,7
17,9
0,37
18,58 18,58 18,58 r 0,37
0,37
-0,25
0,3 7
r-0,15 0,25
[18,58
0,15 1
18,58 18,58 18,58 18,58
0,19
0,19
0,19
0,19 + 0,025 0,225 -0,075 -0,175
+
18,58 18,58 18,58 18,58
-0,03 -0,03 -0,03 -0,03
0,05 -0,05 -0,15
0,15
18,58 18,58 18,58 18,58
-0,53 -0,53 -0,53 -0,53
0,15 -0,05
0,05
-0,15
0 bien,
0,219
0,619
0,119
0,519
0,219
0,419
0,119
0,019
0,019 -0,081 -0,181 0,119
[
-0,381 -0,581 -0,481 - 0,6811
0,37
0,37
0,3 7
r-Q,l5 0,25
-0,25
0,15
r 0,37
0,19
0,19
0,19
0,19 + 0,025 0,225 -0,075 -0,175
-0,03 - 0,03 -0,03 - 0,03
0,05 - 0,05 - 0,15
0,15
- 0,53 -0,53 -0,53 -0,531
0,15 -0,05
0,05
-0,15 1
Donde la primera de las matrices ahora contiene los diferencias entre cada dato con la
media general. Al elevar al cuadrado cada uno de los elementos de las matrices y hacer la
suma, obtenemos las correspondientes sumas de cuadrados, que cumplen la igualdad:
2,1843
1,827 + 0,357
ser
una
distribucion
66
V. Ferreira
o,15
Clue
El histograma nos indica que en este caso, los residuos no parecen distribuirse de
forma normal, ya que los residuos mas grandes son mas frecuentes. De hecho 10 de los
residuos tienen una magnitud superior a 0,149. Podemos aplicar alguna de las pruebas citadas
en el capitulo anterior para verificar la normalidad. La curtosis muestral (que a la vista del
histograma es el parametro que puede desviarse de la normal), arroja un valor de -1,18,
claramente por debajo del 0 esperado, lo que muestra que la distribuci6n es mas chata que la
normal. Sin embargo, el intervalo de confianza de este parametro (raiz(24/n)) es 1,23, por lo
que no podemos afirmar que la distribuci6n se aparta de la normal de forma concluyente. De
la rnisma forma, la maxima diferencia entre las curvas de frecuencia acumulada observada y
la normal te6rica (0,147-hazlo como ejercicio-) es bastante inferior al valor requerido para el
test de Komogovov-Srnimov (0,213).
La representaci6n de los residuos frente a los estimados se puede apreciar en la figura
siguiente:
realdualea va eaUmadoa
.
.
0,3
0,2
0,1
1
.(),1
.(),2
.
.
.
18,1
18,2
18,3
18,4
18,5
18,8
18,7
.
.
18,8
1~
18,9
.(),3
colocada en el lado derecho y sugiere que a mayor magnitud, mayor desviacion. Desde el
punto de vista analitico esto quiere decir que aunque la mayor sefial se obtiene a un pH 3,20,
esta sefial es mas imprecisa. Sin embargo, todo esto se queda en observaciones, ya que las
diferencias entre las desviaciones a pH 3,2 y 3,35 no son significativas, tal y como indica el
correspondiente cociente F:
Siendo el valor critico 9,27. Por lo que no tenemos pruebas de que dicha observacion
no sea debida a causas puramente aleatorias. Sin embargo, hemos obtenido una interesante
informacion que podriamos contrastar disefiando nuevas experiencias (por ejemplo,
estudiando con mayor detalle lo que le ocurre a la precision analitica a dos pHs distintos), lo
que enriquece el proceso experimental.
reslduos vs dlo
0,3
0,2
0,1
0,5
~. 1
~.2
.
.
.
1
1,5
2,5
~.3
.
.
.
3
.
3,5
45
Entre grupos
Dentro de los
grupos
Total
Suma de
cuadrados
0,081875
0,275625
0,3575
Grados de
libertad
Promedio de
F
los
cuadrados
3 0,027291667 1,188208617
12 0,02296875
Probabilidad
Valor critico
paraF
0,355507716 3,490299605
15
68
V. Ferreira
analitico), esto es, tomamos una pequefia fracci6n de la poblaci6n (el estanque, o el lote de
pastillas constituyen la poblaci6n). A partir de esta muestra tomada estimaremos las
propiedades de la poblaci6n original. Por supuesto que esta muestra debe ser aleatoria, esto es
todos los individuos de la poblaci6n (cada una de las pastillas, o cada una de las unidades de
volumen del estanque) tienen que tener la rnisma probabilidad de ser elegidos.
Para evitar ambiguedades en ellenguaje, a cada una de las fracciones de muestra la
llamaremos incremento de muestra, y al grupo de las fracciones muestra bruta. Como los
materiales (el estanque, las pastillas), no son homogeneos, deberemos tomar varios
incrementos de muestra elegidos al azar. Estos incrementos, bien por separado, bien despues
de mezclarse, senin analizados y el resultado del analisis sera la media aritmetica obtenida en
cuantos analisis se hayan realizado. Este resultado ira afectado de dos fuentes de
incertidumbre, la analitica y la muestral. Por consiguiente, para estimar la incertidumbre
global del resultado y por tanto para disefiar el proceso analitico 6ptimo mas adecuado, sera
preciso conocer ambas dos fuentes de variaci6n. El ANOVA puede utilizarse con el fm de
separar ambas fuentes de variaci6n.
Vamos aver su aplicaci6n con el siguiente ejemplo:
Deseamos deterrninar el contenido en principio activo de un lote de medicamento
formado por 1.000.000 de tabletas. Se tomaron para ello 10 tabletas elegidas al azar, y sobre
cada una de elias se realizaron 3 medidas del principio activo por una tecnica cromatografica.
e medicion
Tableta
1
2
3
4
5
6
7
8
9
10
2a medicion
2.98
3.06
3.01
2.91
2.85
3.14
3.16
3.07
3.14
2.80
2.92
3.02
3.10
2.87
2.82
3.11
3.14
3.09
3.19
2.82
3a medicion
2.97
3.00
3.08
2.83
2.84
3.08
3.18
3.13
3.19
2.78
Esta varianza es debida tan solo, a los efectos aleatorios que acruan sobre la medida, y
no a los del muestreo. La calculamos como la media de las varianzas de cada una de las
1
Esta varianza es debida tanto a los efectos aleatorios que actuan sobre la medida como
a la variabilidad existente entre los incrementos de muestra (y que es consecuencia del
proceso de producci6n industrial, son diferencias reales). La calculamos como la varianza
entre las medias de las triadas de datos (con 9 grados de libertad):
Como ya sabemos, esta varianza de las medias es debida ala variabilidad muestral
2
Smd
= 0,0184
0,0552 = 5 81
0,95 10- 3
,
Siendo el F critico para 9, 20; 2,393, por lo que queda demostrado que la
heterogeneidad muestral ejerce un efecto significative.
s
S md = s mto + 3
2
___!!_
::::::>
s = 0,0184-0,95 10 = 0,0181
2
-3
mto
70
V. Ferreira
San
S md -s mto + - n
2
Donde testa calculado con los grados de libertad con que se conoce la varianza de muestreo.
2
J-l
= X ( S md = X ( S mto + San
Jii
h
nh
En la practica, sin embargo, en lugar de emplear t emplearemos la distribuci6n z, ya que en
las operaciones en las que se estudia la variabilidad de un rimestreo se suele disponer de un
nillnero de grados de libertad lo sufientemente grandes como para que t y z sean
practicamente coincidentes.
2 esquema de muestreo: Se toman h incrementos de muestra y antes de analizarse se
mezclan. De la mezcla se realizan n medidas. En este caso el resultado final es la media de las
n replicas analiticas realizadas sobre la muestra bruta o compuesta. El intervale de confianza
del resultado finales en este caso:
Donde igualmente t esta calculado con los grados de libertad con que se conoce la varianza
2
de muestreo.
Problemas:
1.- Sabemos a partir de experiencias previas que Ia varianza debida al muestreo es 10 y Ia debida al
metoda analitico 4. (en unidades arbitrarias). Calcula Ia varianza de Ia media para los siguientes
esquemas de muestreo:
a) Se taman 5 incrementos de muestra, se mezclan y se realiza un ana/isis p or duplicado.
b) Se taman 3 incrementos de muestra y se analiza cada una por duplicado.
c) Se taman 2 incrementos de muestra y se analizan por triplicado.
2.- Se desean conocer las varianzas de medici6n y muestrales del contenido de Nitr6geno A minico de
un campo de soja. Para determinarlas se tomaron 5 muestras aleatorias de 10 g de soja, y se analiza
cada muestra por triplicado. Se obtuvieron los siguientes valores:
~
. . . . . .. .
M~-~;;.~
. . . . . . . . r. . . . .
i~;~di~i6~
. . . . . .f..........
2.~ ;~di~i6~
. . ..l . . . . . 3.;,.
. . . . . .l
;;;~'di~i6.~
.....:...........:.T. . - . . . ::l~:::::::::::::c:~:~::::::':!:~:;c:~~--~::~=:J
............ 13 ........ ... J ....... .. J.1,7
)~,?. . ...... i_-!.1.!. ~---------1
r ..:__::::--:'A.---::::~::: ..~::c::::::::::::r:i
[::::f~~Pi.~qf.~i.q _
_] __- 1 a me_clicion
2 medici6-;;-;-~~~--~~~iii~_4_j_~j~~~~~--~1
'
~?.!_ Q_Q___________________ L___~_,_}_____~----51}2____,;, .......... ?.!~ _______ ,,.....~
------------------~?.~..9..L _________________ i
5,39
1
5,38
~ .....................~!.~L. . . . . . . ...J
!....................~?.!..!.9.. . . . . . . . . . -.
. --- 5, 3
5, 39
-----------~}2___________ ~
55,20
i
5,39
f
5,41
;
5,40
;
----------------5----5----,--2----5--------------------r--------_5-..-._,-_4_-_2_______-_------- i. -------5--4--0-------------T-----............5..........1........................1.
.
55, 3 o
55,35
. . . . . ............... ~---------..!.........._______...:;,..........................~1............................
i
5, 42
1__________
_j
- - - .......... ~~.1.2
...................... ~!.1..?........................
}!..1.L . . ______
_______?..r1.1.________j
5,45
4.- Los siguientes resultados muestran el porcentaje del agua intersticial total recuperada al
centrifugar muestras de piedras areniscas tomadas de diferentes profundidades.
Profundidad (m)
33.3
33.3
35.7
38.1
31.0
33.3
43.6
45.2
47.7
45.4
43.8
46.5
72.5
70.4
65.2
66.7
77.6
69.8
16
23
Dia
1
2
3
4
Punta
2,2
3,6
4,9
4,3
Punta
3,5
2
4,1
5,1
Punta C
2,7
2,4
5,4
3,6
Punta D
1,9
3,3
5,2
5
V. Ferreira
72
5
6
7
8
9
10
1,7
4,5
3,8
3,3
5,7
5,3
3,3
6,3
3,2
2,8
5
4,2
2,5
4,7
2,3
4,2
4,2
4,7
2,9
4
2,9
4,1
5,1
3,9
Determina
a) ;,Cuantos puntas de muestreo se deberiancolocar para determinar la composici6n diaria
con un 10% de precision (a=0,05)?; b) Manteniendo el numero de puntas de muestreo inicial
(4), ;,cuantos dias del afio debe monitorizar el efluyente para conocer la composici6n media
anual del vertido con una precision de 0,5 (95%) ?; c) como b pero con el numero de puntas
de muestreo determinados en a).
.----------------------------------------,
0,6
0,5
senal medida en Ia muestra
0,1
concentraci6n determinada
0 ~--~----~--~--~----~--~--~
10
15
20
25
concentrac16n (mg(l)
30
35
74
V. Ferreira
[1]
R' = 1+
R'- 0
0
0
correlacion entre dos variables. Para un geologo, la existencia de un coeficiente de correlacion r=O,S
puede ser indicia de una importante correlacion entre dos variables. En quimica analitica, para
considerar poder emplear funciones lineales de calibracion satisfactorias, r debe ser mayor de 0,99, y a
veces incluso de 0,998. En cualquier caso, es conveniente siempre trazar la gratica porque incluso tras
coeficientes muy altos (muy cercanos a 1) pueden esconderse tendencias no lineales importantes que,
sin embargo, son facilmente detectadas par supervision visual.
Se puede determinar Ia significatividad de una correlacion empleando el siguiente estadistico
t:
lri.Jn- 2
t=~==-
Y;,
76
V. Ferreit:a
pendiente
[2]
ordenada en el origen
[3]
x0
= Yo -bo
[4]
bl
L(Y;- Y)
s2 = __,__;- - - Y
donde los
n-2
[5]
Y; son los valores estimados y n el nillnero de pares de puntos de la recta de calibrado. Este
parametro es parecido a la varianza de una poblacion, con las siguientes variaciones: a) en Iugar de la
diferencia frente a la media, se computa frente al valor estimado; b) el numero de grados de libertad de
una regresion lineal son n-2 y no n-1, como es el caso en el calculo de una varianza muestral. Esto es
debido a que en una regresion se necesitan dos parametres (pendiente y ordenada en el origen) para
definir el conjunto de datos.
A continuacion se calculan las varianzas asociadas tanto a Ia ordenada en el origen como a la
pendiente,
s2 -
ho-
----;;;=---'------::-
""'(
-)2
nL...J
X; -x
[6]
[7]
Finalmente, Ia incertidumbre en Ia determinacion de un valor de concentracion por
interpolacion de la sefial obtenida en Ia medicion en Ia correspondiente recta de calibrado viene dada
por Ia siguiente formula:
sY
s =0
[8]
Yo la
4.-------------------------------------------.
~~
3,5
,.
Y3o 1--------------- -~
./
L ____ _,..
.,..-
v(.--r'
,.~/~+ ,.,. I
2,5
+-------------------;/;-~:.___,.""'-~-+----f-.--:-----------1
..,..-~ 2 r---------------~---~.--~~~.-------+---~-+-------~
~
,.,..r _/
...... "' /
_,..,.. ,.."
1,5 +---------/~___,..4-_,..,.:.------------'----'--+----------l
..,..-/
interwlo de conftenza
0, 5 ,----------------------------t=::::;==:;r-------~
o +---~----.---------~--------'-~T~--'-----------1
0
0,05
0,1
0,15
0,2
0,25
Xo 0,35
0,3
0,4
0,45
Concentracl6n
2.- Con los datos del problema I que se ajustan a una recta, construye Ia correspondiente recta de
regresi6n, calcula los intervalos de confianza tanto de Ia pendiente como de Ia ordenada en el origen,
y determina Ia concentraci6n, con sus correspondientes intervalos de confianza, de una disoluci6n
cuya senal por Ia tecnica I fue de 3, I5.
Una simple inspeccion visual de la ecuacion [8] y de la figura anterior nos permite extraer las
siguientes conclusiones acerca de la precision en toda medicion que emplee una recta de calibrado:
1.- Cuantas mas replicas de la muestra, mejor. Aunque a partir de 3 datos la mejora es
residual.
2.- El nfunero de puntos en la regresion juega un doble efecto en la incertidumbre de una
concentracion interpolada. Por una parte afecta directamente a la imprecision S0 , y por otra
parte afecta a los grados de libertad con que conocemos t. Es conveniente que n sea por tanto
no inferior a 6.
3.- La cercania de la muestra al centroide de la regresion es muy importante. La maxima
precision se da en el centro.
efecto n puntas en regresi6n
0,2
-r---------- -- - - - - -- ----------------,
+---------,-..........._
::------------'------.--"""7"'------l
--/ L
0,16 +-----------'"""--:-:::--------:=::::------0,1 8
.J-------------======:::::::::.-------------1
---n=3
- - - - n=4
0,12 r-------------------------------~
- -n5
0,14
0,1
r-------------------------------~
0,08 r-------------------------------~
0,06 +--------:,-----------------------:=------l
------------------
0,04
0,02
t===::i~~iimii!iiMm;j~~=j
0,5
1,5
2,5
So~al
3,5
4,5
-+t--n=6
-n=e
-r\"'10
--~-- n=20
V. Ferreira
78
Efecto de m (n=6)
0,04
0,035
0,03
0,015
-m=1
----m=2
- -m=3
--M-m=5
-m=10
0,01
+ m=20
0,025
0,02
0,005
1,5
0,5
2,5
3,5
4,5
Seftal
Desde el punto de vista estadistico, Ia recta de regresion esta muy relacionada con el analisis
de Ia varianza, porque como el, Ia recta de regresion es un modelo aditivo simple que nos permite
simplificar y predecir el comportamiento de un sistema natural. Como vimos en los epigrafes
anteriores el ANOVA nos permite separar las fuentes de variacion que intervienen en un sistema, de
forma que Ia variabilidad total se considera Ia suma de Ia variabilidad deb ida al factor (o a los
factores) mas Ia debida al error experimental. En el caso de Ia regresion ocurre algo muy similar. La
variabilidad del conjunto original de datos se descompone en Ia explicable por el modelo lineal (Ia
recta de regresion) yen Ia debida al error (que es Ia varianza contenida en los residuales). Esto es, los
residuales son Ia parte de variacion del sistema original que no es explicada por Ia recta y constituye el
error aleatorio.
El modelo de regresion establece que un resultado dado, Yi> se puede descomponer de Ia
siguiente manera:
yi=bo + b1xi +error= valor estimado +valor residual, Y; =
o en notacion matricial:
XB + R
+ ;, (donde
Y; = b
+ h1X ; ),
Y" + R, donde Y contiene los datos de seiial originates (es un vector columna),
B es Ia matriz horizontal que contiene los parametros de Ia regresion (boy bl), X es la matriz que
"
contiene los datos de concentracion., Yes un vector columna que contiene los valores estimados, y R
es otro vector columna que contiene los residuales.
Y1]
[1 x1]
= 1 [b
[
1
Yn
[&1] = [Y1]
[&1]
,. +
b1 ] +
xn
&n
Yn
&n
La variabilidad del conjunto de datos Y original, se computa como la suma de los cuadrados
de las diferencias de cada Yi frente ala media ji, como de costumbre. La variabilidad retenida por el
modelo puede calcularse mediante la suma de los cuadrados de las diferencias de los valores
estimados frente al valor ji , y frnalmente la variabilidad no explicada por el modelo y englobada en el
termino error, se calcula como la suma de los cuadrados de los residuales. En terminos matriciales,
esto deriva de la igualdad anterior restando a ambos miembros ji :
Por lo que de forma exactamente igual que en el caso ANOVA, se han de cumplir las
siguientes igualdades entre las correspondientes sumas de cuadrados:
3.- La tabla de ANOVA obtenida para Ia regresion de Ia senal sabre Ia concentracion con los siete
primeros pares de datos del problema 1 se muestra a continuacion: [los datos son los siguientes:
(0,1; 1), (0,15; 1,5), (0,2; 2,1), (0,26; 2,5), (0,31; 3,2), (0,39; 3,8), (0,45; 4,1)]
F
fS'ig.
Sumade Gl
!Media
'(::uadriztica
ruadrados
409,472
Regresion 7,983
1
7,983
000
1,949E-02
Residual 9,747E-02 5
Total
8,080
6
a Variables predictoras: (Constante), CONCENTRACION
b Variable dependiente: SENAL
explica como se ha obtenido esta tabla y deduce las formulas para su cizlculo.
80
V. Ferreira
media) yen falta de ajuste (suma de los cuadrados de las diferencias entre Ia media de las replicas y el
valor estimado). Esto es:
ij
ij
4.- Considera los datos obtenidos en el ami/isis repetido de disoluciones de calibrado por dos
tecnicas distintas:
Calibrado
Tecnica 1
Tecnica 2
10 mg/L
0,28
0,32
10 m14/L
0,36
0,33
20mg/L
0,46
0,51
20 mg/L
0,57
0,53
30 mg/L
0,69
0,65
30 mgll
0,75
0,65
Realiza en ambos casas los calculos de las ecuaciones de Ia recta y del coejiciente de regresi6n. Cage
los residuales y calcula las contribuciones de Ia imprecision y de Ia falta de ajuste. Haz un
diagn6stico acerca de ambas tecnicas y prop6n Ia mejor soluci6n.
Ademas de separar las fuentes de error en los residuales, su estudio puede resultar muy util
para realizar un diagnostico de Ia regresion. La regresion lineal tal y como Ia hemos vista, esta
asentada en una serie de presupuestos. Alguno de elias ya lo conocemos (el error en X es
despreciable), pero hay otro que no hemos enunciado de forma explicita (aunque se desprende de lo
anterior). Este presupuesto es que los residuales se deben distribuir de forma absolutamente aleatoria,
y por tanto, Ia representacion de los mismos, bien frente al tiempo, bien frente al eje X, no debe
revelar Ia existencia de ningtin patron o modelo. Las siguientes figuras ilustran las distintas
situaciones.
,..,
0
0
;::l
Q)
1-<
ro
;::l
"0
"0
Cll
0
0
tiempo
1-<
ro
;::l
"0
Cll
Cll
Q)
0 0
0
0
Q)
concentraci6n
1-<
La primera de las figuras denota que el residual va aumentado conforme fuimos analizando las
muestras de calibrado (que deberian haberse introducido siguiendo un arden aleatorio. Esto nos esta
indicando que Ia precision de nuestro metoda vario a lo largo del tiempo, y que las ultimas medidas
que hicimos eran mucho mas imprecisas que las primeras. Esto puede ser un indicia de que algtin
instrumento dejo de funcionar de forma correcta en un cierto momenta (por ejemplo un medidor de
pH, una sonda de temperatura!...).
La segunda de las figuras denota un comportamiento totalmente normal. No se observa ningtin
patron. Es lo que deberiamos esperar tanto en Ia representacion residuaVconcentracion como
residuaVtiempo. La tercera de las figuras nos ilustra un efecto parecido al que observamos en Ia
primera. Aparece una forma de embudo caracteristica que nos indica claramente que Ia imprecision
aumenta con Ia concentracion. Este efecto es frecuente en analisis instrumental, ya que en muchas
ocasiones el error absoluto no se mantiene constante al cambiar Ia concentracion, mientras que si que
lo hace el error relativo. En este frecuente caso Ia recta de regresion tal y como Ia hemos calculado no
es adecuada y debe calcularse una recta de regresion que de mas peso a los datos mas precisos. A este
tipo de rectas se les denomina rectas de regresion ponderadas.
Esta ponderacion no puede aplicarse de forma directa, logicamente, en el caso de que una de las
concentraciones sea cero.
Otra ponderacion posible es corregir cada punto de la recta de regresion por su imprecision, medida
como varianza:
{JJi
= -2-
[1 0]
syi
L{J);Y;
[11]
[12]
y a continuacion los nuevos parametros de la regresion:
[13]
[14]
Ejemplo. Tras un estudio previa de residuales, un laboratorio analitico ha determinado que Ia
varianza de Ia senal aumenta de forma proporcional a Ia concentraci6n, por lo que ha decidido
construir una recta de calibrado ponderada. Para obtener los correspondientes factores de
ponderaci6n ha decidido determinar /a.senal cinco veces a cada concentraci6n. Se da Ia senal media
y Ia desviaci6n estimdar a cada valor de concentraci6n:
X
0,1
10
20
30
40
50
y
4
21,2
44,6
61,8
78
105,2
Si
0,71
0,84
0,89
1,64
2,24
3,03
Lo primero es calcular los factores de ponderacion aplicando la formula 10 y las nuevas coordenadas
del centroide mediante la 11 y 12,
Wi
1,984
1,417
1,262
wi x/L.wi
0,037
2,652
4,725
wi y/L.wi
1,485
5,623
10,537
82
V. Ferreira
0,372
0,199
0,109
2,087
1,492
1,019
4,300
2,909
2,144
XIV
y IV
L.=5,343
L.=12,013
L.=26,999
A continuacion se determina la pendiente y la ordenada en el origen como es habitual pero empleando
las formulas 14 y 15, en las que los productos cruzados y la suma de cuadrados de x estan ponderadas:
2
Xi-Xw
Yi-Yw
w(xi-Xw)
w(xi-Xc}(Yi-Yw)
-11,913
-22,999
281,54
543,53
-2,013
-5,799
5,74
16,55
17,601
80,53
177,47
7,987
34,801
120,29
232,73
17,987
51,001
156,10
284,47
27,987
78,201
157,17
323,56
37,987
L.=801,38
L.=1578,31
Par lo que la pendiente de la recta ponderada es 1,969 y la ordenada en el origen 3,339. Esta recta es
bastante parecida a la que obtendriamos empleando la regresion normal (y=2,818+1,985 x) pero al
estar su centroide mas cercano al origen proporciona menos error en la zona inferior de x.
La otra ponderacion posible es la 1/x. En ella, los factores de ponderacion y las coordenadas del
centroide son:
Wi
Wi X/'i.Wi
wi y/L.wi
0,0978
10
3,9107
0,1
0,0978
0,2073
0,05
0,0978
0,2180
0,0333
0,0978
0,2014
0,025
0,0978
0,1906
0,02
0,0978
0,2057
XIV
YIV
L.=10,228
L.=0,5866
L.=4,9337
Y realizando los calculos correspondientes, se obtiene la recta de calibrado de ecuacton
y=3,792+1,946 x, parecida a las anteriores pero cuyo centroide se sima todavia mas cerca del origen.
La comparacion de los residuos obtenidos par las tres tecnicas se muestra en la figura siguiente.
5
4
'
3
2
"'0
'tl
:::1
u;
ponderaci6n 1/s2
c;n il
f! -1
-2
regresi6n normal
1;
1nn
r---l
-3
-4
-5
"
estimados
Como puede apreciarse, no hay excesiva diferencia en el tamafio de los residuales, tan solo se observa
que el punta primero el residual mas pequefio corresponde a las rectas ponderadas y que en el punta
mas alto ocurre lo contrario.
En lo que si que hay una diferencia radical es en la forma de los intervalos de confianza de los valores
detetminados en una recta o en otra. En la recta ponderada, la varianza de los residuales y las
incertidumbres en el calculo de la ordenada en el origen y en la pendiente se obtienen mediante las
formulas siguientes:
[18]
=-0
[19]
n-2
-10
10
20
30
40
50
60
70
V. Ferreira
84
6.- Para verificar si un metoda de ami /isis de THT (tetrahidrotiofeno) en aguas residuales presenta
efectos de Ia matriz se han analizado una serie de disoluciones de calibrado obtenidas disolviendo
distintas cantidades de THT en agua y una serie de disoluciones de agua residual a las que se les ha
anadido cantidades crecientes de THT Campara ambas rectas y determina si se puede afirmar si el
metoda esta fibre de efectos de Ia matriz o no.
calibrados
Concentraci6n (mg/L)
Senal
M.uestras d opad as
Concentraci6n anadida
1
2
0
3
4
5
(mg/L)
0,109
0,124
0,081
0,136
senal
0,094
0,067
El estudio de regresi6n de ambos sets de pares de datos nos proporciona los siguientes resultados:
pendiente recta normal
Ordenada recta normal
pendiente recta adici6n
Ordenada recta adici6n
0,000173
0, 01454 desviaci6n 1
0,00156
0, 01397 desviaci6n 2
0,0669
0,000201
Como las desviaciones de sendas pendientes son muy parecidas, cociente F=1,35 (p=0,37) podemos
hallar una desviaci6n conjunta ponderando cada una por sus grados de libertad:
Desviaci6n conjunta= 0, 000186
y ahara no !enemas mas que aplicar el test t correspondiente:
t = 0,01454-0,01397
0,000186~
4 33
'
par lo que Ia diferencia entre ambas pendientes es significativa con una probabilidad 0,0019 y p ar
tanto hemos demostrado Ia existencia de efectos de Ia matriz.
r--------------------------------------------.
adicion estandar
concentraci6n
en Ia muestra
iii
C:
Cl>
II)
-0,05
concentracion aliadida
La concentraci6n se calcula entonces dividiendo la sefial estirnada para la muestra (esto es, Ia
ordenada en el origen de la recta), por la sensibilidad (o sea, por la pendiente).
Puedes comprobar que en el caso del problema anterior Ia concentraci6n de Ia muestra es:
C=ordenada/Pendiente=O, 066910, 01397=4, 79 mg/L
Si por el contrario, dicha concentraci6n se hubiera deterrninado interpolando Ia sefial de Ia muestra
en Ia recta de calibrado construida con disoluciones sinteticas, el resultado obtenido hubiera sido
4,50mg/L.
V. Ferreira
86
s 1
s =~ -+
0
b!
-2
y
b! ~)xi- x)
2
[17]
de donde se deduce que la precision crece cuantos mas puntos introducimos y cuanto mayor intervalo
de x cubrimos.
Puedes comprobar que para el caso anterior, la imprecision es 0,107 mg/L.
El metodo de la adici6n estandar tal y como lo hemos explicado es particularmente sensible al
problema enunciado al introducir las rectas ponderadas (una incertidumbre de la sefial creciendo con
la concentraci6n), ya que es fundamental asegurar que los residuales de la medida correspondiente a la
muestra en la correspondiente recta de calibrado son pequefios. Si se tiene la precauci6n de que la
cantidad de muestra adicionada no sea excesivamente grande, ~sto es poco probable que ocurra. Si por
el contrario se detecta dicho problema sera preciso que la recta de adici6n estandar sea una recta
ponderada. En dicho caso, el error estandar del resultado extrapolado se puede estimar mediante la
siguiente ecuaci6n:
sY
=0
-2
Ym
[18]
En cualquiera de los casos, los intervalos de confianza de la respuesta vienen defmidos por la
expresi6n: X 0 1:n.2So
7.- Determina el limite de detecci6n del metoda presentado en el problema 5. Emplea am bas rectas
(ponderada y normal) y discute los resultados.
7.2.- Otros usos de las rectas de regresion
Las rectas de regresi6n tambien pueden emplearse para comparar dos metodos de analisis. En
particular, si tenemos un metoda de referenda frente al que queremos comprobar un nuevo metodo de
analisis, podriamos analizar un conjunto de muestras (al menos 8) por ambos metodos y estudiar la
regresi6n existente entre los datos obtenidos por el metodo nuevo y los obtenidos por el metodo de
referenda. Como el modelo de regresi6n que hemos estudiado parte del supuesto de que no hay error
en x, el metodo de mayor precision (habitualmente el de referenda) es el que debe colocarse en este
eje. Si ambos metodos fundonan de forma satisfactoria, deberemos obtener una recta de pendiente 1 y
ordenada en el origen cero. Desviaciones de la pendiente indicarian una inadecuada calibrad6n en uno
de los casos. Desviadones de la ordenada en el origen indicarian una interferencia o una mala
correcci6n del fondo. Para realizar la comparaci6n con criterio estadistico, se debe aplicar el test t para
comparar un valor con un valor conoddo.
8.- Se esta comparando un nuevo metoda para Ia determinacion de Plomo en piensos frente a un
metoda de referencia. Para ella, se analizaron 10 muestras distintas por ambos metodos. Empleando
Ia recta de regresion entre ambos set de datos, comprueba si el nuevo metoda proporciona resultados
comparables a/ de referencia (no olvides que el metoda de referencia debe ir en el eje de abcisas).
muestra
Metoda Referencia
Nuevo Metoda
1
0,16
0,19
2
0,35
0,36
3
0,59
0,63
4
0,05
0,05
0,23
0,27
0,98
1,01
0, 73
0,81
0,056
0,055
9
0,43
0,44
10
0,17
0,21
1
18.8
18,8
18,6
18,2
2
19,2
19,0
18,5
18,0
3
18,7
18,7
18,4
18,1
4
19,1
18,6
18,7
17,9
12.- Estudia Ia posibilidad de que Ia variacion de tiempos de retencion con Ia Temperatura que se ha
estudiado tenga unaforma lineal.
Encuentra en ese caso Ia ecuacion de Ia recta correspondiente, los errores de Ia pendiente y Ia
ordenada en el origen, y predice cual sera el tiempo de retencion si Ia temperatura del sistema es de
55. 50C. 1. Cual sera el intervala de confianza de esta prevision?
L~.:~~~~-t~~li~!.~!.~i_-q~~~~~~~]~~~~~~~~~~!_~!ii~_q!~~~~~~~~~~~~r=~~~~~~~~~~i2~4I;J~~~~~::::_~-~::.I~~:::~~~~~~-:ii.~~i~~~::~-~::::::l
L--------------~-~gg_______________..!
_ ______}.}8
L-------------~}_z______J
55,10
~
5,38
~
5,39
~
5,39
~
-------------------;--------------------------------------Y---------------------;;..-----------------------------------e
L__________~~_!}_____________j_______ __ _~}9_ _____ _______ L ______________~L'fQ______________ __l _ _____ _ _5,39 _____ _________________ ;
V. Ferreirp
88
13.- Los siguientes resultados muestran el porcentaje del agua intersticial total recuperada al
centrifugar muestras de piedras areniscas tomadas de diferentes profundidades.
Agua recuperada (1/o)
Profundidad (m)
35.7
38.1
31.0
33.3
7
33.3
33.3
43.6
45.2
47.7
45.4
43.8
46.5
8
72.5
74.5
16
73.2
68.7
73.6
70.9
72.5
70.4
65.2
66.7
77.6
69.8
23
Investiga si la dependencia existente entre la profundidad y la cantidad de agua intersticial es lineal.
~En que rango de profundidades podrias hacer la suposici6n de que la relaci6n es lineal, y con que
error?.
14.- La respuesta de un ensayo colorimetrico para glucosa (GLU) se contro/6 con la ayuda de
soluciones estimdard de glucosa. Determina el coeficiente de correlaci6n a partir de los siguientes
datos y comenta los resultados.
Concentraci6n de GLU, mM
Absorbancia
0
2
4
0.002 0.150 0.294
6
8
10
0.434 0.570 0.704
15.- Se obtuvieron los siguiente resultados cuando se analizaron una serie de soluciones estimdar de
plata por espectrometria de absorci6n at6mica de llama:
Concentraci6n ng/mL
Absorbancia
0
5
10
15
20
25
30
0.003 0.127 0.251 0.390 0.498 0.625 0. 763
Determina la pendiente y la ordenada en el origen de la grajica de calibraci6n, junto con sus limites
de confianza.
Estima los limites de confianza para las concentraciones de plata en una muestra que proporciona
una absorbancia de 0.308, 0.314, 0.347 y 0,312 en cuatro ana/isis separados.
Estima ellimite de detecci6n del ana/isis.
16.- El contenido de oro de una muestra de agua de mar concentrada se determin6 por
espectrometria de absorci6n at6mica mediante el metoda de las adiciones estandar. Los resultados
obtenidos fueron los siguientes:
Oro aiiadido, ng por mL
de muestra concentrada
Absorbancia
0
10
20
30
40
50
60
0.257 0.314 0.364 0.413 0.468 0.528 0.574
70
0.635
92
V. Ferreira
b)
c)
d)
Alicuota
muestra
pesada
t--..
Muestra
preparada
Alicuota
medida
Seiial
-c:::ms
4!iiioo_ _
,..._ --?illiiii
__
,..._
Balanza
calibrada
0 ---
------.
,...
Masa .........
Analito
patron
V. Ferreira
94
Lo que en general hay que hacer para poder demostrar que un metodo garantiza la
trazabilidad de los resultados se resume en la figura 2. Discutamos cada paso de los
mostrados en dicho organigrama.
3.1.- Evaluacion de Ia precision.
';: :.>:(
no
1-------_.,
Estudio recuperaci6n
Estudio interferencias
proporcionales
\.
,.-)
000
0000000
..
-0000MOOOO-OOOOOOOOOOOOM-0000000000000000 000000000 0-000- 0 00 0000000000000 ' 00000 ' 000 0000000000 000000000' 0000-0'0'00''0000''0000-00' M ' ' ' ' '' ' ' ' - ' '0000oOo-ooO_ o_ _ _
0 0 0 000
...
En este ultimo caso pueden estudiarse por separado las distintas etapas del metodo
para aislar aquella con mayor efecto en la imprecision, o puede considerarse si es el caso, el
uso de alglin tipo de estandar interne que corrija la imprecision ... por desgracia las posibles
fuentes de irreproducibilidad son muchas y en ocasiones son muy dificiles de detectar.
v alidar to do el metoda
Validar todo el rango de concentraciones
Validar todo el rango de matrices (muestras)
La precision se habra de determinar a distintas concentraciones de analito y en tantos
tipos de muestra (matrices) como sea necesario. En el caso de la precision, su estudio alcanza
diversos niveles segU.n el esfuerzo experimental y el nllinero de var1aoles consideradas. El
nivel mas bajo es la repetitividad, que es la precision que se obtiene realizando las replicas en
un rnismo dia y con las m1smas condiciones operatonas. hl mvel siguiente es el de la
reproducibilidaa mtermedla, en el que las replicas se realizan en dias diferentes y empleando
01stmtas condiciones operatorias, pero dentro del.mismo laboratono."""P'""ara determinar el nivel
mas alto de precision, es precisa la mtervenci6n de distintos laboratorios. En ese caso la
denorninamos reproducibilidad propiamente dicha. Obviamente en los estudios iniciales nos
quedaremos con la reproducibilidad intermedia, a la que denominaremos sencillamente
reproducibilidad.
3.2.- Linealidad y rango dinamico del metodo
Una vez que tengamos la garantia de que el nietodo genera sefiales al menos
repetitivas, el siguiente paso es considerar la relaci6rt existente entre la sefial y la
concentracion, que en la mayor parte de los casos sera lineal. Al'igual que hicimos en el caso
de la precision, iremos de mayor a menor complejidad. Lo primero es estudiar la linealidad y
rango lineal con disoluciones sinteticas conteniendo los patrones ae analito en concentracion
conoc1da. S1 la relac1on no- fueral ineal, seria preciso considerar una transformacionmatemat1ca de la sefial (que puede ser desde la extraccion de logaritmos, una raiz cuadrada o
la introduccion de algU.n estandar intemo).
Una vez conseguida una relacion Sefial/Concentracion satisfactoria, es preciso fijar el
rango dinarnico del metoda y estudiar la linealidad en muestras reales. Esto se consigue
mediante la tecnica de la adicion estandar, pero esta tecnica solo se puede realizar sobre
disoluciones, por lo que los pasos previos realizados sobre solidos no quedaran validados en
este momenta.
3.3.- Determinacion de Ia exactitud (como ausencia de errores sistematicos)
96
V. Ferreira
sistematico es mas improbable. Para poder concluir de forma taxativa que no hay errores
sistematicos, seria conveniente el analizar distintos CRM conteniendo el analito a distinta
concentradon en tantos tipos de muestra como se quieran analizar con el metodo. En caso de
problemas, los datos de analisis de varios CRMs nos proporcionarian una informacion clave
para el diagnostico de la situacion. En la practica pocas veces se toma esta precaucion.
Desafortunadamente, hay muchos problemas analiticos para los que no hay CRM
disponibles, particularmente dentro del mundo del analisis organico. En este caso podriamos
hacer uso de un metodo de referenda distinto del que esta bajo validacion. Para ello seria
necesario disponer de un metodo ya validado y adecuado para el analisis del analito bajo
estudio en las muestras de interes. Caso de que dicho metodo existiera, se analizarian varias
muestras cubriendo el rango de concentraciones y de tipos (matrices) por ambos metodos.
Finalmente, se aplicaria cualquier test estadistico de los que ya hemos visto en los capitulos
anteriores para verificar que los datos generados por ambos metodos no difieren.
De nuevo de forma desafortunada, nos encontraremos con que en pocas ocasiones
disponemos de ese otro metodo de referenda mue hacer entonces?
Entonces debemos realizar un estudio sistematico que nos permita verificar la
trazabilidad de los resultados proporcionados por nuestro metodo. Para ello hemos de cubrir
tres objetivos: a) verificar la l).O existenda de interferendas aditivas; b) verificar la
recuperacion en fos procesos de tratamiento de muestra; y c) verificar la no existencia de
interrerenc~as proporcwnales (tl.mdamentalmente deefectos de la matriz).
3.4.- Estudio de interferencias aditivas
Una interferenda aditiva esta causada por la presencia en una o varias muestras de
alguna sustanda que produce una sefial que confundimos con la del analito. La
presencialausencia de interferencias aditivas esta ligada ala complejidad de la muestra y ala
selectividad de la tecnica de analisis. Las interferencias aditivas nos van a producir un error
sistematico por exceso y por lo general variable en las distintas muestras.
En muestras simples, en las que los interferentes potenciales son conocidos, se puede
verificar su existencia mediante el estudio de muestras sinteticas. Este estudio consiste en
preparar lo que se denomina un blanco de muestra, que es una muestra similar a la real pero
carente de analito:
Ejemplo 1.- Determinacion deMo en un metal o aleacion por EAA. Los interferentes
potenciales son el resto de metales presentes (o potencialmente presentes) en la
aleacion. Estudiar sefzal de Mo en disoluciones sinteticas conteniendo los otros
metales.
Ejemplo 2.- Determinacion de un principia activo en un farmaco por HPLC.
Interferentes potenciales: Otros principios activos presentes en el farmaco y
excipientes. Estudiar sefzal del analito en ausencia de ana/ito y presencia de
excipientes y otros principios activos
Este tipo de ensayo solo se puede realizar en aquellos casos en los que la composicion
de la muestra es conocida y podemos disponer de sus componentes.
En muestras complejas en las que los interferentes potenciales son en su mayor parte
desconocidos e indeterminacies solo puede verificarse empleando una tecnica de analisis que
proporcione una seiial multidimensional caracteristica del analito. Veamos varios ejemplos.
98
V. Ferreira
variables de los componentes que causan el efecto matriz). Por otra lado es una fuente
importante de incertidumbre, ya que aunque seamos conscientes de su existencia y realicemos
el calibrado en una matriz "promedio", seguini habiendo pequefias variaciones en la relacion
SIC en funcion de la composicion particular de cada muestra.
Otra observacion que puede hacerse acerca de la naturaleza de los efectos de la
matriz, es que dada su naturaleza, todos aquellos metodos en los que no hay transferencia
cuantitativa de analito en algful paso del analisis son mucho mas sensibles a su existencia. Si
reconsideramos los ejemplos expuestos en la determinacion del etilbenceno, es facil
pronosticar cual de los dos metodos es mas susceptible de sufrirlos. Un efecto matriz en un
analisis de agua puede estar causado por la cantidad de materia orgamca generica que
contenga el agua y que facilite la disolucion del etilbenceno. Es poco probable que dicho
efecto matriz afecte a la retencion del analito en el sorbente del primer metodo, pero es casi
seguro que dicho efecto matriz afectara a la proporcion de etilbenceno en el vapor que esta en
equilibria con el agua. Como ademas la cantidad que se esta transfiriendo es muy pequefia,
cualquier pequefio cambio tendra un efecto dramatico desde el punto de vista porcentual. Una
disminucion en 1% de la cantidad total transferida causara un error por defecto de mas del
15%. La constatacion de este hecho es la razon por la que el estudio de recuperacion tiene
importancia.
Para detectar los experimentos de la matriz se pueden hacer varias experiencias:
a) Mediante un experimento de recuperacion de sefial
b) Mediante un experimento de adicion estandar
a) Mediante un experimento de recuperaci6n de sefial parecido al expuesto en el calculo
de la recuperacion. Como en aquella ocasion, se escogeran un cierto nfunero de
muestras (intentando cubrir el rango de tipos de muestras a analizar), se fortificaran
con uno o preferiblemente dos niveles de analito (intentando cubrir el rango de
concentraciones a analizar) y se analizaran tanto las muestras originales como sus
alicuotas fortificadas siguiendo el metodo. En esta ocasion, sin embargo, el
tratamiento de los datos es muy diferente. Nose compararan las sefiales obtenidas con
las que producirian masas conocidas y equivalentes en la alicuota de medida, como se
hizo anteriormente, sino que el incremento de sefial asociado a la fortificacion se
transformara en concentracion al dividirlo por la pendiente de la recta de calibrado
construida con estandares. La comparacion de las masas obtenidas siguiendo este
proceso y las realmente afiadidas, nos dara una estimacion de la intensidad de los
efectos matriz. La diferencia entre la masa afiadida estimada y la real se expresa como
porcentaje y se denomina recuperacion. Veremos luego un ejemplo.
b) Mediante un experimento de adici6n estandar. Realizaremos una adicion estandar
completa y compararemos la pendiente obtenida en la recta de adicion con la de la
recta de calibrado tal y como se expuso en el tema correspondiente a la calibracion (lo
que equivale a demostrar que la concentraci6n determinada por interpolacion y
extrapolacion no difieren). Este es el primer paso, porque si encontramos que existen
efectos de la matriz, el siguiente es estudiar si estos efectos son de una intensidad
suficiente, no solo para diferenciar la S/C entre muestras y calibrados -lo que ya se ha
demostrado, sino para que muestras diferentes generen diferentes relaciones S/C.
Ejemplo. Seis muestras de grasa han sido dopadas con cantidades conocidas de un
aldehido (E-2-nonenal). Las muestras dopadas y las originales sin dopar se han
analizado siguiendo el metoda propuesto. La recta de calibrado del metoda, obtenida
V. Ferreir(l
100
Seiial
muestra
Seiial
dopado
1
2
3
4
5
6
1,0747
1,5506
0,2419
3,8509
9,1157
1,8481
3,8909
4,2289
3,2368
6,0993
11,8036
5,1109
Concentraci6n
adicionada
(n~/mL)
14,0
13,2
15,4
11,9
13,7
16,2
Cdoe.ado
19,6016
21,3061
16,3031
30,7383
59,5043
25, 7539
Cadicionada
14,201 7
13,5063
15,1029
11,3384
13,5547
16,4539
Creal
14,0
13,2
15,4
11,9
13, 7
16,2
Di&rencia
0,20
0,31
-0,30
-0,56
-0,15
0,25
"
101,4
102,3
98,1
95,3
98,9
101,6
Es posible que con los pasos anteriores ya hayamos conseguido verificar que el
metodo proporciona resultados con trazabilidad. Pero tambien lo es que no, como
consecuencia de la aparici6n de alglin problema ligado bien ala existencia de interferencias,
a la existencia de perdidas importantes, o a la existencia de efectos de la matriz. La soluci6n
de estos problemas queda fuera del alcance del presente texto y nos hemos de limitar a
formular alglin tipo de pautas o recomendaciones de caracter muy general.
La existencia de interferencias requiere la re-optimizaci6n del metodo, a fm de incluir
alguna etapa de aislamiento o enmascaramiento que mejore la selectividad de la seiial.
Dependiendo del caso esto puede ser muy complicado y poco practico, por lo que puede ser
recomendable incluso el cambio de estrategia de detecci6n.
La existencia de perdidas en las etapas de aislamiento no tiene porque ser un problema
en tanto y en cuanto sea un factor previsto, tal y como se explic6. Lo que sera preciso, por
supuesto, es que la calibraci6n tenga en cuenta este hecho. Como ya dijimos, el problema
asociado a una baja recuperaci6n es la escasa "robustez" del metoda tanto a cambios en
condiciones ambientales como a cambios de composici6n matricial.
La existenda de efectos de la matriz puede ser superada con un esfuerzo en la
calibraci6n del metoda. En los casas de tecnicas multicomponente muchos problemas de
precision, de recuperaci6n y de efectos de la matriz pueden ser resueltos con un estandar
interne que se comporte de una forma similar al analito. Esto explica porque algunos analisis
particularmente dificiles requieren el uso de estandares internes que son la rnisma molecula
marcada isot6picamente con C13 o con deuterio (tecnica de calibraci6n conocida como
diluci6n isot6pica). Finalmente, y en el caso de que no exista o no se pueda emplear dicho
estandar interne, la existencia de efectos de la matriz tiene una soluci6n quimiometrica, que
es emplear el metoda de adici6n estandar como estrategia de calibraci6n. Esta elecci6n
obligada implica multiplicar el esfuerzo analitico por factores entre 4 y 6, lo que no siempre
es viable.
3.7.-Consideraciones fmales
Todas las indicaciones anteriores son utiles para el caso de que la exactitud del
metoda no pueda verificarse mediante el empleo de CRMs o de alglin metoda de referenda.
Como se indica, esta situaci6n se dara con frecuencia en el campo el analisis organico. De
hecho en este campo, fuera de las moleculas de pestiddas y contaminantes mas comunes y
peligrosos, no es facil encontrar CRMs, ni metodos de referenda. En el campo del analisis
elemental, por el contrario, el nlimero y tipo de CRMs es bastante amplio, por lo que deben
ser la primera opci6n a considerar. En este campo tambien se dispone de bastantes mas
metodos de referenda.
En todo el proceso de validaci6n mostrado es precise el uso extensive de muestras
dopadas o fortificadas. Esta es la Unica soluci6n que tenemos para poder abordar el problema
de la existencia de errores sistematicos tal y como hemos vista, pero no debemos olvidar que
la preparaci6n de este tipo de muestras puede ser mas complicada de lo que parece.
En primer lugar sera muy dificil, salvo en alglin producto industrial, el preparar
muestras dopadas s6lidas iguales a las muestras reales. En todo el trabajo con s6lidos las
etapas previas a la puesta en disoluci6n (ya sea mediante ataques, extracciones, lixiviaciones,
sublimaciones, ... ) no podran ser estudiadas mediante estas estrategias. La Unica soluci6n que
puede haber en estos casas es el uso de tecnicas de extracciones sucesivas, pero su
comentario y tratarniento es demasiado complejo para el presente capitulo.
En segundo lugar, incluso aunque la adici6n de analito se realice sabre una matriz
liquida, no tenemos la garantia de que el analito afiadido establezca el rnismo tipo de
asociaciones que el analito native. Por ejemplo, en muchos fluidos naturales (suero
sanguineo, savias vegetales, zumos, orina ... ) las moleculas organic as y por supuesto los
elementos metalicos y no metalicos, se encuentran formando distintas asociaciones complejas
no bien conocidas. Algunas de estas asociaciones responden a equilibrios rapidos, pero otras
se han formado al cabo del tiempo, por lo que no tenemos garantia de que podamos conseguir
una igualdad total de comportarniento entre el analito native y el afiadido.
A pesar de estas lirnitaciones no tenemos muchas mas alternativas que las aqui
expuestas.
4.- Vision general de Ia validacion de metodos de amilisis
4.1.- Parametros a validar segun el metodo
102
V. Ferreira
);;>
);;>
);;>
);;>
Cualitativo
Cuantitativo
Analisis de
trazas
Parametres
fisico-quimicos
Exactitud
Precision
Linealidad
Especificidad/selectivida
d
Limite de deteccion
Limite de cuantificacion
Inercia (robustez)
Fiabilidad
Definiciones:
a) Parametros de interes para metodos cuantitativos y semicuantitativos
Exactitud: A menudo se emplea la palabra veracidad, que se define como el grado de
acuerdo entre el valor medido (media de varias replicas) y el valor de referenda
aceptado. Se mide mediante el empleo de materiales de referenda, de blancos de
matriz fortificados, mediante el empleo de metodos de referenda, o mediante ensayos
interlaboratorio.
Precision: Se mide mediante la desviacion estandar relativa, o mediante el parametro
ISO, P, que es 2,83 veces la desviaci6n estandar. Como se apunto anteriormente, se
distinguen tres categorias: la repetibilidad, la reproducibilidad intermedia o la
reproducibilidad
Linealidad: Se mide mediante la regresion lineal obtenida en el analisis
(preferentemente replicado) de (5 o mas) estandares de calibrado cubriendo entre el
80 y el 120% del rango de concentraciones que se espera que se encuentren las
'~~(."'"'-'" ~
.......................
_............. - _ -- ---...
V. Ferreira
104
Chequeo de idoneidad: que son un conjunto de pruebas sencillas que se realizan de forma
rutinaria antes o durante cada serie o lote de anruisis
Validacion retrospectiva: El proceso de validacion no es un proceso finito limitado en el
tiempo, sino que es un proceso continuo en el que se van incorporando cada vez mas
datos que aumentan el conocimiento que tenemos tanto del metodo de analisis como
del funcionamiento de dicho metodo en nuestro laboratorio. Un ejemplo, si en un
metodo de anruisis decidimos que una prueba de idoneidad consiste en la inyeccion
(en un HPLC) de una disolucion patron diaria, tras varios afios de trabajo
dispondremos de un conocimiento muy grande del comportamiento de dicha
disolucion patron. Sabremos cual es el tiempo de retencion esperado de cada uno de
los analitos, su desviacion estandar y el limite a partir del cual consideraremos que la
columna debe ser cambiada o regenerada. Forman parte tanto de la validacion
retrospectiva como de los chequeos de idoneidad el uso de graficos en los que se
representa la evolucion de ciertos parametros der analisis (por ejemplo, el tiempo de
retencion, o el factor de asimetria de un pico). Estos graficos se denominan graficos
de control que seran introducidos posteriormente . .
b) Validacion extema o interlaboratorio. Es un proceso de validacion complejo
acometido por varios laboratorios que realizan los mismos tipos de anruisis empleando los
mismos (y en ocasiones distintos) metodos. El proceso suele ir coordinado por una autoridad
extema encargada de suministrar muestras similares a todos los componentes y de realizar el
estudio estadistico de los resultados. El resultado de estos ensayos sirve para medir
importantes parametros de los metodos de anruisis (como la exactitud y la precision) de forma
independiente de un Unico laboratorio de analisis.
4.3.- Etapas en Ia validacion de un metodo
En el apartado 3 seguimos una serie de pautas para validar una parte fundamental de
un metodo de anruisis cuantitativo, pero no debemos olvidar que la validacion es un proceso
complejo que parte de las necesidades de un cliente potencial, y que acaba con la elaboracion
detallada de un documento normalizado de trabajo denominado Protocolo Normalizado de
Trabajo (PNT o SOP, Standard Operating Procedure) en el que se hade documentar todo el
trabajo de validacion y de control del metodo en cuestion.
La tabla siguiente muestra un esquema general ideal de las etapas seguidas en la
validacion completa de un metodo de anruisis generico.
Etapas preliminares
1.- Identificadon del problema
2.- Seleccion del metodo
3.- Desarrollo de un nuevo metodo
Eta pas de validacion
4.- Precision
4.1 Repetibilidad
4.2 Precision intermedia
4.3 Reproducibilidad
5.- Linealidad y rango lineal
6.- Exactitud: veracidad
7.- Limites de deteccion/cuantificacion
8.- Especificidad/selectividad
9.- Recuperacion
10.- Jnercia
11.- Jncertidumbre
12.- Control de calidad
13.- Idoneidad del sistema
Etapas adicionales
14.- Documentaci6n del metodo
15.- Descripci6n de todas las etapas
16.- Autorizaci6n para el uso del metodo
17.- Revision del metodo
106
V. Ferreira
El control de un metodo se realiza mediante el analisis por todo o parte del metodo de
una serie de muestras de control. La naturaleza de estas muestras depende del caso particular
en que nos encontremos, pero suelen incluir:
Ana.Iisis de disoluciones estandar. Una disoluci6n conteniendo los analitos en un
disolvente apropiado. Esta disoluci6n se empleara habitualmente como parte de las
pruebas de idoneidad del sistema anteriormente comentadas. Puede ser interesante
realizar un segundo analisis de esta disoluci6n al acabar el lote de muestras para
analizar y antes de apagar el instrumento de medida. De esta forma, dispondremos
de una valiosa informacion acerca del estado real de nuestro sistema.
Analisis de blancos. Un analisis realizado aplicando el procedimiento analitico
completo, pero sin incluir la muestra. Este tipo de ana.Iisis son particularmente
importantes en el analisis de trazas, y sobre todo en aquellos casos en los que se
conoce la facilidad del sistema para sufrir algU.n tipo de contaminaci6n. En
realidad podemos distinguir distintos tipos de "blancos". El mas completo pero
que no siempre se puede conseguir seria una muestra exenta de analito. El
segundo nivel es el blanco de sistema, en el que el procedimiento analitico se
aplica por completo pero sin incluir muestra. Hablaremos con mas detalle en el
tema del analisis de trazas.
Analisis de muestras reales empleadas como referenda. Una muestra estable
seleccionada por ellaboratorio o un grupo de laboratorios y cuyas propiedades han
sido establecidas de antemano. De nuevo estas condiciones no pueden ser siempre
V. Ferreira
108
--Area +3S
13175 ---------------------------------------
Area +2S
Linea de alerta superior
129500 **............................
'
1250005----""-----------*-.....----A-r_ea_m_edia esperada
**
12050
11825
Area -2S
Area -3S
Referencias recomendadas:
a) Basica y general
Estadistica y Quimiometria para Quimica Analitica, 4" Ed. J.C. Miller y J.N. Miller, Pearson
Education, Madrid, 2002
Quimiometria. G. Ramis, C. Garcia. Ed. Sintesis, Madrid 2001
Chemometrics. Matthias Otto. Wiley-VCH, Weinheim, alemania. 1999
b) Avanzada
b I .- De Control de Calidad y quimiometria en Quimica Analitica general
Quality Control in Analytical Chemistry. Kateman, G. Buydens, Wiley Interscience. New
York 1993. Una de las obras mas completas y pragmaticas cubriendo todos los aspectos
teoricos y practicos relativos a Ia quimiometria y el control de calidad
Chemometrics. Data Analisis for the laboratory and chemical plant. R.G. Brereton. Wiley
New Cork, 2003
Handbook of Chemometrics and Qualimetrics.Vol 20 A : D.L. Massart, B. Vandeginste, L.
Buydens, S. DeJong, P. Lewi & J. Smeyers-Verbeke. (1997) Vol20 B: B. Vandeginste, D.L.
Massart, L. Buydens, S. DeJong, P. Lewi & J. Smeyers-Verbeke. (1998) Elsevier. El texto de
referenda mas complete y serio de quimiometria.
b2.- Acerca de los rudimentos de las distribuciones de probabilidad y su aplicaci6n en el diseno de
experimentos (ANOVA y otras tecnicas):
Estadistica para Investigadores. Box, G.E.; Hunter, W.G.; Hunter J. S. Ed. Reverte, Madrid
1989. Todo un clasico
Disefio y analisis de Experimentos. D. Montgomery, Iberoamerica. Mexico 1991. Otro clasico
b3.- Acerca de la calidad y su aplicaci6n allaboratorio analitico
Garantia de Calidad en los laboratorios analiticos. R. Compafio, A. Rios. Ed. Sintesis, Madrid,
2002
La calidad en los laboratorios analiticos. M. Valcarcel, A. Rios. Ed. Reverte, Madrid 1992
Principios de Quimica Analitica. M. Valcarcel. Ed. Springer Iberica, Barcelona 1999
b4.- Manuales practicos de garantia de calidad en ellaboratorio
Laboratory Quality Assurance System. T. A. Ratliff. Wiley Interscience. New Cork, 2003
A primer Good Laboratory Practice and current Good Manufacturing Practice for Analytical
Laboratories. L.Huber. Agilent Technologies. Germany 2003.
Guidelines for achieving quality in trace analysis. Ed. Por M.Sargent and G. Mackay, RSC
1995
b5.- Validaci6n de metodos analiticos
Validation and qualification in Analytical Laboratories. L. Huber. www.labcompliance.com
Development and validation of analytical methods. Ed. Por Riely, C.M.; Rosanske, T.W.;
Pergamon Press 1996. Dedicado particularmente al analisis farmaceutico.
Guidance for Industry. Bioanalytical Method Validation. US Dep.. of Health and Human
Services. www.fda.gov/cvm
b6.- Otros libros de interes
Estadistica aplicada a traves de Excel. C. Perez. Pearson Educacion, Madrid, 2002. Es un libra
practico acerca del manejo de Excel.
General Principles of Good Sampling Practice. Ed. N.T.Crosby y I. Patel. RSC, 1995.
Contiene una serie de cuestiones practicas acerca del disefio e implantacion de un plan de
muestreo.
Manual de estadistica para quimicos. E.L. Bauer. Alhambra, 1974. Un autentico incunable de
estadistica para quimicos. Una joy ita
Information Theory in Analytical Chemistry. K.Eckschlager y D.Danzer. Wiley Interscience,
New York, 1994 Una obra para reflexionar acerca del significado de los procesos de medicion
en Quimica Analitica.
111
DEFINICIONES DE CALIDAD
112
Metodos
Departamentos
Filosofia
Primitiva
Detectar
defectos,
uniformidad
Estandares de
nonnas,
inspecciones
Inspeccion
La calidad se
comprueba
Control
Uniformidad
optima
Tecnicas
estadisticas
Produccion
La calidad se
controla de
forma optima
Aseguramiento
Prevenir
desviaciones
estudiando el
sistema
Programas y
sistemas de
aseguramiento
de Ia calidad
Departamento de
calidad/ Todos
los
departamentos
La calidad se
produce
Competitividad/
satisfaccion
optima
necesidades
cliente
Planificacion
Estrategica.
Movilizacion
organizacion
Gerencia/todos
los miembros de
Ia organizacion
La calidad se
gestiona
Gestion
GARANTIA DE LA CALIDAD
113
!liil
!liil
I Suministradores I
Materias primas
Instrumentos
Maquinaria
Reactivos etc
Calidad externa
Empresa
(o laboratorio)
IClientes I
Personal
Instalaciones
Equipos
Procesos
Producto o servicio
(que satisface las
necesidades del cliente
Calidad interna
Calidad externa
01
114
La responsabilidad es de unos
La responsabilidad es de todos
pocos
7
lnstalaciones y equipos
Mantemmiento
Verijicacion!CalibraciOn
PROCESOS
FomJacion/Cualificacion
l:.-n~~~~~N-..):
j
Procedimientos
Instrucciones
Organizaci6n
("''AiiD1Toilis--:
!
\ ...........R~.&i.!!.trQ~ __________./
Internas
t...........~J>t~M.......... )
115
Procedimientos e
instrucciones tecnicas BPLs
Plan de Evaluaci6n de
Ia calidad
- Procedimientos de analisis
- Procedimientos de
calibraci6n
- Procedimiento de control
de calidad
Auditorias intemas
Auditorias extemas
Sistema de revision del
program a
9
CONCEPTO DE NORMALIZACION
Actividad consistente en la elaboracion, difusion y aplicacion de normas
con el objeto de:
1. Adaptar los productos, procesos y servicios a sus respectivas fmalidades
2. Evitar las barreras tecnicas a las transacciones comerciales
3. Facilitar la cooperaci6n tecnol6gica entre organismos y paises
4. Proteger la salud de las personas y animales y preservar el medio
ambiente
CONCEPTO DE NORMAS
Documentos que contienen especificaciones tecnicas de aplicacion
voluntaria, que son elaborados por consenso entre las partes interesadas
(fabricantes, administracion, consumidores, universidades y centros de
investigaci6n, asociaciones profesionales), son aprobados por un
organismo de normalizaci6n reconocido y estan a disposicion del publico
10
116
11
Organismos de N ormalizaci6n
FUNCION: Elaborar, revisar, aprobar y difundir normas
Organismos Nacionales
AENOR
Espana
AFNOR
Francia
ANSI
USA
BSI
UK
DIN
Alemania
sec
Canada
Normas UNE
NormasDIN
Organismos Supranacionales
CEN
ISO
ASTM
Europa
NormasEN
Normas ISO
USA
12
116
rnr11 i llos,
cl~
Unidz:dt:=!
c:'JaluaciC.n de k~ ]u.boratorios.
de ~m:<t~o
1]
A.FI\OR
r-
.\N:O.I
f-n~r
U:l
L'IJiaftD
N~:rn:ul i~ari:m
rr.mc:ia
USA
UK
Df.'tf
l'cUU;.;.;Jt.:~~
sec
~tnn1Htlh
~OJll]Bti ~
."tleuuun.a.
Cuw::.c:l DfCtrm:..i~
<:nr.,;;Jt.
>Jom1f..> I )IN
r!U..~:l\'1
--
N:mr::ni:!'-:'
ISO
A5T~~
1=.! IJ:-&I!t.:~~,
Norm.<lsiSO
tL:o.:ru;;:w't
USA
12
117
Certificaci6n/Acreditaci6n
Certificacion: Proceso en el que un organismo independiente, mediante unos
procedimientos de evaluacion y verificacion, declara formalmente que un producto, un
proceso o un servicio, debidamente identificado, satisface unos requerimientos
perfectamente especificados (a menudo regulados por norma; en este caso reconocimiento
de Ia conformidad a una norma)
Acreditacion: Procesos en el que un organismo autorizado, mediante unos procedimientos
de evaluacion y verificacion, reconoce formalmente que una entidad es competente para
realizar unas tareas perfectamente especificadas.
l,Quien certifica?
l,Quien acredita?
En Espana: ENAC
13
Certificaci6n/Acreditaci6n
Certificaciones
Productos
Servicios
Sistemas de la calidad
Sistemas de gesti6n
medioambiental
Personas
Marcado CE segllil directivas
europeas
(campo voluntario)
Acreditaciones
Laboratorios de ensayo o calibraci6n
Entidades de certificaci6n
Entidades de inspecci6n
(instalaciones electricas, instalaciones
frigorificas, lTVs, ... )
Verificadores medioambientales
(segllil criterios UE 761/2001)
Laboratorios de ensayo que realizan
estudios en entomos regulados por
Buenas Pnicticas de Laboratorio
(campo ob/igatorio)
14
118
119
ISO 9000
UNE-EN ISO 9000:2000 Sistemas de gesti6n de la calidad.
Fundamentos y Vocabulario
UNE-EN ISO 9001:2000 Sistemas de gesti6n de la calidad. Requisitos
- Bloque 1: Responsabilidad de Ia direccion
- Bloque 2: Gestion de los recursos
- Bloque 3: Realizacion del producto (enfasis en Ia definicion y gestion
de los procesos, desde identificacion de requisitos del cliente basta
compras)
- Bloque 4: Medicion, analisis y mejora (evaluacion de Ia satisfaccion
del cliente, auditorias ...)
17
Certificaci6n
18
120
Documentos reguladores
Regulaciones FDA: http://www.fda.gov
Directivas europeas: http://dg3.eudra.org
Guias ISOIIEC, guia 25: Requisitos generales para la competencia de
los laboratorios de calibraci6n y ensayo. 1990, 56, CH-1211 Geneve
20. Switzerland. (Se puede adiquirir on line en http://www.iso.ch) Este
es el documento basico reconocido intemacionalmente para la
ACREDITACION de laboratorios. Norma ISOIIEC 17025
20
121
1908
1930
1931
1940
Contraste t
TestF
Diagramas de Shewhart
Sistemas de calidad industrial
Nuevos panimetros de control de
la informacion analitica 1970's
F ormaci6n de la Chemometrics
Soci (1972)
21
)l>
)l>
)l>
};>
};>
)l>
};>
22
122
23
24
123
Actividades:
Mantener una copia del programa de estudios en marcha y de todos los
protocolos de los estudios de los que es responsable
Inspeccionar los estudios a intervalos adecuados, manteniendo informes
escritos adecuados de cada inspecci6n
Remitir periodicamente a la gerencia y al director del estudio informes del
estado de los estudios, problemas detectados y acciones correctoras
Determinar si las desviaciones observadas de los PNTs se realizaron de
forma adecuada
Auditar el equipo de laboratorio y los informes del director
25
'
Incluyen
Operaciones de inspecci6n, limpieza, mantenimiento y calibraci6n
rutinaria de equipos
Acciones que deben tomarse en caso de fallo
Metodos de analisis
Defmici6n de los datos base
Cualificaci6n del personal
26
124
Titulo
Nfunero
Distribuido a/departamento
Numero de revisi6n
PNT al que reemplaz
+--+---1
..-----~:;------;--l
Sello empresa
Obj<ti"
Escrito por:.............................. ..
Aprobado por.. ........................ .
Revisado por........................... ..
Pagina 1 de X
Firmas
+---1---
N paginas
27
~l'l'P<m ~
ln<:
~rr.hivn<:
28
125
Equipos
deben ser del disefio y capacidad apropiados para cumplir con la funcion
asignada, y deben estar en un lugar adecuado para asegurar su funcionamiento,
supervision, limpieza y mantenirniento. Debe pasar un proceso de validacion.
Conduccion de un estudio GLP
cada estudio debe tener un protocolo escrito antes de su comienzo. Cualquier
cambio justificado debeni estar documentado y autorizado por el director.
Las muestras se identificaran adecuadamente, los datos se registraran directa y
nipidamente en tinta, y cada set debe ir fechado y firmado. Cualquier
correccion debe no oscurecer el original e ir tambien fmnada.
2':.1
Validacion
Defmicion general
Evaluacion de procesos, productos o metodos de analisis para verificar que
cumplen los requisitos establecidos
Defmicion especifica para metodos de analisis
Proceso basado en estudios sistematicos de laboratorio mediante el que se
pone de manifiesto que un metodo analitico determinado posee unas
caracteristicas de funcionamiento adecuadas a la aplicacion que se le quiere
dar
"Que debe validarse?
Los equipos, el software, los sistemas, los metodos y los datos
validacion del equipo y software: chequeo de acuerdo a las especificaciones
documentadas
validacion de metodos: determinacion de las caracteristicas analiticas del
metodo
sistema analitico (instrumento, computador y metodo), test de verificacion
datos: verificar la recepcion, archivado y almacenamiento de los datos, para
garantizar su consistencia, integridad y trazabilidad
personas. V erificar que tienen la formaci on y experiencia adecuada
estandares. V erificar pureza, identidad, concentracion y estabilidad
30
126
Validaci6n
L,Cuando?
Instrumentos: antes del uso en rutina, despues de reparaciones y a intervalos
de tiempo regulares
Ordenadores y software: durante la instalaci6n, antes y durante uso de rutina y
(chequeo de idoneidad)
~ Operaciones de control
~================~
Si el control indica resultados
defectuosos
(chequeo de va/idaci6n)
Validaci6n minima:
Validaci6n parcial:
Identificaci6n problema y
chequeo de validaci6n
32
116
rnr11 i llos,
cl~
Unidz:dt:=!
c:'JaluaciC.n de k~ ]u.boratorios.
de ~m:<t~o
1]
A.FI\OR
r-
.\N:O.I
f-n~r
U:l
L'IJiaftD
N~:rn:ul i~ari:m
rr.mc:ia
USA
UK
Df.'tf
l'cUU;.;.;Jt.:~~
sec
~tnn1Htlh
~OJll]Bti ~
."tleuuun.a.
Cuw::.c:l DfCtrm:..i~
<:nr.,;;Jt.
>Jom1f..> I )IN
r!U..~:l\'1
--
N:mr::ni:!'-:'
ISO
A5T~~
1=.! IJ:-&I!t.:~~,
Norm.<lsiSO
tL:o.:ru;;:w't
USA
12
127
6Que validar?
Panimetro de calidad
IJrxactitud
Precision
Cualitativo
~ -..,
r!Jmite de detecci6n~
Linealidad
......
fis1co-qu m1cos
X
X
~
Especificidad/selectividad
Limite de cuantificaci6n
Inercia (robustez)
~
,;:
Incertidumbre
Anallsis ae
trazas
X
Cuantitativo
00
x~am~tros
X
X
X
X
34
128
()
a-d,_@
J~~~ Resultado
~ pesta~ p:~_::o;J~
Alicuota
muestra
Balanza
calibrada
Muestra
d
Alicuota
d"d
Q ---Masa --<::"!;:
Analito
patron
~~ Alicuota
med1da
35
Reoptimizaci6n
Cambio metodo
UsoS.I.
no
L---------+1 proporcionales
(efectos de matriz y otros)
129
37
38
130
Recuperaci6n
Muestra
Muestra
+~
1
1
1
1
Disoluci6n
conteniendo ~
Muestra
preparada
I._
Incren1ento
ill~
~s
Recuperaci6n = ~siS 6
39
r1
10 mL agua +
100 o 900 ng
Muestra
preparada
1
Disoluci6n conteniendo
100 o 900 ng
II .
Incremento
ill~
Recuperaci6n = ~siS 6
Metodo SPE:
bajo nivel: 83%
Alto nivel: 85%
~s
Metodo SPME:
bajo nivel: 5%
Alto nivel: 7 %
40
131
41
EFECTOS MATRIZ
Rel. S/C esperada en muestras
V ariabilidad entre muestras
Recta de calibrado
con estandares
Concentraci6n
42
132
Recuperaci6n de Sefial
Muestra
Recta de calibrado
(pasa por origen)
Muestra
+Ca
1
1
Incremento ~s
sefial
concentraci6n
I Recuperacion = CiCa
Muestra preparada
Recta de calibrado
43
Creal o
afiadida
(ng/mL)
Sefial
Calibrados
Sefial
Adici6n
estandar
1,175
0,1
0,253
1,423
0,3
0,75
1,8
0,6
1,453
2,6
0,9
1,992
3,284
1,2
2,856
44
133
C (muestra)
ng/mL
C (dopada)
ng/mL
Adicionado
determinado
Adicionado
real
5,4
19,4
12
14
7,8
20,8
14
13
1,2
16,2
13
15
19,4
30,4
14
11
46
59
12
13
9,3
25,3
15
16
Un simple test por parejas comparando las concentraciones adicionadas, real y determinada, da
los siguiente resultados: media diferencias=0,33; desviaci6n diferencias=1,97; t=0,42; no
significativo
45
Materiales de referencia
Material o sustancia que tiene una o varias de sus propiedades suficientemente
bien establecidas como para calibrar un instrumento, validar un metodo o
asignar valores a un material.
134
Evaluaci6n de Ia precision
Grado de concordancia entre los resultados de ensayos independientes obtenidos
en unas condiciones bien defmidas (IUPAC 1998, ISO 1994).
Se mide mediante una desviacion estandar.
Se distinguen tres niveles de conocimiento:
-
47
7,55 0,25
7,280,09
1,81
0,27
Cebada
10,540,06
10,630,08
1,92
-0,09
Guisantes
18,200,30
17,890,10
1,69
0,31
Semilla girasol
25,950,47
26,040,11
0,32
-0,09
Harina soja
38,880,45
38,730,44
0,41
0,04
Harina carne
51,830,59
51 ,830,25
0,02
0,15
Harina pescado
71,550,52
71,480,21
0,02
Pienso delicias
27,090,20
27,050,06
0,34
0,07
Exactitud: La prueba t no muestra diferencias. La prueba t por parejas tampoco (t=1 ,54). La
regresion de los resultados de ambos metodos da como pendiente 0,99860,007 y como
ordenada en el origen 0,1260,25
Precision: La varianza ponderada para el metodo dumas es 0,155; para Kjeldahl 0,0425. El
48
cociente F (3,63) es significativo con p<0,05
135
Chequeos de idoneidad
Son pruebas sencillas que permiten asegurar que el sistema en su conjunto (reactivos,
instrumentos, operadores) estan listos para trabajar de forma adecuada. Sin no
proporcionan resultado positivo NO se puede proceder al anal isis
-
Dependen del tipo de metodo y de los puntos criticos que se hayan (o se vayan detectando)
Son pruehas que se realizan ANTES del anlilisis
Suelen consistir en el analisis en condiciones identicas a las de las muestras, de muestras
sinteticas de facil preparacion y trazabilidad
Su objetivo mas frecuente es verificar el comportamiento del sistema instrumental, y son
mas importantes y costosos cuanto mas complejo e inestable es este (GC, HPLC). En
ocasiones pueden incluir estudio de pureza de reactivos, de actividad enzimatica...
Ejemplos: Inyeccion en GC de una disolucion sintetica de concentracion conocida para
evaluar tiempos de retencion, anchura de picos y seftal
Analisis de un patron de concentra cion conocida en EAA
49
so
136
1317SO
--
-Area +lS
129SOO
+ *
125000
**
* ***
120SOO
118250
Area -3S
Nde lote
51
z
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3,0
3,1
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9
0,00
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,5000
0,4602
0,4207
0,3821
0,3446
0,3085
0,2743
0,2420
0,2119
0,1841
0,1587
0,1357
0,1151
0,0968
0,0808
0,0668
0,0548
0,0446
0,0359
0,0287
0,0228
0,0179
0,0139
0,0107
0,0082
0,0062
0,0047
0,0035
0,0026
0,0019
0,0013
0,0010
0,0007
0,0005
0,0003
0,0002
0,0002
0,0001
0,0001
0,0000
0,4960
0,4562
0,4168
0,3783
0,3409
0,3050
0,2709
0,2389
0,2090
0,1814
0,1562
0,1335
0,1131
0,0951
0,0793
0,0655
0,0537
0,0436
0,0351
0,0281
0,0222
0,0174
0,0136
0,0104
0,0080
0,0060
0,0045
0,0034
0,0025
0,0018
0,0013
0,0009
0,0007
0,0005
0,0003
0,0002
0,0002
0,0001
0,0001
0,0000
0,4920
0,4522
0,4129
0,3745
0,3372
0,3015
0,2676
0,2358
0,2061
0,1788
0,1539
0,1314
0,1112
0,0934
0,0778
0,0643
0,0526
0,0427
0,0344
0,0274
0,0217
0,0170
0,0132
0,0102
0,0078
0,0059
0,0044
0,0033
0,0024
0,0018
0,0013
0,0009
0,0006
0,0005
0,0003
0,0002
0,0001
0,0001
0,0001
0,0000
0,4880
0,4483
0,4090
0,3707
0,3336
0,4840
0,4443
0,4052
0,3669
0,3300
0,2946
0,2611
0,2296
0,2005
0,1736
0,1492
0,1271
0,1075
0,0901
0,0749
0,0618
@5o5)
0,0409
0,0329
0,0262
0,0207
0,0162
0,0125
0,0096
0,0073
0,0055
0,0041
0,0031
0,0023
0,0016
0,0012
0,0008
0,0006
0,0004
0,0003
0,0002
0,0001
0,0001
0,0001
0,0000
0,4801
0,4404
0,4013
0,3632
0,3264
0,2912
0,2578
0,2266
0,1977
0,1711
0,1469
0,1251
0,1056
0,0885
0,0735
0,0606
0,0495
0,0401
0,0322
0,0256
0,0202
0,0158
0,0122
0,0094
0,0071
0,0054
0,0040
0,0030
0,0022
0,0016
0,0011
0,0008
0,0006
0,0004
0,0003
.0,0002
0,0001
0,0001
0,0001
0,0000
0,4761
0,4364
0,3974
0,3594
0,3228
0,2877
0,2546
0,2236
0,1949
0,1685
0,1446
0,1230
0,1038
0,0869
0,0721
0,0594
0,0485
0,0392
0,0314
0,0250
0,0197
0,0154
0,0119
0,0091
0,0069
0,0052
0,0039
0,0029
0,0021
0,0015
0,0011
0,0008
0,0006
0,0004
0,0003
0,0002
0,0001
0,0001
0,0001
0,0000
0,4721
0,4325
0,3936
0,3557
0,3192
0,2843
0,2514
0,2206
0,1922
0,1660
0,1423
0,1210
0,1020
0,0853
0,0708
0,0582
0,0475
0,0384
0,0307
0,0244
0,0192
0,0150
0,0116
0,0089
0,0068
0,0051
0,0038
0,0028
0,0021
0,0015
0,0011
0,0008
0,0005
0,0004
0,0003
0,0002
0,0001
0,0001
0,0001
0,0000
0,4681
0,4286
0,3897
0,3520
0,3156
0,2810
0,2483
0,2177
0,1894
0,1635
0,1401
0,1190
0,1003
0,0838
0,0694
0,0571
0,0465
0,0375
0,0301
0,0239
0,0188
0,0146
0,0113
0,0087
0,0066
0,0049
0,0037
0,0027
0,0020
0,0014
0,0010
0,0007
0,0005
0,0004
0,0003
0,0002
0,0001
0,0001
0,0001
0,0000
0,4641
0,4247
0,3859
0,3483
0,3121
0,2776
0,2451
0,2148
0,1867
0,1611
0,1379
0,1170
0,0985
0,0823
0,0681
0,0559
0,0455
0,0367
0,0294
0,0233
0,0183
0,0143
0,0110
0,0084
0,0064
0,0048
0,0036
0,0026
0,0019
0,0014
0,0010
0,0007
0,0005
0,0003
0,0002
0,0002
0,0001
0,0001
0,0001
0,0000
0.29a1
0,2643
0,2327
0,2033
0,1762
0,1515
0,1292
0,1093
0,0918
0,0764
0,0630
0,0516
0,0418
0,0336
0,0268
0,0212
0,0166
0,0129
0,0099
0,0075
0,0057
0,0043
0,0032
0,0023
0,0017
0,0012
0,0009
0,0006
0,0004
0,0003
0,0002
0,0001
0,0001
0,0001
0,0000
.138
V.Ferreira
Tabla 2: Distribuci6n t de Student de dos
colas. Valores de t que dejan fuera del
intervalo central un cierto porcentaj e de
elementos de la poblaci6n
dos colas
rados lib
1
2
3
4
5
6
7
8
9
10
15
20
30
50
0,25
2,41
1,60
1,42
1,34
1,30
1,27
1,25
1,24
1,23
1,22
1,20
1,18
1,17
1,16
0,1
6,31
2,92
2,35
2,13
2,02
1,94
1,89
1,86
1,83
1,81
1,75
1,72
1,70
1,68
0,05
12,71
4,30
3,18
2,78
2,57
2,45
2,36
2,31
2,26
2,23
2,13
2,09
2,04
2,01
0,025
25,45
6,21
4,18
3,50
3,16
2,97
2,84
2,75
2,69
'2,63
2,49
2,42
2,36
2,31
0,01
63,66
9,92
5,84
4,60
4,03
3,71
3,50
3,36
3,25
3,17
2,95
2,85
2,75
2,68
0,001
636,62
31,60
12,92
8,61
6,87
5,96
5,41
5,04
4,78
4 ,59
4,07
3,85
3,65
3,50
0,05
6,31
2,92
2,35
2,13
2,02
1,94
1,89
1,86
1,83
1,81
1,75
1,72
1,70
1,68
0,025
12,71
4,30
3,18
2,78
2,57
2,45
2,36
2,31
2,26
2,23
2,13
2,09
2,04
2,01
0,01
31,82
6,96
4,54
3,75
3,36
3,14
3,00
2,90
2,82
2 ,76
2,60
2,53
2,46
2,40
0,001
318,31
22,33
10,21
7,17
5,89
5,21
4,79
4,50
4,30
4,14
3,73
3,55
3,39
3,26
una cola
rados lib
1
2
3
4
5
6
7
8
9
10
15
20
30
50
0,25
1,00
0,82
0,76
0,74
0,73
0,72
0,71
0,71
0,70
0,70
0,69
0,69
0,68
0,68
0,1
3,08
1,89
1,64
1,53
1,48
1,44
1,41
1,40
1,38
1,37
1,34
1,33
1,31
1,30
10
12
15
20
25
50
161,4 199,5 215,7 224,6 230,2 234,0 236,8 238,9 240,5 241,9 243,9 245,9 248,0 249,3 251,8
18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,41
3
4
5
6
1
6,388 6,256 6,163 6,094 6,041 5,999 5,964 5,912 5,858 5,803 5,769 5,699
16,608 5,786 5,409 5,192 5,050 4,950 4,876 4,818 4,772 4,735 4,678 4,619 4,558 4,521
4.444
5,987 5,143 4,757 4,534 4,387 4,284 4,207 4,147 4,099 4,060 4,000 3,938 3,874 3,835 3,754
15,591 4,737 4,347 4,120 3,972 3,866 3,787 3,726 3,677 3,637 3,575 3,511
5,318 4,459 4,066 3,838 3,687 3,581 3,500 3,438 3,388 3,347 3,284 3,218 3,150 3,108 3,020
15,117 4,256 3,863 3,633 3,482 3,374 3,293 3,230 3,179 3,137 3,073 3,006 2,936 2,893 2,803
10
4,965 4,103 3,708 3,478 3,326 3,217 3,135 3,072 3,020 2,978 2,913 2,845 2,774 2,730 2,637
11
12
14,844 3,982 3,587 3,357 3,204 3,095 3,012 2,948 2,896 2,854 2,788 2,719 2,646 2,601
4,747 3,885 3,490 3,259 3,106 2,996 2,913 2,849 2,796 2,753 2,687 2,617 2,544 2,498 2,401
4,600 3,739 3,344 3,112 2,958 2,848 2,764 2,699 2,646 2,602 2,534 2,463 2,388 2,341
2,507
2,241
2,790 2,707 2,641 2,588 2,544 2,475 2,403 2,328 2,280 2,178
4,494 3,634 3,239 3,007 2,852 2,741 2,657 2,591 2,538 2,494 2,425 2,352 2,276 2,227 2,124
17 14,451 3,592 3,197 2,965 2,810 2,699 2,614 2,548 2,494 2,450 2,381 2,308 2,230 2,181
2,077
18
2,035
4,414 3,555 3,160 2,928 2,773 2,661 2,577 2,510 2,456 2,412 2,342 2,269 2,191
2,141
19 14,381 3,522 3,127 2,895 2,740 2,628 2,544 2,477 2,423 2,378 2,308 2,234 2,155 2,106 1,999
20
4,351
3,493 3,098 2,866 2,711 2,599 2,514 2,447 2,393 2,348 2,278 2,203 2,124 2,074 1,966
2,759 2,603 2,490 2,405 2,337 2,282 2,236 2,165 2,089 2,007 1,955 1,842
4,034 3,183 2,790 2,557 2,400 2,286 2,199 2,130 2,073 2,026 1,952 1,871
10
12
15
20
25
50
12,22 10,65 9,979 9,605 9,364 9,197 9,074 8,980 8,905 8,844 8,751 8,657 8,560 8,501
8,381
5 110,01 8,434 7,764 7,388 7,146 6,978 6,853 6,757 6,681 6,619 6,525 6,428 6,329 6,268
6,144
4,980
18,073 6,542 5,890 5,523 5,285 5,119 4,995 4,899 4,823 4,761 4,666 4,568 4,467 4,405
4,276
7,571 6,059 5,416 5,053 4,817 4,652 4,529 4,433 4,357 4,295 4,200 4,101 3,999 3,937
3,807
9 17,209 5,715 5,078 4,718 4,484 4,320 4,197 4,102 4,026 3,964 3,868 3,769 3,667 3,604
3,472
10
3,221
Grados
1 647 8 799,5 864,2 899,6 921,8 937,1 948,2 956,7 963,3 968,6 976,7 984,9 993,1 998,1 1008,1
'
libertad
2 38 51 39,00 39,17 39,25 39,30 39,33 39,36 39,37 39,39 39,40 39,41 39,43 39,45 39,46 39,48
denomi
nador
3 117,44 16,04 15,44 15,10 14,88 14,73 14,62 14,54 14,47 14,42 14,34 14,25 14,17 14,12 14,01
4
8,813 7,260 6,599 6,227 5,988 5,820 5,695 5,600 5,523 5,461
6,937 5,456 4,826 4,468 4,236 4,072 3,950 3,855 3,779 3,717 3,621 3,522 3,419 3,355
3,027
3,891 3,728 3,607 3,512 . 3,436 3,374 3,277 3,177 3,073 3,008
2,871
13 16.414 4,965 4,347 3,996 3,767 3,604 3,483 3,388 3,312 3,250 3,153 3,053 2,948 2,882
2,744
14
6,298 4,857 4,242 3,892 3,663 3,501 3,380 3,285 3,209 3,147 3,050 2,949 2,844 2,778
2,638
15 l6.2oo 4,765 4,153 3,804 3,576 3,415 3,293 3,199 3,123 3,060 2,963 2,862 2,756 2,689
2,549
16
2,472
12
6,115 4,687 4,077 3,729 3,502 3,341 3,219 3,125 3,049 2,986 2,889 2,788 2,681 2,614
3,665 3,438 3,277 3,156 3,061 2,985 2,922 2,825 2,723 2,616 2,548
2,405
5,978 4,560 3,954 3,608 3,382 3,221 3,100 3,005 2,929 2,866 2,769 2,667 2,559 2,491
2,347
2,295
4,461 3,859 3,515 3,289 3,128 3,007 2,913 2,837 2,774 2,676 2,573 2,464 2,396
2,249
5,871
25 15,686 4,291
50
3,694 3,353 3,129 2,969 2,848 2,753 2,677 2,613 2,515 2.411
2,300 2,230
2,079
5,340 3,975 3,390 3,054 2,833 2,674 2,553 2,458 2,381 2,317 2,216 2,109 1,993 1,919
1,752