Professional Documents
Culture Documents
1
ERRORES Y TRATAMIENTO DE DATOS
ANALÍTICOS
Objetivos
1. Introducir al estudiante en el tratamiento de los datos analíticos, resaltando la
necesidad de trabajar con datos de calidad.
2. Aprender las fuentes y tipos de error para eliminarlos o estimarlos.
3. Aprender a estimar la incertidumbre de los resultados y el modo de presentar
los datos analíticos.
4. Mostrar la estadística como una herramienta: para el estudio de errores aleato-
rios, para rechazar resultados, establecer límites de confianza y realizar ensa-
yos de hipótesis y significación.
CONOCIMIENTOS PREVIOS
Es necesario disponer de los conocimientos generales de matemáticas (cálculo y estadística) impartidos
en asignaturas estudiadas anteriormente.
Presentación de datos analíticos: cifras Aprender la forma sencilla de indicar la incertidumbre de una
significativas medida experimental mediante las cifras significativas y la
forma de redondear los resultados de los cálculos.
Tratamiento estadístico de los datos expe- Entender la aplicación de la estadística a los datos experimen-
rimentales tales y su uso en la estimación de los errores aleatorios o in-
determinados.
En Química Analítica los datos están constituidos por medidas de propiedades, siendo el objetivo final de
las medidas comprender mejor los problemas y tomar mejores decisiones. Sin embargo, la medida de
cualquier propiedad de la materia está sujeta a cierto grado de incertidumbre, no conociéndose el verdade-
ro valor de la magnitud. Por ello, es necesario aplicar cuidadosamente una técnica de medida, para obte-
ner una estimación de la magnitud que sea satisfactoria para el propósito que se pretende, y después, es-
tablecer su incertidumbre.
La fiabilidad de la estimación de la magnitud se debe basar, en:
La experiencia acumulada sobre la técnica de medida, y
La concordancia con resultados obtenidos utilizando materiales de referencia certificados o aplican-
do otros métodos.
En cualquier caso, es necesario cierto conocimiento sobre el error o errores asociado con el resultado para
que éste resultado tenga validez.
Los errores se originan en los tres componentes implicados en cualquier análisis: observador, sistema bajo
estudio e instrumentación utilizada. Entre ellos hay interrelación y se ven también afectados por el ambien-
te (temperatura, presión, composición, etc.).
El término error suele descri-
bir la diferencia entre el valor En general, el término error suele describir la diferencia entre el valor verdadero o esperado y el
verdadero o esperado y el obtenido.
obtenido.
Después de realizadas las medidas debe estudiarse su veracidad.
En Química Analítica es imposible eliminar los errores totalmente, pero siempre se debe poder determinar
la magnitud y orientación de esos errores, con el objeto de tener un conocimiento definido y concreto de la
fiabilidad de los resultados obtenidos.
La estadística como herramienta científica posibilita el tratamiento de los resultados analíticos para propor-
cionar información sobre la fiabilidad de estos resultados.
En los experimentos que se realizan medidas hay que considerar la precisión y exactitud. La exacti-
tud puede ser definida como la corrección de una medida o como la concordancia de las medidas
con el valor verdadero de la cantidad medida, indica la proximidad de una medida a su valor verdade-
ro, y se expresa por el error. Sin embargo, como el valor verdadero generalmente no se conoce, con
los datos obtenidos experimentalmente se toma como valor verdadero el valor más probable o se usa
un valor aceptado.
X E
, es el valor verdadero o más probable o un valor aceptado como verdadero.
El error absoluto es la diferencia entre un valor observado o medido y el valor verdadero (más pro-
Error absoluto:
bable o aceptado), es decir:
μ
μ
E = O- E=O-
El error relativo es el cociente entre el error absoluto y el valor considerado como verdadero o más
probable o aceptado.
Error relativo:
O-μ E
O-μ E ER = = 100
ER = = 100 μ μ
μ μ
El error relativo es una forma de expresión del error, más útil que el error absoluto y suele expresarse
en %, aunque también se puede expresar en tanto por 1000 (0/00). Por ejemplo, un error por defecto
del -2% o del -200/00.
A veces, se utiliza el término exactitud relativa, referido al valor medio o media aritmética expresado
como porcentaje del valor verdadero.
Universidad Nacional de Educación a Distancia 2015
7
x
Exactitud relativa = 100
μ
La precisión expresa la reproducibilidad de una medida, es decir, la concordancia entre varias medi-
La precisión expresa
das de la misma sustancia o propiedad que han sido hechas exactamente de la misma manera.
la reproducibilidad de
una medida. La precisión puede expresarse de varias maneras, mediante: la desviación promedio, el rango o in-
tervalo, la desviación estándar, la varianza, la desviación estándar relativa y el coeficiente de varia-
ción.
Ejemplo
En una metodología analítica para ajustar un equipo se realiza una medida a cada
una de las seis porciones (alícuotas) de un material de referencia que contiene
exactamente 40,00 ppm de cadmio. Los resultados obtenidos con el mismo pro-
El valor central de un conjunto de datos suele ser el más representativo y más fiable que cualquiera
de los resultados individuales. Como valor central y medida de centralización se utiliza frecuentemen-
te, la media y la mediana; aunque existen otras como la moda, media geométrica, media armónica,
etc.
La media o media aritmética o promedio se obtiene dividiendo la suma de los resultados de las
La media: medidas por el número de medidas realizadas.
N
x
N
x= i=1
i
x i
N x= i=1
N
38, 6 39, 0 39, 2 39, 6 40, 2 40, 4
x 39, 5 ppm de Cd
6
La mediana de una serie de resultados es el resultado que queda en el centro cuando se ordenan
por orden de magnitud y el número es impar. En el caso de un número de resultados par, se toma
como mediana, la media aritmética de los dos resultados centrales.
39,2 39,6
Mediana 39,4 ppm de Cd
2
La diferencia entre un valor particular y el valor medio se llama desviación de este valor, i xi x , y
cuanto más pequeñas sean las desviaciones en una serie de medidas, tanto mayor es la precisión.
Universidad Nacional de Educación a Distancia 2015
9
La desviación prome- La desviación promedio se calcula mediante el cociente de la suma, en valor absoluto, de las des-
dio: viaciones y el número total de desviaciones, es decir:
D.P. =
x -x
i
N
D.P. =
x -xi
0,57 0,6 ppm de Cd
N
N s= i=1
2
N
xi
xi i 1
N
2
N
s i 1
N 1
(x - x)
i
2
(x i - x)2
s2 = i=1 s2 = i=1
N-1 N-1
s
2
2,46 2
0,492 0,5 (ppm de Cd)
6 1
La desviación están- s
D.S.R. = 1000
dar relativa: x
s
D.S.R. = 1000 s 0,7
x D.S .R. 1000 ppt 1000 17,72 18 ppt
x 39,5
El error absoluto y el error relativo, en el ejemplo anterior planteado, serían negativos, es decir, por
defecto:
Error relativo:
39,5
Exactitud relativa x100 98, 7%
40, 00
Universidad Nacional de Educación a Distancia 2015
12
Teniendo en cuenta la imposibilidad de eliminar por completo los errores de laboratorio y sus causas, es
necesario conocer su procedencia para tratar de eliminar las causas y disminuir los errores.
Los errores, se clasifican en tres grandes grupos:
Errores aleatorios o independientes o experimentales.
Errores sistemáticos o determinados o determinables o cognoscibles.
Errores crasos o grandes o salvajes.
Los errores aleatorios Los errores aleatorios los constituyen errores fortuitos, derivados del azar y siguen las leyes de la proba-
los constituyen errores bilidad. Se estudian utilizando la teoría estadística.
fortuitos, derivados del
azar y siguen las leyes Los errores aleatorios o indeterminados o experimentales son errores que afectan a la precisión de las
de la probabilidad. medidas y pueden evaluarse mediante los parámetros de precisión.
Los errores sistemáticos se definen como aquellos que pueden ser evitados, porque tienen un origen
definido que se puede identificar. Son la causa de que todos los resultados de las medidas repetidas sean
altos o bajos. Se ponen de manifiesto realizando el análisis por métodos distintos.
Los errores sistemáti- Las fuentes de errores determinados más importantes que pueden presentarse en análisis cuantitativo
cos se definen como son:
aquellos que pueden ser
evitados, porque tienen Universidad Nacional de Educación a Distancia 2015
un origen definido que
se puede identificar.
13
o Errores causados por el equipo utilizado (instrumentales), debidos a la mala calibración de los ins-
trumentos, como las balanzas, material volumétrico, etc.
o Errores debidos a los reactivos.
o Errores personales ocasionados por la falta de habilidad del analista para realizar observaciones
con certeza.
o Errores operacionales (operativos) que tienen su origen en la inexperiencia o falta de cuidado del
analista, por ejemplo en el trasvase de líquidos.
o Errores de método (metódicos) son inherentes a las propiedades físicas y/o químicas del sistema
objeto de análisis. En análisis cuantitativo, las interferencias son una fuente de error de método. En
análisis gravimétrico, son fuentes de error la solubilidad de los precipitados o los fenómenos de pre-
cipitación. El error determinado que tiene un método analítico se denomina sesgo (bias).
Los errores determinados o sistemáticos afectan a la exactitud de los resultados, para su estimación es
necesario conocer el valor verdadero o el más probable (generalmente, con materiales de referencia).
El error total de los resultados analíticos suele estar constituido por errores sistemáticos y errores aleato-
rios. Para identificar las causas y la magnitud de estos errores es necesario el empleo de distintos proce-
dimientos.
La utilización en el laboratorio de materiales de referencia y la participación en estudios intercomparativos
con otros laboratorios son procedimientos que se emplean para identificar las causas y los errores del la-
boratorio. Estos procedimientos de control externo e interno de calidad permiten evaluar los errores siste-
máticos del laboratorio.
Los errores determinados o sistemáticos de método son difíciles de detectar, para ello se emplea el uso de
materiales de referencia, y si esto no es posible puede utilizarse otro método (análisis independientes).
Los errores determinados constantes se detectan variando el tamaño de la muestra, y los errores constan-
tes provocados por especies interferentes, mediante las determinaciones del blanco (el blanco contiene
todos los reactivos y disolventes excepto los analitos de la muestra).
Universidad Nacional de Educación a Distancia 2015
14
La Química Analítica actual tiende a buscar la mejor exactitud posible, incertidumbres pequeñas, límites
de detección cada vez más bajos, intervalos de medida amplios, y prevención de los errores debidos a
cambios en la naturaleza de la matriz y a las interferencias. Para ello se utilizan métodos analíticos bien
contrastados que han superado los estudios comparativos interlaboratorios y que se han validado anali-
zando materiales de referencia.
También, en el laboratorio es necesario aplicar continuamente los principios de aseguramiento de la cali-
dad y las herramientas de control de calidad (por ejemplo, gráficos de control) para mantener los métodos
analíticos en un buen nivel de ejecución y bajo el control estadístico.
Teniendo en cuenta la imposibilidad de eliminar por completo los errores del laboratorio y sus causas, es
más fácil reducir los que afectan a la precisión que los que condicionan la exactitud.
A veces, en el laboratorio se producen errores importantes que afectan a los resultados falseando la infor-
mación analítica buscada y, por tanto, influyendo en el prestigio del laboratorio. Las causas más frecuentes
de estos errores denominados crasos suelen ser las siguientes:
o Confusión de las muestras.
o Alteración de las muestras por conservación negligente.
o Contaminación o dilución de las muestras.
o Pérdidas accidentales de analito en alguna fase del tratamiento previo de las muestras.
o Patrones de calibración equivocados, o confusiones en las concentraciones de los mismos.
o Deriva grave o inestabilidad del equipo analítico no controlada.
o Interferencias previsibles, pero no previstas, en el campo de aplicación normal del método.
o Errores en los cálculos, especialmente los relativos a los factores de dilución.
o Control ineficaz de los tipos de análisis que realiza laboratorio y desatención a los antecedentes de
análisis similares.
o Transcripción errónea de los resultados o de sus unidades.
Universidad Nacional de Educación a Distancia 2015
15
Con un mismo equipo, cuando se representan los resultados que se obtienen y estos van aumentando en
número, se puede hacer la representación gráfica del denominado histograma que habitualmente da lugar
a la curva de distribución normal de frecuencias o curva Gaussiana (Figura 1.1). Experimentalmente se
sabe que la distribución de datos repetidos en la mayoría de los experimentos de análisis cuantitativo se
aproxima a la curva de Gauss.
Estas representaciones están caracterizadas por una medida de centralización (media) y por una medida
de dispersión (desviación estándar).
Las siguientes distribuciones normales recogidas en la Figura 1.2, tienen la misma media, pero diferentes
desviaciones estándar.
Universidad Nacional de Educación a Distancia 2015
21
Las siguientes distribuciones normales recogidas en la Figura 1.3, tienen diferentes medias e igual desvia-
ción estándar.
La curva de distribución normal o de Gauss para un conjunto infinito de datos es una curva simétrica res-
pecto al valor medio, μ, y cuanto mayor sea la desviación estándar (σ), mayor será la anchura de la curva.
La media muestral, x , y la desviación estándar muestral, s, proporcionan una estimación de los paráme-
tros poblacionales, μ y σ.
Todas las distribuciones de Gauss tienen la propiedad recogida en la Figura 1.4, se pueden establecer
intervalos de: x s ; x 2s ; x 3s donde se encuentran diferente porcentajes de resultados, o probabili-
dades de encontrar el verdadero valor, pudiéndose establecer intervalos de confianza.
A veces, en una serie de datos hay un dato discrepante, es decir, que se aleja del resto. Se debe decidir
entre rechazarlo o considerarlo de la serie de datos. En el rechazo de resultados hay que ser cuidadoso
para no rechazar datos que pertenezcan a la serie, aunque estén algo alejados. Diversos criterios y prue-
bas estadísticas se utilizan en el rechazo de resultados.
El test Q, es una prueba estadística bastante utilizada. En primer lugar se ordenan los resultados en orden
creciente de magnitud, en segundo lugar se calcula la diferencia entre el valor dudoso y el valor más pró-
ximo a él │X1-X2│, después se calcula la diferencia entre el valor más alto y el más bajo │Xmayor –Xmenor│,
incluyendo el dato dudoso, y finalmente con el cociente de las diferencias se calcula el parámetro Qexperimen-
El test Q: tal.
X1 - X 2
Q experimental =
X Mayor - X menor X1 - X 2
Qexperimental =
XMayor - Xmenor
El valor de Qexperimental se compara con un Qtabulado proporcionado por tablas, cuyo valor depende del núme-
ro de datos y del nivel de probabilidad elegido.
Se rechazará el dato dudoso si Qexperimental > Qtabulado
Ejemplo
Resolución:
8,46 8,42 0,04
Qexp erimental 0,571
8,46 8,39 0,07
Como Qexperimental (0,571)< Qtabulado (0,642), no se rechaza el dato a este nivel de probabilidad del 0,90.
En los procesos analíticos existen diversas etapas experimentales cada una de ellas sujeta a errores. El
error que afecta a un resultado final tiene dado por los errores sistemáticos y aleatorios de cada una de las
etapas. Se puede calcular el resultado final a partir de los errores que afectan a cada dato de partida.
No se propagan igual los errores sistemáticos y los errores aleatorios, por eso es importante considerar su
propagación.
La estimación del error aleatorio (estimación de la desviación estándar) de un resultado final, a partir de
otros datos experimentales, es posible utilizando unas reglas matemáticas sencillas en base a la precisión
de cada observación.
Las expresiones de estimación de los errores aleatorios (desviación estándar, sy) en el cálculo numérico de
diversas operaciones son las siguientes:
Suma o diferencia
a, b y c son variables experimentales y sa, sb, sc, sus respectivas desviaciones estándar.
Producto o cociente
2 2 2
b sy s s s
y= a → a b c
c y a b c
Potencia
sy sa
y ak → k
y a
Logaritmo
sa
y=log a → s y 0,434
a
Antilogaritmo
sy
y=antilog a → 2,303sa
y
En las sumas y en las restas, las incertidumbres absolutas son aditivas. La varianza (cuadrado de la des-
viación estándar) de una suma o diferencia de cantidades independientes, es igual a la suma de sus va-
rianzas.
Ejemplo
x
=
4
,
0
3
±
0
,
0
6
Solución:
Resolución:
x = 4,03 ± 0,06
En las multiplicaciones y divisiones, las incertidumbres relativas son aditivas y el error más probable se
obtiene por la raíz cuadrada de la suma de las varianzas relativas.
Para hallar la desviación estándar absoluta de un producto o una división, primero hay que hallar la des-
viación estándar relativa del resultado y luego multiplicarla por el resultado.
Ejemplo
Resolución:
5230 10 45,30 0,07 2369,19 s
y
100
10
La incertidumbre relativa del peso del mineral del camión, es: 0,0019
5230
0,07
La incertidumbre relativa del contenido de metal, es: 0,0015
45,30
s y 2369,19(0,0024) 5,7 Kg
Con frecuencia en muchos procesos de determinación es necesario combinar sumas o restas y multiplica-
ciones o divisiones, siendo necesario combinar las incertidumbres.
Ejemplo
2 2
0,0009 0,04
1,245 1,245 1,245±0,012
0,1000 12,45
La evaluación de la incertidumbre en el numerador (resta), será:
2 2
3,27 0,03 0,03 0,3
0,00545 0,00545 = 0,00545±0,00005
600,0 0,3 3,27 600,0
En el caso de los exponentes, esto es, cuando una cantidad está ligada a una potencia, a2, no se calcula
el error como si fuera para una multiplicación (a x a), debido a que las cantidades implicadas no son inde-
pendientes.
Para la expresión y = ak, donde el exponente está libre de incertidumbre, la desviación estándar relativa de
y, como consecuencia de la incertidumbre de a es:
Universidad Nacional de Educación a Distancia 2015
34
sy sa
k
y a
Ejemplo
Para (6,0±0,2)2
Sy 0,2
2 0,067
y 6,0
La incertidumbre absoluta es (36,0)(±0,067)=2,4
Por tanto, el resultado de la operación, (6,0±0,2)2=36±2
Así pues, la desviación estándar relativa del cuadrado de un número es el doble de la desviación estándar
relativa de dicho número, la desviación estándar de la raíz cúbica de un número es 1/3 de la desviación
estándar relativa de dicho número, y así sucesivamente.
Ejemplo
sa 0,2 x1014
a 1,8 x1014
sy 1 0, 2
0, 056
y 2 1,8
Para el cálculo de los logarítmos, es decir, y = log a (y = 0,434 ln a), la incertidumbre en y es igual a la
incertidumbre relativa en a multiplicada por 0,434. Es decir:
sa
y=log a → s y 0,434
a
Ejemplo
Resolución:
pH=-log(H+)=-log ((3,2±0,2)10-4) =
La incertidumbre relativa de (H+), es:
0,2 x104
0,062
3,2 x10 4
Sy= 0,434 (±0,062) = ±0,027
p
H
=
3
,
4
9
±
0
,
0
3
1.6. PRESENTACIÓN DE DATOS ANALÍTICOS: CIFRAS SIGNIFICATIVAS
En análisis cuantitativo las operaciones analíticas conducen a la obtención de un resultado, esto es, a un
número que representa la cantidad de analito (componente) en la muestra analizada. El resultado debería
proporcionar información sobre su fiabilidad (grado de exactitud y precisión), los procedimientos estadísti-
cos facilitan esta evaluación y junto con los materiales de referencia son imprescindibles para obtener re-
sultados de calidad. Los resultados se suelen presentar, unas veces, acompañados de los intervalos de
confianza (para un nivel de probabilidad, 0.90 ó 0,95 ó 0,99) y otras veces mediante alguna medida de
precisión (desviación estándar, coeficiente de variación, etc). Menos adecuado, aunque bastante frecuen-
te, es establecer la calidad de los resultados utilizando los criterios de cifras significativas.
Un número que expresa una cantidad está formado por cifras o dígitos. Las cifras significativas son los
dígitos del número necesarios para expresar la precisión de la medida de la que fueron obtenidos, inclu-
yendo todas las cifras ciertas y la primera incierta o dudosa. En resumen, el número de cifras significativas
es el número de dígitos necesarios para explicar los resultados de una medida conforme a la precisión de
la medida, incluye todas las cifras ciertas y la primera incierta o dudosa.
El analista debe tener en cuenta la significación de las cifras o dígitos que constituyen los datos experimen-
tales, de forma que el resultado sea verdaderamente un reflejo de la veracidad del análisis. El resultado no
puede implicar una veracidad mayor que la que corresponda a las medidas de que deriva, y, evidentemen-
te, la veracidad no debe disminuir como consecuencia de los cálculos realizados a partir de los datos expe-
rimentales.
Normalmente, cuando se mide una propiedad de la materia se hace por comparación, y las medidas llevan
consigo alguna incertidumbre. El grado de incertidumbre depende, generalmente, del sistema de medida,
del operador y, fundamentalmente, de la sensibilidad del instrumento empleado. Así, por ejemplo, si se
mide el pH de una disolución con un sistema que aprecie las décimas, la medida será incierta en ±0,01
aproximadamente, mientras que si se usa un sistema que aprecie las centésimas, puede llevarse a cabo
una medida más precisa por ser incierta en ±0,001. Una medida de pH de 5,22 realizada con el primer
equipo tiene tres cifras significativas, sin embargo, la medida realizada con el segundo equipo y expresada
como 5,233 tiene cuatro cifras significativas.
El dígito cero puede ser parte significativa de la medida o usarse simplemente para señalar el punto deci-
mal (primeras cifras del número). Cuando el número que expresa la medida contiene ceros estos pueden
ser significativos o no. Cualquier cero que se encuentre después del decimal es significativo, y como se ha
señalado anteriormente no lo es si se usa para indicar el lugar del decimal. El cero será significativo cuan-
do se encuentre entre otros números enteros distintos de cero.
Por ejemplo, en los números 5200,2 y 3825,0 con cinco cifras significativas cada uno, los ceros son signi-
ficativos. El último número podría escribirse como 3,8250x103, con las cinco cifras significativas y un expo-
nente no significativo. Sin embargo, cuando los primeros dígitos son cero y se utilizan para situar la coma
para la magnitud decimal o en factores exponenciales, no se consideran como cifras significativas. Por
ejemplo: 0,00433 = 4,33x10-3 = 433x10-5 todos tienen tres cifras significativas con diferente forma de ex-
presión.
El número de cifras significativas en una medida es independiente del lugar que ocupa el punto decimal.
Así, 22,034 mm; 2,2034 cm; 0,22034 dm y 0,022034 m, todos los números tienen el mismo número de
cifras significativas, cinco, y representan simplemente distintas maneras (unidades) de expresar una medi-
da.
En un resultado, los ceros finales deben utilizarse con cuidado porque si estos no son significativos no de-
berían ser escritos. Por ejemplo, el número de Avogadro (número de moléculas de un mol) es 6,023x1023
(cuatro cifras significativas) expresa perfectamente la precisión con que se conoce el número, sería inco-
rrecto escribirlo de otra forma.
En los datos, deben figurar las cifras significativas necesarias para que haya una incierta, y si estos son
base de cálculos, es utilizable una cifra más además de la incierta. Los dígitos o cifras se eliminan de
acuerdo con ciertas normas. Cuando la cifra siguiente a la última que hay que conservar es mayor de cin-
co, se incrementa la cifra que se conserva, en 1 (por ejemplo, 23,347 conservando cuatro cifras significati-
vas queda 23,35). Cuando la cifra siguiente a la última que se conserva es menor de cinco, la última cifra
que se retiene no sufre modificación (por ejemplo, 23,343 conservando cuatro cifras significativas queda
23,34). Cuando la cifra siguiente a la última que hay que conservar es cinco y hay cifras distintas de cero
después del cinco, la última cifra que se conserva se aumenta en uno, sea par o impar (por ejemplo,
23,3353 conservando cuatro cifras significativas queda 23,34). Cuando la cifra siguiente a la última que
hay que conservar es cinco y no hay otra cifra o sólo ceros después de cinco, la última cifra que se retiene
aumenta en uno si es impar y no se modifica si es par (por ejemplo, 23,335 o 23,3350 se convierte en
23,34 con cuatro cifras significativas; 23,345 ó 23,3450 se convierte en 23,34 con cuatro cifras significati-
vas). Esta regla es porque los números pares e impares son igualmente probables, el efecto de la regla es
que, en promedio, el dígito retenido aumenta la mitad de las veces y permanece sin cambio la otra mitad.
La incertidumbre puede ser absoluta o relativa, son dos formas posibles de expresión. La primera se ex-
presa directamente en las unidades de la medida. Por ejemplo, un peso en un granatario de 12,253 tiene
una incertidumbre absoluta de ±0,001 (un miligramo). La incertidumbre relativa se expresa en relación a la
cantidad que se mide, normalmente en porcentaje. Por ejemplo, en un volumen de 40,5 (se aprecia 0,1 ml
Universidad Nacional de Educación a Distancia 2015
39
en 405 décimas de ml), la incertidumbre relativa será de aproximadamente el 0,25%; en un peso de 0,105
g (se aprecia 1 mg en 105 mg) la incertidumbre relativa será de aproximadamente el 1%.
Las cifras significativas, además de para tratar los resultados de las medidas únicas, se utilizan también en
los tratamientos y cálculos matemáticos cuando se combinan varias cantidades medidas.
En las sumas y restas, tanto en los datos de estas operaciones como en los resultados, se conserva
el número de dígitos con respecto al término que tenga mayor incertidumbre absoluta. El redondeo se
fundamenta en el término que tiene la menor precisión absoluta.
Por ejemplo, la suma:
0,183 + 73,245 + 1,44 = se convierte en 0,18 + 73,24 + 1,44 = 74,86
En la multiplicación y división, se conservan en cada término y en el resultado las cifras suficientes
para expresar una incertidumbre relativa igual a la que tengan el término de la incertidumbre más alta
(incertidumbre más alta supone menor precisión relativa). El redondeo se fundamenta en el término que
tiene menor precisión relativa. El factor que determina la aplicación de esta regla es la precisión relativa
de los números, no el número de cifras significativas que tienen.
Ningún resultado puede ser más preciso que el dato menos preciso entre los datos originales. La preci-
sión no debe disminuir como consecuencia del cálculo.
Cuando los cálculos implican sumas/restas y multiplicaciones/divisiones, cada etapa individual deberá
tratarse separadamente.
Ejemplo:
362(661 23,54) 362(661 24) 362 x637
154,2
33,97(39,42 4,693) 33,87(39,42 4,69) 33,9 x 44,1
Suele ser recomendable retener una cifra extra en los cálculos intermedios, hasta el resultado final, y si
se utiliza calculadora, mantener todo los dígitos hasta el fin de la operación y proceder después a ex-
presar el resultado con el número correcto de cifras.
A veces, en la práctica se opera considerando que el resultado tendrá las mismas cifras significativas
que el dato con menor número de ellas. Así:
24,75 43,92 0,04200
21,97268 21,97
2,0778
Si la magnitud de la respuesta, prescindiendo del signo y de la coma que indica los decimales, es me-
nor que el dato con menor número de cifras significativas, puede expresarse el resultado con una cifra
más que las obtenidas por aplicación de la regla anterior. Ejemplo:
33,79 782
167 ,2142 167 ,2
241,7 0,6538
En las operaciones al utilizar logaritmos se conservan en la mantisa del logaritmo de cada término tan-
tas cifras como se hayan conservado en el propio término, es decir, al convertir logaritmos a antilogarit-
mo y viceversa, el número que se convierte y la mantisa del logaritmo tienen el mismo número de cifras
significativas.
La característica de un logaritmo no es cifra significativa, solamente expresa la magnitud del antilogarit-
mo, sin embargo, todos los ceros de la mantisa son significativos.
Ejemplo:
log 5322 = 3,7260 (3 es la característica del número y 7260 es la mantisa).
log 3892 x 10-2 =1,5902
log 1,18 = 0,072
antilogaritmo de -0,0084 = 0,9808 (0084 son los dígitos de la mantisa que se corresponden a las 4 cifras
significativas del número).
antilogaritmo de 0,00018 =1,0004
antilogarítmo de 4,32 = 21x103
Es habitual que en el transcurso de las operaciones, utilizando calculadoras, se presenten diversos dígitos
que no son significativos, debe tenerse especial cuidado para adecuar los resultados finales de modo que
sólo se incluyan las cifras significativas, aunque se redondee al finalizar los cálculos.
No debe olvidarse que para estimar la incertidumbre de un resultado debe utilizarse los procedimientos y
expresiones vistos anteriormente (apartado 1.5).
Ejemplo
De ordinario es suficiente redondear el resultado de modo que su incertidumbre relativa sea del mismo
orden de magnitud que la incertidumbre relativa del número de mayor incertidumbre relativa.
Universidad Nacional de Educación a Distancia 2015
43
La mayor incertidumbre relativa de los datos utilizados es 0,079%, por tanto el resultado debe redondearse
al mismo orden de magnitud. Si el resultado se redondea a 36,4, la incertidumbre relativa sería,
(0,1/36,4)x100=0,27% que está por encima de 0,079%. Si el resultado se redondea a 36,362, la incerti-
dumbre relativa sería (0,001/36,362)x100=0,0027% que está muy por debajo de 0,079%. Si el resultado se
redondea a 36,36, la incertidumbre relativa sería (0,01/36,36)x100=0,027%, del mismo orden de magnitud
que la incertidumbre relativa del número de mayor incertidumbre relativa. También se utiliza el redondeo
del número de modo que su incertidumbre relativa quede entre 0,2 y 2 veces la mayor incertidumbre relati-
va de los datos utilizados.
Así, 0,079%x2=0,158% y 0,079x0,2=0,0158%; y entre estos dos valores está la proporcionada por el re-
sultado elegido, es decir, 0,027%.
El valor medio (verdadero), μ, de los datos de una población no puede ser determinado porque requeriría
un número infinito de medidas. Por medio de la teoría estadística es posible estimar el intervalo (los lími-
tes) en el cuál se encuentra el verdadero valor medio, μ, con un determinado grado de probabilidad. El
intervalo se le denomina intervalo de confianza y los límites son límites de confianza.
Varias son las expresiones que se puede utilizar para calcular los límites de confianza:
z
LC para x
N
Esta expresión que utiliza la distribución de Gauss, es aplicable cuando se dispone de un gran número de
datos para que σ (desviación estándar poblacional) pueda ser estimado con la desviación estándar mues-
tral (s) y en ausencia de errores determinados, o cuando se conoce σ.
Cuando no se tienen buenas estimaciones de σ, hay que recurrir a la distribución t de Student. El estadísti-
co t tiende a z a medida que los grados de libertad (N-1) se hacen infinito.
La expresión para el cálculo de los límites de confianza cuando se dispone de un número reducido de da-
tos es la siguiente:
ts
LC para x
N
La Tabla 1.1 muestra los valores de t de Student para diferentes grados de libertad y probabilidad.
Ejemplo
Resolución:
Si el valor de Fcalculado es menor que el valor del tabulado se aceptaría la hipótesis nula planteada de que
no hay diferencia estadística significativa al nivel de probabilidad establecido, entre s1 y s2; mientras que si
el valor Fcalculado es mayor del tabulado, s1 es significativamente mayor que s2.
El test F se usa, tanto para establecer hipótesis de si un métodos es más preciso que otro o también si
hay diferencia de precisión entre los dos métodos. En la primera de estas aplicaciones, la varianza del pro-
cedimiento que se supone más preciso se pone siempre en el denominador y la del menos preciso en el
numerador (varianza mayor). En la segunda aplicación, la varianza mayor aparece siempre en el numera-
dor. Poniendo de este modo, arbitrariamente, la varianza mayor en el numerador, resulta menos cierta la
solución del test; así, el nivel de incertidumbre de los valores de F tabulados se duplican, pasando del 5%
al 10%.
La Tabla 1.2 recoge los valores de F teóricos en función de los grados de libertad en el numerador (en co-
lumnas) y del denominador (en filas), para un 0.95 de probabilidad.
Tabla 1.2. Valores de F teóricos en función de los grados de libertad en el numerador (en columnas) y del
denominador (en filas), para un 0.95 de probabilidad.
Grados de liber- Grados de libertad para la varianza mayor
tad para la
varianza menor 2 3 4 5 6 7 8 9 10 12 20 ∞
2 19,00 19,16 19,25 19,30 19,33 19,36 19,37 19,38 19,39 19,41 19,45 19,50
3 9,55 9,28 9,12 9,01 8,94 8,88 8,84 8,81 8,78 8,74 8,66 8,53
4 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,91 5,80 5,63
5 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,78 4,74 4,68 4,56 4,36
6 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,00 3,87 3,67
7 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,63 3,57 3,44 3,23
8 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,34 3,28 3,15 2,93
9 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,13 3,07 2,94 2,71
10 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,91 2,77 2,54
12 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,69 2,54 2,30
20 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,28 2,12 1,84
∞ 3,00 2,60 2,37 2,21 2,10 2,10 1,94 1,88 1,83 1,75 1,57 1,00
Ejemplo
Fcalculado
1,37
2
1,95
0,982
(1,37) 2
Fcalculado 3,08
(0,78) 2
Buscando en las tablas para 6 grados de libertad en el numerador y en el denominador, el valor de Ftabulado,
para un nivel de significación del 5%, es de 4,28. Comparando el valor tabulado con los valores calculados
se observa que éstos son menores y se desestima una posible hipótesis nula planteada de que la modifi-
cación tiene una precisión significativamente mayor para un nivel de probabilidad del 95%.
Si se quisiera ensayar una posible hipótesis para saber si la precisión de la segunda modificación es signi-
ficativamente mejor que la primera, tendríamos que:
Fcalculado
0,98
2
1,95
0,782
Al comparar el Fcalculado=1,95 con el Ftabulado=4,28 se establece que esta diferencia no ha sido demostrada.
Comparación de una media experimental con un valor verdadero. Un procedimiento común para
comprobar la exactitud de un método de análisis y detectar posibles errores sistemáticos, consiste en
realizar diversas determinaciones de un material de referencia suministrado por algún organismo que
certifica el valor/es del analito/s de este material. Al comparar los resultados obtenidos, se puede utili-
zar los modelos estadísticos (habitualmente t de Student o z de Gauss) para calcular la probabilidad de
que la diferencia observada entre la media obtenida experimentalmente, x , y el verdadero valor, μ (va-
lor fiable proporcionado por el material de referencia evaluado con un alto número de grados de liber-
tad por laboratorios de prestigio), se debe solamente a un error aleatorio.
Para ello, con la modificación de la expresión utilizada anteriormente para el cálculo de los límites de
confianza, se evalúa el estadístico t:
x t N
s
t calculado x
N
s
Sustituyendo en la expresión anterior los valores correspondientes de la media obtenida ( x ), la des-
viación estándar experimental (s), el número de resultados (N) y el valor dado por el material de refe-
rencia (μ) se obtiene el valor de tcalculado. Si el valor absoluto, sin considerar signo, de tcalculado., es me-
nor que el valor tabulado (valor teórico proporcionado por la distribución t de Student y dado en la tabla
anterior) no hay evidencia de error sistemático, para un determinado nivel de confianza.
Ejemplo
t calculado x
N 4
(11,65 12,35) 4,37
s 0,3205
El valor de ttabulado para el 95% de probabilidad es 3,18; menor que el valor obtenido, por tanto, a este nivel
de probabilidad se pone de manifiesto la presencia de un error sistemático en el nuevo procedimiento. Hay
un 95% de probabilidad de que la diferencia entre el valor de referencia y el valor obtenido experimental-
mente no sea debido al azar. Hay una probabilidad de equivocarse de 5 veces en cada 100.
Sin embargo, el valor de ttabulado para el 99% de probabilidad es 5,84; mayor que el valor obtenido de
tcalculado, por tanto, a este nivel de probabilidad, para no equivocarse en más de 1 vez de cada 100, debe
concluirse que no se pone de manifiesto la presencia de un error sistemático en el nuevo procedimiento, lo
cual no indica que no exista un error sistemático.
Comparación de dos medias experimentales. Para comparar los resultados obtenidos por un méto-
do analítico con los resultados de otro método distinto o para comparar si los análisis de dos materiales
permiten afirmar que los materiales son idénticos, etc., se plantea una hipótesis nula (H0) de que los re-
sultados son iguales y las diferencias observadas en los resultados son sólo debidas a errores aleato-
rios. Frente a esta hipótesis nula se plantea una alternativa (H1) que establece que los resultados no
son iguales y las diferencias observadas son debidas a errores sistemáticos.
Para tomar una decisión sobre las hipótesis estadísticas planteadas y resolver con la teoría estadística
la comparación de resultados, en primer lugar, hay que saber si la precisión de cada conjunto de datos
es significativamente igual o distinta con respecto al otro conjunto de datos.
a) Si la precisión de los conjuntos de datos que se comparan son significativamente iguales 1 2 ,
las expresiones matemáticas que se utilizan para la resolución son las siguientes:
En primer lugar se aplica la prueba F para comparar la precisión de ambos conjuntos de datos:
s12
Fcalculado 2
s2
Si el valor de Fcalculado es inferior al Ftabulado y la precisión es comparable, se calcula el valor del estadís-
tico t haciendo uso previamente de una desviación estándar combinada (sc) obtenida de los resultados
a comparar. Las expresiones que se utilizan son:
x1 x 2 x1 x 2 N1 N 2
t calculado o también t calculado
1 1 sc N1 N 2
sc ( )
N1 N 2
s12 ( N 1 1) s 22 ( N 2 1)
sc o también
N1 N 2 2
i N1 i N2
( xi1 x1 ) 2 (x i2 x2 ) 2
sc i 1 i 1
N1 N 2 2
El valor de t obtenido, mediante estos cálculos, se compara con el valor tabulado de la distribución t de
Student para N1+N2-2 grados de libertad, y al nivel de probabilidad elegido. Si el valor de tcalculado es mayor
que el tabulado, las dos series de resultados son significativamente diferentes para el nivel de confianza
considerado.
Ejemplo
Se analizaron los vagones de dos trenes que contenían un mineral de hierro con el
objetivo de determinar si su contenido en hierro era equivalente y/o si procedían de
la misma zona de explotación de la mina. Los resultados obtenidos fueron: Tren 1
(%): 42,53; 42,75; 42,62; 43,30; 43,39; 42,98; 42,56; 42,98; 42,53; 42,75. Tren 2 (%):
44,35; 44,77; 44,42; 44,51; 44,45; 44,61; 44,16; 44,35. ¿Indican los datos una diferen-
cia entre los contenidos de hierro en los trenes?
Resolución:
En primer lugar, para comparar la precisión del contenido de mineral de hierro en ambos trenes, se aplica
la prueba F:
s12 0,3142
Fcalculado 2,92
s 22 0,1842
El valor obtenido es menor que el valor tabulado, para una probabilidad del 0,95 y 9 y 7 grados de libertad
en el numerador y denominador, respectivamente (F0,95; 9; 7=3,68). Por tanto, los contenidos de hierro de
los minerales de ambos trenes tienen precisiones comparables.
Universidad Nacional de Educación a Distancia 2015
55
sc
s12 ( N 1 1) s 22 ( N 2 1)
=
0,3142 9 0,1842 7 = 0,265
N1 N 2 2 10 8 2
El valor de tcalculado será:
x1 x 2 N1 N 2 42,84 44,45 10 8
t calculado = = -12,81
sc N1 N 2 0,265 10 8
El valor de ttabulado para 16 grados de libertad (10+8-2=16), al 95% de probabilidad, es de 2,12; establecien-
do que las medias son significativamente diferentes. Incluso para el 99% el valor de t obtenido, en valor
absoluto, es superior del tabulado (2,92). Las diferencias encontradas en el análisis de uno y otro tren se
deben a errores aleatorios en menos del 1%, en definitiva el contenido en hierro de ambos trenes en distin-
to, proceden de zonas diferentes de la mina.
s12
Fcalculado
s22
Si la precisión no es comparable, es decir, las desviaciones estándar de los dos conjuntos de datos son
significativamente distintas, se calcula t mediante una expresión que tiene en cuenta las dos desviacio-
nes estándar de los dos conjuntos de datos:
x1 x 2
t calculado
s12 s 22
( )
N1 N 2
El valor de t obtenido se compara con el valor tabulado de la distribución t de Student para un número de
grados de libertad (g.l.) que es el número entero más próximo al resultado del siguiente cálculo:
s12 s 22 2
( )
N1 N 2
g .l. 2
s12 2 s 22 2
( ) ( )
N1 N2
N1 1 N 2 1
Si el valor de tcalculado es mayor que el tabulado, las dos series de resultados son significativamente diferen-
tes para el nivel de confianza considerado.
teniendo los resultados agrupados por parejas pues si se utilizan los procedimientos anteriores, las di-
ferencias de los datos de cada serie impedirían obtener conclusiones válidas.
En estos casos de comparación de grupos de datos, se utiliza la prueba t, referida a la diferencia entre
cada par de resultados de los grupos de datos.
La expresión matemática que se utiliza es:
d
t calculado N
sd
d es la media de las diferencias entre los resultados de los dos grupos, sd es la desviación estándar de
las diferencias, y N el número de pares de datos. Los grados de libertad se establecen con N-1.
Si el valor de tcalculado es menor que el de ttabulado no hay diferencia significativa entre los dos grupos de da-
tos, a un determinado nivel de probabilidad.
Ejemplo
En primer lugar, se calcula la diferencia de valores en el mismo punto de muestreo, obteniendo los resulta-
dos siguientes, di:7,48; 4,24; -2,16; 2,42; -2,11; 1,17; 3,74 y 1,54.
Seguidamente se calcula el estadístico t:
d 2,04
t calculado N= 8 = 1,80
sd 3, 2
El valor tabulado de t para una probabilidad (nivel de confianza) del 95% y 7 grados de libertad (8 pares
de valores -1=7) es 2,37. Como el valor de tcalculado (1,80) es menor del t teórico (2,37), puede concluirse que
no hay diferencia significativa entre los resultados obtenidos en las dos épocas del año, con una probabili-
dad de error del 5%.
Resolución
Problema 1.
ts 2, 9 8x0 ,10
LC x ± = 1, 6 7 ± = ±0 , 077
N 15
LC = 1,67 ± 0,077
Problema 2.
;
ts 1,96x0,1
LC = ± 0,06 = ± ;
N N
N = 11 medidas
Problema 3.
33,24 + 32,37 + 31,08
x= = 32,23
3
(0,03)2 + (0,04)2 + (0,03)2 = 0,06
32,23 ± 0,06
1.10. BIBLIOGRAFÍA
1. Skoog, D.A., West, D.M., Holler, F.J., Crouch, S.R., Fundamentos de Química Analítica, 8ª edi-
ción. Paraninfo/Thomson Learning, 2005.