You are on page 1of 101

ESTADSTICA EN QUMICA ANALTICA

calidadbioquimica.com.ar/error.htm

Gloria Mara Meja Z

IMPORTANCIA DE LA ESTADSTICA Y LA QUIMIOMETRA EN LA QUMICA ANALTICA

Durante la realizacin de una anlisis cuantitativo es muy importante tomar en cuenta todas las variables que pueden afectar nuestro resultado, dentro de estos estn los factores provocados por los instrumentos utilizados y los errores provocados por quien maneja el material.

En el reporte de cualquier anlisis qumico, es importante tomar en cuenta este tipo de errores , hacer un anlisis de los resultados y as se podr concluir sobre l.
Gloria Mara Meja Z

Qu es estadstica? La estadstica es una coleccin de mtodos para planificar y realizar experimentos, obtener datos y luego analizar, interpretar, y formular una conclusin basada en esos datos. Es la ciencia encargada de recopilar, organizar, analizar e interpretar informacin numrica o cualitativa, de manera que pueda llevar a conclusiones vlidas.
Gloria Mara Meja Z

ESTADISTICA
DESCRIPTIVA Es la ciencia que recopila, organiza e interpreta la informacin numrica o cualitativa INFERENCIAL Es la ciencia que interpreta informacin de manera que pueda llevar a conclusiones vlidas.
Gloria Mara Meja Z

La Estadstica se utiliza como tecnologa al servicio de las ciencias donde la variabilidad y la incertidumbre forman parte de su naturaleza.
La Estadstica es la Ciencia de la Sistematizacin, recoleccin, ordenacin y presentacin de los datos referentes a un fenmeno que presenta variabilidad o incertidumbre para su estudio metdico, con objeto de deducir las leyes que rigen esos fenmenos, y poder de esa forma hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones.
Unidad 1: Estadstica Descriptiva. Arturo A. Alvarado S. (ITSY 2006)

Gloria Mara Meja Z

DATOS NO AGRUPADOS
Medidas de tendencia central
Media aritmtica Mediana Moda Percentiles (posicin)

Medidas de dispersin

Rango (amplitud) Rango intercuartlico Varianza Coef. de variacin

Unidad 1: Estadstica Descriptiva. Arturo A. Alvarado S. (ITSY 2006)

Gloria Mara Meja Z

MAGNITUD

Atributo o propiedad que puede ser medida Ejemplos de magnitudes : La longitud, la masa, concentracin de una solucin, Absortividad molar volumen de un lquido, absorbancia, etc.

MESURANDO O MEDIDA

Magnitud de un objeto especfico que estamos interesado en medir Es la determinacin experimental de la MAGNITUD

VARIABLE

Toda MAGNITUD que permite diferenciar entre si a los componentes de una poblacin

ANALSIS

Proceso que nos da una informacin fsica o qumica acerca de los componentes de una muestra

Gloria Mara Meja Z

Medidas de tendencia central


Mediana
En una serie de datos ordenados (creciente o decreciente) es la puntuacin o valor central de la distribucin estadstica

Datos no agrupados
Si el n de datos es impar: valor central Si el n de datos es par: media aritmtica de los 2 puntos centrales

Gloria Mara Meja Z

Medidas de tendencia central


Mediana
Caractersticas
Menos sensible que la media a la variacin de las puntuaciones. Se puede calcular aunque algn intervalo carezca de lmite. Ms representativa que la media cuando puntuaciones muy extremas.

Gloria Mara Meja Z

Medidas de tendencia central


Moda
Valor de la variable que ms veces se repite en una serie estadstica (mxima frecuencia) Caractersticas:
Distribuciones: Unimodales o multimodales Marca de clase (en intervalos)
Sencilla de calcular Se puede calcular si algn intervalo no tiene lmites Poco representativa

Gloria Mara Meja Z

Medidas de tendencia central


Media

Suma de todos los valores de una variable dividida por el nmero total de valores Slo en variables cuantitativas
X = xi / N

Gloria Mara Meja Z

Medidas de tendencia central


Media. Clculo
Datos no agrupados: aplicar frmula Datos agrupados
En tabla de frecuencia: Suma de todos los valores multiplicados por sus frecuencias y dividido por el n total.

X = x i fi / N

Gloria Mara Meja Z

Medidas de tendencia central


Media
Caractersticas
La media es sensible a la variacin de las puntuaciones. No se puede calcular si algn intervalo es de lmite abierto. No es recomendable si valores muy extremos

Gloria Mara Meja Z

Medidas de dispersin
Reflejan la dispersin, oscilacin de los datos, respecto al fenmeno estudiado.
Complementan las de tendencia central para la descripcin de una distribucin
Gloria Mara Meja Z

Medidas de dispersin
Amplitud o rango
Diferencia entre el valor ms alto y ms bajo de la distribucin.
Ofrece poca informacin sobre la agrupacin de los datos. Indica el campo de variabilidad. Suele acompaar a la moda.

Gloria Mara Meja Z

Medidas de dispersin
Varianza
Junto a la desviacin tpica, la que mejor expresa la variabilidad del fenmeno Media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmtica

S2 = (xi x)2 / N
Para datos agrupados:

S2 = xi2 / N x2

S2 = fi(xi x) 2 / N

S2 = fixi2 / N x2
Gloria Mara Meja Z

Medidas de dispersin
Desviacin tpica
Es la raz cuadrada de la varianza S2 = x i2 / N x 2 fixi2 / N x2

Para datos agrupados:

S2 =

Gloria Mara Meja Z

Medidas de dispersin
Varianza y desviacin tpica
Caractersticas
Ambas toman siempre valores positivos. Si todos los datos de una distribucin son iguales entre s, toman el valor 0. Slo son aplicables a variables cuantitativas
La que ms se suele usar es la desviacin tpica. Si los datos estn muy dispersos, la desviacin tpica ser muy grande.

Gloria Mara Meja Z

Medidas de dispersin
Coeficiente de variacin de Pearson
Para poder comparar la dispersin entre 2 ms variables entre s, o una misma variable en 2 ms grupos estudiados Es una medida relativa: Relaciona la media con la desviacin tpica CV = S / X . 100

Gloria Mara Meja Z

calidadbioquimica.com.ar/error.htm

Gloria Mara Meja Z

Gloria Mara Meja Z

Gloria Mara Meja Z

Gloria Mara Meja Z

Gloria Mara Meja Z

DISTRIBUCIO DE FRECUENCIAS
En una distribucin de datos estos pueden estar o no agrupados.
DATOS NO AGRUPADOS EN INTERVALOS: DATOS AGRUPADOS EN INTERVALOS: SUPUESTO DE CONCENTRACION EN EL PUNTO MEDIO (Xi):

n
Xi 4 3 2 1 0 ni 1 3 7 6 3
ni 1 3 7 6 3

X i i n

n i Xi n

Xi 18-20 15-17 12-14 9-11 6-8 3-5


PM*ni 380 480 780 400 210 80 2330 2330/200=

ni 20 30 60 40 30 20

Xi 4 3 2 1 0

mitjana=

Xi*ni 4 9 14 6 0 33 33/5=

6,6

Xi 18 20 15 17 12 14 9 11 6 8 3 5

ni 20 30 60 40 30 20

P. M. 19 16 13 10 7 4 mitjanna=

Gloria Mara Meja Z

11,65

CUANDO ELEGIR LA MEDIANA EN LUGAR DE LA MEDIA?:

1. CUANDO LA VARIABLE ESTE MEDIDA EN UNA ESCALA ORDINAL.

2. CUANDO HAYA VALORES EXTREMOS, PUES ESTOS DISTORSIONAN LA INTERPRETACION DE LA MEDIA. EJEMPLO: 3,4,8,5,6,124 Media=25

LA MEDIA ES MUY SENSIBLE A LAS PUNTUACIONES EXTREMAS

3. CUANDO HAYA INTERVALOS ABIERTOS, YA QUE ESTOS CARECEN DE PUNTO MEDIO.

Gloria Mara Meja Z

LAS TRES MEDIDAS DE TENDENCIA CENTRAL COINCIDEN CUANDO LA DISTRIBUCION ES UNIMODAL Y SIMETRICA (EJEMPLO: DISTRIBUCION NORMAL).

CUANTO MAS ASIMETRIA, MAS DIFERENCIAS ENTRE ELLAS.

Gloria Mara Meja Z

La distribucin normal
f(X)

Media Mediana Moda

Datos simtricos: coinciden la media, la mediana y la moda


Gloria Mara Meja Z

Propiedades de la distribucin normal:


El rea bajo la curva aproximado del promedio a ms o menos una desviacin estndar (1) es de 0.68, a ms o menos 2 es de .0 95 y a ms o menos 3 es de 0.99.

Gloria Mara Meja Z

(Las propiedades continuan en la prxima lmina)

Propiedades de la distribucin normal:


La forma de la campana de Gauss depende de los parmetros y . Tiene una nica moda que coincide con su media y su mediana. La curva normal es asinttica al eje de X. Es simtrica con respecto a su media . Segn esto, para este tipo de variables existe una probabilidad de un 50% de observar un dato mayor que la media, y un 50% de observar un dato menor.

Gloria Mara Meja Z

En resumen
Podemos concluir que hay una familia de distribuciones con una forma comn, diferenciadas por los valores de su media y su varianza. La desviacin estndar ( ) determina el grado de apuntamiento de la curva. Cuanto mayor sea el valor de , ms se dispersarn los datos en torno a la media y la curva ser ms plana. La media indica la posicin de la campana, de modo que para diferentes valores de la grfica es desplazada a lo largo del eje horizontal. De entre todas ellas, la ms utilizada es la distribucin normal estndar, que corresponde a una distribucin de media 0 y varianza 1.
Gloria Mara Meja Z

ERRORES EN LOS ANALISIS QUIMICOS


Es imposible efectuar anlisis qumicos totalmente libres de errores o incertidumbres. La fiabilidad de un resultado se analiza de diferentes maneras Se analizan patrones de composicin conocida Se aplican pruebas estadsticas a los datos
Gloria Mara Meja Z

En ciencias e ingeniera, el concepto de error tiene un significado diferente del uso habitual de este trmino. Coloquialmente, es usual el empleo del trmino error como anlogo o equivalente a equivocacin. En ciencia e ingeniera, el error, est ms bien asociado al concepto de INCERTEZA, INCERTIDUMBRE, en la determinacin del resultado de una medicin.

Gloria Mara Meja Z

ERROR: es la medida del sesgo en el resultado de una medicin.


INCERTIDUMBRE: es el intervalo o rango de los valores posibles de una medida. Incluye tanto los errores sistemticos como aleatorios. La incertidumbre de un resultado es bien diferente de la precisin, sta da una medida del error aleatorio.

Error: Es la medida del sesgo en el resultado de una medicin Incertidumbre: Es el intervalo o rango de los valores posibles de una medida. Incluye tanto errores aleatorios como sistemticos La incertidumbre de un resultado es bien diferente de la precisin, sta da una medida del error aleatorio. Ms precisamente, lo que procuramos en toda medicin es conocer las cotas (o lmites probabilsticos) de estas incertezas.
Gloria Mara Meja Z

Errores
Groseros o accidentales Son errores que son tan importantes que no existe alternativa real que abandonar el experimento y empezar de nuevo por completo.
Sistemticos Provocan que todos los resultados sean errneos en el mismo sentido, son demasiado grandes, y se denomina tambin sesgo de la medida. Este tipo de error es responsabilidad del material empleado y de su origen y presin de fabricacin.

Aleatorio Estos provocan que los resultados individuales difieran uno del otro de manera que caigan a ambos lados del valor medio. Estos errores afectan la precisin de un experimento. Este tipo de errores son los que comete el operador del instrumento utilizado.

Gloria Mara Meja Z

Sistemticos
Determinados: Posibles de evitar y o de corregir. Pueden ser constantes como pesar en una balanza descalibrada, o variables.

Aleatorios
Indeterminados: A menudo se llaman accidentales. Estos errores se evidencian por pequeas diferencias en mediciones sucesivas. Gloria Mara Meja Z

Errores experimentales
Error absoluto.Nos indica si medimos u obtuvimos mas o menos que el valor experimental, y en qu cantidad excedimos del valor real o qu cantidad nos falt; esto segn el signo de la sustraccin.
EA = valor experimental valor terico

Error relativo.- Es una forma de conocer el porcentaje


de error que obtuvimos en nuestros resultados.
ER = (valor experimental valor terico) x 100 (valor terico)

Gloria Mara Meja Z

Los errores presentes en un estudio analtico modifican:

Precisin Es el grado de confianza con que se puede repetir un experimento y este puede dar los mismo resultados. Es utilizado como sinnimo de repetitibilidad.

Exactitud
Es el grado de concordancia entre el resultado de un ensayo y el valor de referencia aceptado.
Gloria Mara Meja Z

TERMINOS IMPORTANTES
Media, Media aritmtica y promedio (X) son trminos sinnimos. Es la medida de tendencia central mas utilizada .Se obtiene dividiendo la suma de los valores de una serie y dividiendo por el numero de medidas del conjunto.

Mediana es el resultado alrededor del cual se reparten los dems por igual. Si la serie es un numero impar la mediana es el numero de la mitad. Si la serie es un numero par se toma el promedio del par central despus de haber ordenado la serie de menor a mayor.

TERMINOS IMPORTANTES
Ejemplo: calcular la media y la mediana de 10.06, 10.20, 10.08, 10.10.
Media = X =10.06+10.20+10.08+10.10 = 10.11

4 Mediana = 10.08 +10.10 = 10.09 2

Gloria Mara Meja Z

CIFRAS SIGNIFICATIVAS Es el numero necesario de dgitos para expresar los resultados de una medicin congruente con la precisin de medida.
237 : 2 centenas, 3 decenas y 7 unidades

El numero de cifras significativas incluye todos los dgitos que se conocen mas el primer digito incierto.
Gloria Mara Meja Z

El numero de cifras significativas en una medicin es independiente de la colocacin del punto decimal.

Por ejemplo el numero 92.067: Este numero tiene cinco cifras significativas independiente dondese coloque el punto decimal. En este caso el cero si es una cifra significativa.

En el numero 727.0 el cero no se usa para localizar el punto decimal es significativo Gloria Mara Meja Z

Ejemplos:

0.216
90.7

Tres Cifras significativas.


Tres cifras significativas.

800.0
0.0670

Cuatro cifras significativas.


Tres cifras significativas

Gloria Mara Meja Z

TERMINOS IMPORTANTES
Precisin.
El trmino precisin describe la reproducibilidad de los resultados y se puede definir como la concordancia que hay entre los valores numricos de dos o ms mediciones que se han realizado de idntica manera.

La precisin slo depende de la distribucin de los errores aleatorios y no se relaciona con el valor verdadero ni con el valor especificado.
Gloria Mara Meja Z

PRECISION
Para describir la precisin de un conjunto de datos repetidos se utilizan tres trminos muy conocidos: La desviacin estndar, la varianza y el coeficiente de variacin.

Gloria Mara Meja Z

La desviacin estndar (DS/DE) es una medida de dispersin usada en estadstica que nos dice cunto tienden a alejarse los valores puntuales del promedio en una distribucin.
Asi la varianza es la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmtica de la distribucin. Aunque esta frmula es correcta, en la prctica interesa realizar inferencias poblacionales, por lo que en el denominador en vez de n, se usa n-1
Gloria Mara Meja Z

TERMINOS IMPORTANTES
METODOS ABSOLUTOS PARA EXPRESAR LA PRECISION

Desviacin estndar S=

Xi-X n-1
es la diferencia

Desviacin respecto a la media


numrica entre un valor experimental y la media

Varianza: S2 Coeficiente de variacin. C.V = S/Media *100

Gloria Mara Meja Z

TERMINOS IMPORTANTES
Desviacin estndar relativa (DER) : se calcula al dividir la desviacin estndar entre la media del conjunto de datos. DER se expresa en partes por mil o en %. DER * 100% = CV. Dispersin (W): Es la diferencia entre el valor mas alto y el valor mas bajo del conjunto

Gloria Mara Meja Z

TERMINOS IMPORTANTES
EXACTITUD : El trmino denota el grado de coincidencia del resultado de una medicin con el valor verdadero o aceptado de la misma y se expresa en funcin del error. La exactitud implica una comparacin con el valor verdadero o aceptado como tal. Cuando no se conoce el valor verdadero se debe usar un valor aceptado.
Gloria Mara Meja Z

TERMINOS IMPORTANTES
METODOS PARA MEDIR LA EXACTITUD Error absoluto: Es la diferencia entre el valor experimental y el valor real. Error relativo: Es el error absoluto dividido por la cantidad medida. Ejemplo: Una muestra tiene 20.34% de Fe y un analista encuentra que es 20.44%. Error Absoluto = 20.44-20.34 = 0.10% Error relativo = 0.1/20.34 = 0.0049 = 4.9 partes por mil

Gloria Mara Meja Z

TERMINOS IMPORTANTES
En trminos generales la exactitud supone una comparacin con un valor verdadero o aceptado como tal, la precisin indica la concordancia entre las medidas que han sido realizadas de una misma forma.

Gloria Mara Meja Z

Esquema grfico para comprender la relacin entre exactitud y precisin

www.galeon.com/scienceducation/error00.htm

En C existe buena precisin, pero no buena exactitud; en A buena exactitud y precisin, y en B mala exactitud y precisin.
Gloria Mara Meja Z

Diagrama precisin y exactitud

Gloria Mara Meja Z

EVALUACION DE LOS DATOS ANALITICOS


ESTUDIANTE A RESULTADOS DE UNA TITULACION 10.08 10.11 10.09 10.10 10.12 9.88 10.14 10.02 9.80 10.21 10.19 9.79 9.69 10.05 9.78 COMENTARIO Preciso pero inexacto

Exacto pero impreciso

Inexacto e impreciso

Gloria Mara Meja Z

EVALUACION DE LOS DATOS ANALITICOS


ESTUDIANTE RESULTADOS DE UNA TITULACION COMENTARIO

10.04 9.98 10.02 9.97 10.04

EXACTO Y PRECISO

Gloria Mara Meja Z

TIPOS DE ERRORES EN DATOS EXPERIMENTALES ERRORES

Bruto
Ocurre de manera Ocasional . suele ser Grandes. Dan como resultado valores atpicos que difieren mucho de los dems.

Aleatorios

Sistemticos

- = indeterminados - = determinados -Afectan la presicion - Afectan la exactitud o la reproducibilidad o sea la proxim al valor verdadero. - Los resultados caen - Todos los resultados a lado y lado de la X son errneos en el mismo sentido.

Gloria Mara Meja Z

ERRORES DETERMINADOS O SISTEMATICOS

FUENTES DE ERRORES SISTEMTICOS Errores instrumentales: Calibraciones deficientes Errores del mtodo: Dificiles de identificar Errores personales: Descuido, Falta de atencin
Gloria Mara Meja Z

EFECTO DE LOS ERRORES SISTEMATICOS EN LOS RESULTADOS ANALITICOS


Los errores sistemticos pueden ser constantes o proporcionales
En los errores constantes el error absoluto es invariable con el tamao de la muestra ,mientras el error relativo cambia al modificar dicho tamao. Los errores proporcionales aumentan o disminuyen segn el tamao de la muestra. Con los errores proporcionales el error absoluto varia con el tamao de la muestra, en cambio el error relativo permanece constante.
Gloria Mara Meja Z

EFECTO DE LOS ERRORES SISTEMATICOS EN LOS RESULTADOS ANALITICOS Los errores sistemticos pueden ser constantes o proporcionales. En los errores constantes, el error absoluto es invariable con el tamao de la muestra, mientras en el error relativo cambia al modificar el tamao de la muestra. Los errores proporcionales aumentan o disminuyen segn el tamao de la muestra; con estos errores el error absoluto varia con el tamao de la muestra en cambio el error relativo permanece constante.
Gloria Mara Meja Z

EVALUACION DE LOS DATOS ANALITICOS


KAl(SO4)2.12H2O Al2O3 Al2O3 g tomados g Encontrados tomados con el NH3 almacenado 1 0.1077 0.1288 2 0.2154 0.2384 3 0.3231 0.3489 4 0.4308 0.4588 Diferencia Al2O3 en g Encontrados con el NH3 Nuevo 0.0211 0.1087 0.0230 0.2187 0.0258 0.3258 0.0280 0.4352 Diferencia en g

0.001 0.0024 0.0027 0.0044

Gloria Mara Meja Z

EVALUACION DE LOS DATOS ANALITICOS


Los errores ocasionados por el amoniaco envasado durante mucho tiempo fueron constantes por que se utilizo el mismo volumen y el aporte de Si fue el mismo. El NH3 del envase recin utilizado fueron muy pequeos y proporcionales al tamao de muestra.

Gloria Mara Meja Z

ERRORES ALEATORIOS
Son la principal fuente de incertidumbre en una determinacin. Muchas variables no controladas y de no fcil identificacin causan errores aleatorios. El efecto acumulativo de las incertidumbres, aunque estas sean muy pequeas, hace que las mediciones por duplicado de una serie flucten al azar.
Gloria Mara Meja Z

FUENTES DE LOS ERRORES ALEATORIOS


Los errores aleatorios obedecen una curva normal de error o curva de gauss.

meted.ucar.edu/nwp/pcu1/ensemble_es/print.htm

Gloria Mara Meja Z

meted.ucar.edu/nwp/pcu1/ensemble_es/print.htm

Gloria Mara Meja Z

Distribucin normal
Al iniciar el anlisis estadstico de una serie de datos, y despus de la etapa de deteccin y correccin de errores, un primer paso consiste en describir la distribucin de las variables estudiadas y, en particular, de los datos numricos. Un modo es con la curva de distribucin normal que muestra la frecuencia con que se repiten los datos.
Gloria Mara Meja Z

TRATAMIENTO ESTADISTICO DEL ERROR ALEATORIO


Los mtodos estadsticos permiten categorizar y caracterizar los datos, y tomar decisiones objetivas en cuanto a su calidad e interpretacin. Hay que diferenciar entre muestra y poblacin o universo. ( caso del anlisis de Ca en agua. La poblacin seria un numero de medidas muy grande cercano al infinito). Las leyes de la estadstica se dedujeron para usarlas en poblaciones. Para aplicarlas a muestras se debe hacer ajustes.
Gloria Mara Meja Z

TRATAMIENTO ESTADISTICO DEL ERROR ALEATORIO


Las curvas gaussianas se pueden representar por medio de una ecuacin que tiene la media de la poblacin , y la desviacin estndar de la poblacin . La media de la poblacin es y la media de la muestra es X.

Gloria Mara Meja Z

Gloria Mara Meja Z

Gloria Mara Meja Z

EVALUACION DE METODOS ANALITICOS


Ejemplo 2.
La N de una solucin se calculo con 4 titulaciones por separado y los resultados fueron 0.2041, 0.2049, 0.2039, y 0.2043. Calcular la X, la Mediana, El rango , La S. la desviacin relativa y el C.V. X = (0.2041+0.2049+0.2039+0.2043)/4 = 0.2043 Mediana M= (0.2041+0.2043)/2 = 0.2042 Rango R = 0.2049-0.2039 = 0.001 La desviacin relativa= Sumatoria de (Xi-X)/4=0.0003 S= 0.0004 C.V = (0.0004/0.2043)*100 = 0.2%
Gloria Mara Meja Z

Gloria Mara Meja Z

PRESENTACION DE LOS DATOS CALCULADOS

Siempre es necesario indicar el nivel de confianza de los datos. Es un rango de valores en los que con una probabilidad determinada est un valor verdadero poblacional. Generalmente son del 95% o 99%. La probabilidad de equivocarnos se llama nivel de significancia y se simboliza
Gloria Mara Meja Z

PRUEBA DE SIGNIFICANCIA
Se utiliza para comparar el resultado de un anlisis realizado por dos mtodos diferentes. Se trabaja con las X Se aplica el T de student. Plantea la hiptesis de que las dos X son iguales. La prueba T da una respuesta si o no a la hiptesis nula con cierta exactitud como del 95 o 99%
Gloria Mara Meja Z

Prueba de significancia
t = X1 X2 S n1n2 n1+n2

Si t calculado es mayor que t de la tabla entonces los dos mtodos son iguales Para poder calcular t hay que calcular primero la s de cada serie de datos

Gloria Mara Meja Z

Cuando se escoge el nivel de significacin 0,05 ( 5%), tenemos un 95% de confianza de que hemos adoptado la decisin correcta y una probabilidad 0,05 de ser falsa.

Gloria Mara Meja Z

Cmo determina si un valor es realmente un valor atpico y cmo decide si debe continuar o no con el anlisis de datos? Uno de los problemas en el anlisis de datos es manejar los valores atpicos dentro de un grupo de datos. Un valor atpico es una observacin con un valor que no parece corresponderse con el resto de los valores en el grupo de datos.

Por lo general surgen dos preguntas: 1)Es este valor realmente un valor atpico? 2)Puedo eliminar este valor y continuar con el anlisis de datos?
Gloria Mara Meja Z

DATOS ATIPICOS
Con respecto a la pregunta 2, debe saberse que las pruebas estadsticas se utilizan para identificar valores atpicos, no para retirarlos del grupo de datos. Tcnicamente, una observacin no debe retirarse a menos que una investigacin halle una causa probable para justificar esta accin
Gloria Mara Meja Z

DATOS ATIPICOS
Si en la investigacin no se encuentra una causa probable, qu debe hacerse? Un enfoque sera realizar un anlisis de datos con el valor atpico y sin l. Si las conclusiones son diferentes, entonces se considera que el valor atpico tiene influencia y esto debera indicarse en el informe. Otra opcin es utilizar estimadores rigurosos para caracterizar los grupos de datos, tal como la mediana de la muestra en lugar de la media.

Gloria Mara Meja Z

RECHAZO DE DATOS
Dos de las pruebas estadsticas utilizadas con mayor frecuencia en un grupo de datos son la prueba de Dixon y la prueba de Grubbs. La prueba de Dixon utiliza relaciones de las diferencias entre datos que parecen atpicos comparados con los valores del grupo de datos.
Gloria Mara Meja Z

RECHAZO DE DATOS
Estas tcnicas estn diseadas para detectar un nico valor atpico en un grupo de datos, y por lo tanto no son adecuadas para la deteccin de mltiples valores atpicos. Una tcnica rigurosa y amplia para identificar eficazmente mltiples valores atpicos es el procedimiento para muchos valores atpicos con generalizacin extrema de la desviacin de Student.

Gloria Mara Meja Z

DIXON
Por ejemplo, tomemos los datos 5.3, 3.1, 4.9, 3.9, 7.8, 4.7 y 4.3 Ordenando los datos: 3.1, 3.9, 4.3, 4.7, 4.9, 5.3, 7.8
El tamao de la muestra es 7, y la relacin utilizada es el espacio entre el valor atpico (7.8) y su vecino ms prximo (5.3) dividido por el espacio entre los valores ms grandes y ms pequeos en el grupo. Por lo tanto, el ndice de Dixon es: (7.8 5.3)/(7.8 3.1) = 2.5/4.7 = 0.532 Gloria Mara Meja Z

RECHAZO DE DATOS
Este valor se compara con un valor crtico de una tabla, y el valor se declara valor atpico si supera ese valor crtico. Si Dcalculado>Dtabulado se rechaza el dato

El valor tabulado depende del tamao de la muestra, n, y de un nivel de confianza elegido, que es el riesgo de rechazar una observacin vlida. La tabla por lo general utiliza niveles de baja confianza tal como 1% o 5%. Para un n = 7 y un riesgo del 5%, el valor en la tabla es 0.507. El ndice de Dixon 0.532 excede este valor crtico, indicando que el valor 7.8 es un valor atpico.
Gloria Mara Meja Z

DIXON
La prueba de Dixon se usa en un nmero pequeo de observaciones (menor a 26) y detecta elementos que se encuentren sesgados o que son extremos.
Para aplicar la prueba de Dixon se requiere de un nmero de observaciones igual o mayor a 10. En el caso que las observaciones sean menores a 10 se utiliza como valor esperado el valor de preparacin.

Gloria Mara Meja Z

GRUBBS
La prueba de Grubbs utiliza una estadstica de prueba, T, que es la diferencia absoluta entre el valor atpico, XO, y el promedio de la muestra (X) dividida por la desviacin estndar de la muestra, s. Para el ejemplo anterior, el promedio de la muestra es = 4.86 y la desviacin estndar de la muestra es = 1.48. La estadstica calculada de la prueba es:
Gloria Mara Meja Z

GRUBBS
Para un n = 7 y un riesgo del 5%, el valor tabulado es 1.938 y el TCalculado = 1.99 excede este valor crtico, indicando que el valor 7.8 es un valor atpico.

Gloria Mara Meja Z

TEST DE GRUBB PARA DATOS SOSPECHOSOS


Recomendado por las normas ISO G= Valor Sospechoso X S (Con el valor sospechoso incluido)
Si Gcalculada > Gtabulada el valor sospechoso se rechaza

Gloria Mara Meja Z

TEST Q DE DATOS SOSPECHOSOS

Aceptar o rechazar un resultado anmalo (outlier) Normalmente se producen al cometer errores o fallos en la metodologa aplicada.
Se ordenan los datos en forma creciente y se calcula Q
Q = desvo = Diferencia entre el dato sospechosos y su vecino ms cercano recorrido Diferencia numrica entre el dato de mayor valor y el de menor valor

Si Qcalculada > Qtabulada el dato se rechaza

Gloria Mara Meja Z

Ejemplo:
Al efectuar una serie de rplicas para determinar la concentracin del in sulfato en una muestra de agua para riego se obtuvieron los siguientes resultados. Determinar si la medida 6.0 es un valor rechazable.
Medida Valor 1 5.0 2 5.2 3 5.5 4 5.6 5 6.0
1. Se ordenan los datos en orden de valor decreciente 6.0, 5.6, 5.5, 5.2, 5.0 2. Se calcula Q Q= (6.0-5.6)/ (6.0-5.0) =0.40

3. Se compara Q calculado con Q tabulado para 5 medidas y un nivel de confianza del 90. Qtab=0.64 0.40<0.64, luego el valor 6.0 no es rechazable

Gloria Mara Meja Z

DESCARTE DE DATOS
1. Definir que tan grande es la Diferencia entre el valor sospechoso y los otros datos. 2. Aplicar Prueba Q. a) Ordenar los datos b) Calcular el rango c) Encontrar la diferencia entre el resultado sospechosos y su vecino mas cercano 3. Dividir la diferencia obtenida en el paso 2 entre el Rango. As se obtiene el coeficiente de descartacion Q. 4. Consultar la tabla de valores Q. Si el valor calculado es mayor que el de latabla el resultado se puede descartar con un 90% de confianza de que si se podia.
Gloria Mara Meja Z

Gloria Mara Meja Z

DESCARTE DE DATOS
EJEMPLO 4 Resultados de N de una solucin fueron 0.1014, 0.1012, 0.1019, 0.1016. Se podr descartar 0.1019? X sin el 0.1019 = 0.1014 0.1019-0.01014 =0.0005 Q = 0.1019 - 0.1016 =0.43 0.1019 0.1012 0.43 es menor que 0.76. NO SE DESCARTA
Gloria Mara Meja Z

Gloria Mara Meja Z

PRESENTACION DE LOS DATOS CALCULADOS


Un indicador de la calidad de los datos es la utilizacin de las cifras significativas. Cifras significativas: Son todos los dgitos que se conocen con certeza y el primer digito incierto. Por ejemplo 30.24 tiene 4 cifras significativas (4, el ultimo digito, es incierto)

Gloria Mara Meja Z

PRESENTACION DE LOS DATOS CALCULADOS


El cero puede ser significativo o no segn su ubicacin en el numero. Un cero rodeado por otros dgitos siempre es significativo. Los ceros al final pueden o no ser significativos. 2.0 tiene dos cifras significativas. 2000 tiene una cifra significativa. 2x103 tiene una.
Gloria Mara Meja Z

PRESENTACION DE LOS DATOS CALCULADOS


Para las sumas y las restas el resultado debe tener el mismo numero de decimales que el numero que tiene menos decimales. Cuando se suman o restan nmeros con notacin cientfica se debe expresar el resultado en la misma potencia de 10. En la multiplicacin y la divisin se debe expresar el resultado con las cifras significativas del numero que tenga menor cifras significativas.
Gloria Mara Meja Z

PRESENTACION DE LOS DATOS CALCULADOS


Redondeo de datos: Se debe aproximar al numero mayor si el ultimo es mayor de 5 y al menor si el ultimo es menor de 5. 61.555 se aproxima al numero par mas cercano . Queda 61.56 De todas maneras el resultado debe expresarse con la desviacin estndar calculada.

Gloria Mara Meja Z

OBJETIVOS DEL MUESTREO


Estadsticamente los objetivos del proceso de muestreo son: 1. Obtener el valor medio 2. Obtener una varianza que sea una estimacin de la varianza poblacional con limites de confianza validos para la media.

Gloria Mara Meja Z

VALIDACION DE METODOS ANALITICOS


Calidad de resultados
Selectividad Analito en medio de interferencias Limite de deteccin Promedio de bcos +3(desviacin) Limite de cuantificacin 5 10 L.D. Intervalo de trabajo Rango en que el mtodo es exacto y preciso. Rango lineal Exactitud. Valor de referencia Precisin Desviacin y CV

Sensibilidad Pendiente % Recuperacin. Adicin de cantidades conocidas


GRFICOS DE CONTROL.
Gloria Mara Meja Z

VALIDACION DE METODOS ANALITICOS


Curvas de calibracin Linealidad Pendiente Sensibilidad Residuales Coeficiente de correlacin

Gloria Mara Meja Z

VALIDACION DE METODOS ANALITICOS


Curvas de calibracin: Cuadrados Modelo de regresin: Y=mx+b Mnimos

Cuanto mas cercanos estn los datos a la lnea que se obtiene del anlisis por mnimos cuadrados, menores son los residuales
Gloria Mara Meja Z

VALIDACION DE METODOS ANALITICOS


Variables transformadas. Transformaciones para linearizar las funciones.

Gloria Mara Meja Z

You might also like