Professional Documents
Culture Documents
calidadbioquimica.com.ar/error.htm
Durante la realizacin de una anlisis cuantitativo es muy importante tomar en cuenta todas las variables que pueden afectar nuestro resultado, dentro de estos estn los factores provocados por los instrumentos utilizados y los errores provocados por quien maneja el material.
En el reporte de cualquier anlisis qumico, es importante tomar en cuenta este tipo de errores , hacer un anlisis de los resultados y as se podr concluir sobre l.
Gloria Mara Meja Z
Qu es estadstica? La estadstica es una coleccin de mtodos para planificar y realizar experimentos, obtener datos y luego analizar, interpretar, y formular una conclusin basada en esos datos. Es la ciencia encargada de recopilar, organizar, analizar e interpretar informacin numrica o cualitativa, de manera que pueda llevar a conclusiones vlidas.
Gloria Mara Meja Z
ESTADISTICA
DESCRIPTIVA Es la ciencia que recopila, organiza e interpreta la informacin numrica o cualitativa INFERENCIAL Es la ciencia que interpreta informacin de manera que pueda llevar a conclusiones vlidas.
Gloria Mara Meja Z
La Estadstica se utiliza como tecnologa al servicio de las ciencias donde la variabilidad y la incertidumbre forman parte de su naturaleza.
La Estadstica es la Ciencia de la Sistematizacin, recoleccin, ordenacin y presentacin de los datos referentes a un fenmeno que presenta variabilidad o incertidumbre para su estudio metdico, con objeto de deducir las leyes que rigen esos fenmenos, y poder de esa forma hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones.
Unidad 1: Estadstica Descriptiva. Arturo A. Alvarado S. (ITSY 2006)
DATOS NO AGRUPADOS
Medidas de tendencia central
Media aritmtica Mediana Moda Percentiles (posicin)
Medidas de dispersin
MAGNITUD
Atributo o propiedad que puede ser medida Ejemplos de magnitudes : La longitud, la masa, concentracin de una solucin, Absortividad molar volumen de un lquido, absorbancia, etc.
MESURANDO O MEDIDA
Magnitud de un objeto especfico que estamos interesado en medir Es la determinacin experimental de la MAGNITUD
VARIABLE
Toda MAGNITUD que permite diferenciar entre si a los componentes de una poblacin
ANALSIS
Proceso que nos da una informacin fsica o qumica acerca de los componentes de una muestra
Datos no agrupados
Si el n de datos es impar: valor central Si el n de datos es par: media aritmtica de los 2 puntos centrales
Suma de todos los valores de una variable dividida por el nmero total de valores Slo en variables cuantitativas
X = xi / N
X = x i fi / N
Medidas de dispersin
Reflejan la dispersin, oscilacin de los datos, respecto al fenmeno estudiado.
Complementan las de tendencia central para la descripcin de una distribucin
Gloria Mara Meja Z
Medidas de dispersin
Amplitud o rango
Diferencia entre el valor ms alto y ms bajo de la distribucin.
Ofrece poca informacin sobre la agrupacin de los datos. Indica el campo de variabilidad. Suele acompaar a la moda.
Medidas de dispersin
Varianza
Junto a la desviacin tpica, la que mejor expresa la variabilidad del fenmeno Media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmtica
S2 = (xi x)2 / N
Para datos agrupados:
S2 = xi2 / N x2
S2 = fi(xi x) 2 / N
S2 = fixi2 / N x2
Gloria Mara Meja Z
Medidas de dispersin
Desviacin tpica
Es la raz cuadrada de la varianza S2 = x i2 / N x 2 fixi2 / N x2
S2 =
Medidas de dispersin
Varianza y desviacin tpica
Caractersticas
Ambas toman siempre valores positivos. Si todos los datos de una distribucin son iguales entre s, toman el valor 0. Slo son aplicables a variables cuantitativas
La que ms se suele usar es la desviacin tpica. Si los datos estn muy dispersos, la desviacin tpica ser muy grande.
Medidas de dispersin
Coeficiente de variacin de Pearson
Para poder comparar la dispersin entre 2 ms variables entre s, o una misma variable en 2 ms grupos estudiados Es una medida relativa: Relaciona la media con la desviacin tpica CV = S / X . 100
calidadbioquimica.com.ar/error.htm
DISTRIBUCIO DE FRECUENCIAS
En una distribucin de datos estos pueden estar o no agrupados.
DATOS NO AGRUPADOS EN INTERVALOS: DATOS AGRUPADOS EN INTERVALOS: SUPUESTO DE CONCENTRACION EN EL PUNTO MEDIO (Xi):
n
Xi 4 3 2 1 0 ni 1 3 7 6 3
ni 1 3 7 6 3
X i i n
n i Xi n
ni 20 30 60 40 30 20
Xi 4 3 2 1 0
mitjana=
Xi*ni 4 9 14 6 0 33 33/5=
6,6
Xi 18 20 15 17 12 14 9 11 6 8 3 5
ni 20 30 60 40 30 20
P. M. 19 16 13 10 7 4 mitjanna=
11,65
2. CUANDO HAYA VALORES EXTREMOS, PUES ESTOS DISTORSIONAN LA INTERPRETACION DE LA MEDIA. EJEMPLO: 3,4,8,5,6,124 Media=25
LAS TRES MEDIDAS DE TENDENCIA CENTRAL COINCIDEN CUANDO LA DISTRIBUCION ES UNIMODAL Y SIMETRICA (EJEMPLO: DISTRIBUCION NORMAL).
La distribucin normal
f(X)
En resumen
Podemos concluir que hay una familia de distribuciones con una forma comn, diferenciadas por los valores de su media y su varianza. La desviacin estndar ( ) determina el grado de apuntamiento de la curva. Cuanto mayor sea el valor de , ms se dispersarn los datos en torno a la media y la curva ser ms plana. La media indica la posicin de la campana, de modo que para diferentes valores de la grfica es desplazada a lo largo del eje horizontal. De entre todas ellas, la ms utilizada es la distribucin normal estndar, que corresponde a una distribucin de media 0 y varianza 1.
Gloria Mara Meja Z
En ciencias e ingeniera, el concepto de error tiene un significado diferente del uso habitual de este trmino. Coloquialmente, es usual el empleo del trmino error como anlogo o equivalente a equivocacin. En ciencia e ingeniera, el error, est ms bien asociado al concepto de INCERTEZA, INCERTIDUMBRE, en la determinacin del resultado de una medicin.
Error: Es la medida del sesgo en el resultado de una medicin Incertidumbre: Es el intervalo o rango de los valores posibles de una medida. Incluye tanto errores aleatorios como sistemticos La incertidumbre de un resultado es bien diferente de la precisin, sta da una medida del error aleatorio. Ms precisamente, lo que procuramos en toda medicin es conocer las cotas (o lmites probabilsticos) de estas incertezas.
Gloria Mara Meja Z
Errores
Groseros o accidentales Son errores que son tan importantes que no existe alternativa real que abandonar el experimento y empezar de nuevo por completo.
Sistemticos Provocan que todos los resultados sean errneos en el mismo sentido, son demasiado grandes, y se denomina tambin sesgo de la medida. Este tipo de error es responsabilidad del material empleado y de su origen y presin de fabricacin.
Aleatorio Estos provocan que los resultados individuales difieran uno del otro de manera que caigan a ambos lados del valor medio. Estos errores afectan la precisin de un experimento. Este tipo de errores son los que comete el operador del instrumento utilizado.
Sistemticos
Determinados: Posibles de evitar y o de corregir. Pueden ser constantes como pesar en una balanza descalibrada, o variables.
Aleatorios
Indeterminados: A menudo se llaman accidentales. Estos errores se evidencian por pequeas diferencias en mediciones sucesivas. Gloria Mara Meja Z
Errores experimentales
Error absoluto.Nos indica si medimos u obtuvimos mas o menos que el valor experimental, y en qu cantidad excedimos del valor real o qu cantidad nos falt; esto segn el signo de la sustraccin.
EA = valor experimental valor terico
Precisin Es el grado de confianza con que se puede repetir un experimento y este puede dar los mismo resultados. Es utilizado como sinnimo de repetitibilidad.
Exactitud
Es el grado de concordancia entre el resultado de un ensayo y el valor de referencia aceptado.
Gloria Mara Meja Z
TERMINOS IMPORTANTES
Media, Media aritmtica y promedio (X) son trminos sinnimos. Es la medida de tendencia central mas utilizada .Se obtiene dividiendo la suma de los valores de una serie y dividiendo por el numero de medidas del conjunto.
Mediana es el resultado alrededor del cual se reparten los dems por igual. Si la serie es un numero impar la mediana es el numero de la mitad. Si la serie es un numero par se toma el promedio del par central despus de haber ordenado la serie de menor a mayor.
TERMINOS IMPORTANTES
Ejemplo: calcular la media y la mediana de 10.06, 10.20, 10.08, 10.10.
Media = X =10.06+10.20+10.08+10.10 = 10.11
CIFRAS SIGNIFICATIVAS Es el numero necesario de dgitos para expresar los resultados de una medicin congruente con la precisin de medida.
237 : 2 centenas, 3 decenas y 7 unidades
El numero de cifras significativas incluye todos los dgitos que se conocen mas el primer digito incierto.
Gloria Mara Meja Z
El numero de cifras significativas en una medicin es independiente de la colocacin del punto decimal.
Por ejemplo el numero 92.067: Este numero tiene cinco cifras significativas independiente dondese coloque el punto decimal. En este caso el cero si es una cifra significativa.
En el numero 727.0 el cero no se usa para localizar el punto decimal es significativo Gloria Mara Meja Z
Ejemplos:
0.216
90.7
800.0
0.0670
TERMINOS IMPORTANTES
Precisin.
El trmino precisin describe la reproducibilidad de los resultados y se puede definir como la concordancia que hay entre los valores numricos de dos o ms mediciones que se han realizado de idntica manera.
La precisin slo depende de la distribucin de los errores aleatorios y no se relaciona con el valor verdadero ni con el valor especificado.
Gloria Mara Meja Z
PRECISION
Para describir la precisin de un conjunto de datos repetidos se utilizan tres trminos muy conocidos: La desviacin estndar, la varianza y el coeficiente de variacin.
La desviacin estndar (DS/DE) es una medida de dispersin usada en estadstica que nos dice cunto tienden a alejarse los valores puntuales del promedio en una distribucin.
Asi la varianza es la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmtica de la distribucin. Aunque esta frmula es correcta, en la prctica interesa realizar inferencias poblacionales, por lo que en el denominador en vez de n, se usa n-1
Gloria Mara Meja Z
TERMINOS IMPORTANTES
METODOS ABSOLUTOS PARA EXPRESAR LA PRECISION
Desviacin estndar S=
Xi-X n-1
es la diferencia
TERMINOS IMPORTANTES
Desviacin estndar relativa (DER) : se calcula al dividir la desviacin estndar entre la media del conjunto de datos. DER se expresa en partes por mil o en %. DER * 100% = CV. Dispersin (W): Es la diferencia entre el valor mas alto y el valor mas bajo del conjunto
TERMINOS IMPORTANTES
EXACTITUD : El trmino denota el grado de coincidencia del resultado de una medicin con el valor verdadero o aceptado de la misma y se expresa en funcin del error. La exactitud implica una comparacin con el valor verdadero o aceptado como tal. Cuando no se conoce el valor verdadero se debe usar un valor aceptado.
Gloria Mara Meja Z
TERMINOS IMPORTANTES
METODOS PARA MEDIR LA EXACTITUD Error absoluto: Es la diferencia entre el valor experimental y el valor real. Error relativo: Es el error absoluto dividido por la cantidad medida. Ejemplo: Una muestra tiene 20.34% de Fe y un analista encuentra que es 20.44%. Error Absoluto = 20.44-20.34 = 0.10% Error relativo = 0.1/20.34 = 0.0049 = 4.9 partes por mil
TERMINOS IMPORTANTES
En trminos generales la exactitud supone una comparacin con un valor verdadero o aceptado como tal, la precisin indica la concordancia entre las medidas que han sido realizadas de una misma forma.
www.galeon.com/scienceducation/error00.htm
En C existe buena precisin, pero no buena exactitud; en A buena exactitud y precisin, y en B mala exactitud y precisin.
Gloria Mara Meja Z
Inexacto e impreciso
EXACTO Y PRECISO
Bruto
Ocurre de manera Ocasional . suele ser Grandes. Dan como resultado valores atpicos que difieren mucho de los dems.
Aleatorios
Sistemticos
- = indeterminados - = determinados -Afectan la presicion - Afectan la exactitud o la reproducibilidad o sea la proxim al valor verdadero. - Los resultados caen - Todos los resultados a lado y lado de la X son errneos en el mismo sentido.
FUENTES DE ERRORES SISTEMTICOS Errores instrumentales: Calibraciones deficientes Errores del mtodo: Dificiles de identificar Errores personales: Descuido, Falta de atencin
Gloria Mara Meja Z
EFECTO DE LOS ERRORES SISTEMATICOS EN LOS RESULTADOS ANALITICOS Los errores sistemticos pueden ser constantes o proporcionales. En los errores constantes, el error absoluto es invariable con el tamao de la muestra, mientras en el error relativo cambia al modificar el tamao de la muestra. Los errores proporcionales aumentan o disminuyen segn el tamao de la muestra; con estos errores el error absoluto varia con el tamao de la muestra en cambio el error relativo permanece constante.
Gloria Mara Meja Z
ERRORES ALEATORIOS
Son la principal fuente de incertidumbre en una determinacin. Muchas variables no controladas y de no fcil identificacin causan errores aleatorios. El efecto acumulativo de las incertidumbres, aunque estas sean muy pequeas, hace que las mediciones por duplicado de una serie flucten al azar.
Gloria Mara Meja Z
meted.ucar.edu/nwp/pcu1/ensemble_es/print.htm
meted.ucar.edu/nwp/pcu1/ensemble_es/print.htm
Distribucin normal
Al iniciar el anlisis estadstico de una serie de datos, y despus de la etapa de deteccin y correccin de errores, un primer paso consiste en describir la distribucin de las variables estudiadas y, en particular, de los datos numricos. Un modo es con la curva de distribucin normal que muestra la frecuencia con que se repiten los datos.
Gloria Mara Meja Z
Siempre es necesario indicar el nivel de confianza de los datos. Es un rango de valores en los que con una probabilidad determinada est un valor verdadero poblacional. Generalmente son del 95% o 99%. La probabilidad de equivocarnos se llama nivel de significancia y se simboliza
Gloria Mara Meja Z
PRUEBA DE SIGNIFICANCIA
Se utiliza para comparar el resultado de un anlisis realizado por dos mtodos diferentes. Se trabaja con las X Se aplica el T de student. Plantea la hiptesis de que las dos X son iguales. La prueba T da una respuesta si o no a la hiptesis nula con cierta exactitud como del 95 o 99%
Gloria Mara Meja Z
Prueba de significancia
t = X1 X2 S n1n2 n1+n2
Si t calculado es mayor que t de la tabla entonces los dos mtodos son iguales Para poder calcular t hay que calcular primero la s de cada serie de datos
Cuando se escoge el nivel de significacin 0,05 ( 5%), tenemos un 95% de confianza de que hemos adoptado la decisin correcta y una probabilidad 0,05 de ser falsa.
Cmo determina si un valor es realmente un valor atpico y cmo decide si debe continuar o no con el anlisis de datos? Uno de los problemas en el anlisis de datos es manejar los valores atpicos dentro de un grupo de datos. Un valor atpico es una observacin con un valor que no parece corresponderse con el resto de los valores en el grupo de datos.
Por lo general surgen dos preguntas: 1)Es este valor realmente un valor atpico? 2)Puedo eliminar este valor y continuar con el anlisis de datos?
Gloria Mara Meja Z
DATOS ATIPICOS
Con respecto a la pregunta 2, debe saberse que las pruebas estadsticas se utilizan para identificar valores atpicos, no para retirarlos del grupo de datos. Tcnicamente, una observacin no debe retirarse a menos que una investigacin halle una causa probable para justificar esta accin
Gloria Mara Meja Z
DATOS ATIPICOS
Si en la investigacin no se encuentra una causa probable, qu debe hacerse? Un enfoque sera realizar un anlisis de datos con el valor atpico y sin l. Si las conclusiones son diferentes, entonces se considera que el valor atpico tiene influencia y esto debera indicarse en el informe. Otra opcin es utilizar estimadores rigurosos para caracterizar los grupos de datos, tal como la mediana de la muestra en lugar de la media.
RECHAZO DE DATOS
Dos de las pruebas estadsticas utilizadas con mayor frecuencia en un grupo de datos son la prueba de Dixon y la prueba de Grubbs. La prueba de Dixon utiliza relaciones de las diferencias entre datos que parecen atpicos comparados con los valores del grupo de datos.
Gloria Mara Meja Z
RECHAZO DE DATOS
Estas tcnicas estn diseadas para detectar un nico valor atpico en un grupo de datos, y por lo tanto no son adecuadas para la deteccin de mltiples valores atpicos. Una tcnica rigurosa y amplia para identificar eficazmente mltiples valores atpicos es el procedimiento para muchos valores atpicos con generalizacin extrema de la desviacin de Student.
DIXON
Por ejemplo, tomemos los datos 5.3, 3.1, 4.9, 3.9, 7.8, 4.7 y 4.3 Ordenando los datos: 3.1, 3.9, 4.3, 4.7, 4.9, 5.3, 7.8
El tamao de la muestra es 7, y la relacin utilizada es el espacio entre el valor atpico (7.8) y su vecino ms prximo (5.3) dividido por el espacio entre los valores ms grandes y ms pequeos en el grupo. Por lo tanto, el ndice de Dixon es: (7.8 5.3)/(7.8 3.1) = 2.5/4.7 = 0.532 Gloria Mara Meja Z
RECHAZO DE DATOS
Este valor se compara con un valor crtico de una tabla, y el valor se declara valor atpico si supera ese valor crtico. Si Dcalculado>Dtabulado se rechaza el dato
El valor tabulado depende del tamao de la muestra, n, y de un nivel de confianza elegido, que es el riesgo de rechazar una observacin vlida. La tabla por lo general utiliza niveles de baja confianza tal como 1% o 5%. Para un n = 7 y un riesgo del 5%, el valor en la tabla es 0.507. El ndice de Dixon 0.532 excede este valor crtico, indicando que el valor 7.8 es un valor atpico.
Gloria Mara Meja Z
DIXON
La prueba de Dixon se usa en un nmero pequeo de observaciones (menor a 26) y detecta elementos que se encuentren sesgados o que son extremos.
Para aplicar la prueba de Dixon se requiere de un nmero de observaciones igual o mayor a 10. En el caso que las observaciones sean menores a 10 se utiliza como valor esperado el valor de preparacin.
GRUBBS
La prueba de Grubbs utiliza una estadstica de prueba, T, que es la diferencia absoluta entre el valor atpico, XO, y el promedio de la muestra (X) dividida por la desviacin estndar de la muestra, s. Para el ejemplo anterior, el promedio de la muestra es = 4.86 y la desviacin estndar de la muestra es = 1.48. La estadstica calculada de la prueba es:
Gloria Mara Meja Z
GRUBBS
Para un n = 7 y un riesgo del 5%, el valor tabulado es 1.938 y el TCalculado = 1.99 excede este valor crtico, indicando que el valor 7.8 es un valor atpico.
Aceptar o rechazar un resultado anmalo (outlier) Normalmente se producen al cometer errores o fallos en la metodologa aplicada.
Se ordenan los datos en forma creciente y se calcula Q
Q = desvo = Diferencia entre el dato sospechosos y su vecino ms cercano recorrido Diferencia numrica entre el dato de mayor valor y el de menor valor
Ejemplo:
Al efectuar una serie de rplicas para determinar la concentracin del in sulfato en una muestra de agua para riego se obtuvieron los siguientes resultados. Determinar si la medida 6.0 es un valor rechazable.
Medida Valor 1 5.0 2 5.2 3 5.5 4 5.6 5 6.0
1. Se ordenan los datos en orden de valor decreciente 6.0, 5.6, 5.5, 5.2, 5.0 2. Se calcula Q Q= (6.0-5.6)/ (6.0-5.0) =0.40
3. Se compara Q calculado con Q tabulado para 5 medidas y un nivel de confianza del 90. Qtab=0.64 0.40<0.64, luego el valor 6.0 no es rechazable
DESCARTE DE DATOS
1. Definir que tan grande es la Diferencia entre el valor sospechoso y los otros datos. 2. Aplicar Prueba Q. a) Ordenar los datos b) Calcular el rango c) Encontrar la diferencia entre el resultado sospechosos y su vecino mas cercano 3. Dividir la diferencia obtenida en el paso 2 entre el Rango. As se obtiene el coeficiente de descartacion Q. 4. Consultar la tabla de valores Q. Si el valor calculado es mayor que el de latabla el resultado se puede descartar con un 90% de confianza de que si se podia.
Gloria Mara Meja Z
DESCARTE DE DATOS
EJEMPLO 4 Resultados de N de una solucin fueron 0.1014, 0.1012, 0.1019, 0.1016. Se podr descartar 0.1019? X sin el 0.1019 = 0.1014 0.1019-0.01014 =0.0005 Q = 0.1019 - 0.1016 =0.43 0.1019 0.1012 0.43 es menor que 0.76. NO SE DESCARTA
Gloria Mara Meja Z
Cuanto mas cercanos estn los datos a la lnea que se obtiene del anlisis por mnimos cuadrados, menores son los residuales
Gloria Mara Meja Z