You are on page 1of 69

ESTADSTICA

EN QUMICA ANALTICA
IMPORTANCIA DE LA ESTADSTICA Y
LA QUIMIOMETRA EN LA QUMICA ANALTICA

Durante la realizacin de una anlisis cuantitativo


es muy importante tomar en cuenta todas las
variables que pueden afectar nuestro resultado,
dentro de estos estn los factores provocados por
los instrumentos utilizados y los errores
provocados por quien maneja el material.

En
En el
el reporte
reporte dede cualquier
cualquier anlisis
anlisis
qumico,
qumico, es es importante
importante tomar
tomar en en
cuenta
cuenta este
este tipo
tipo de
de errores
errores ,, hacer
hacer
un
un anlisis
anlisis dede los
los resultados
resultados yy as
as
se
sepodr
podrconcluir
concluirsobre
sobrel.l.
La Estadstica se utiliza como tecnologa
al servicio de las ciencias donde la
variabilidad y la incertidumbre forman
parte de su naturaleza.

La Estadstica es la Ciencia de la:


v a Sistematizacin, recoleccin, ordenacin y
p ti presentacin de los datos referentes a un fenmeno que
c ri presenta variabilidad o incertidumbre para su estudio
e s
D metdico, con objeto de
a d
i lid deducir las leyes que rigen esos fenmenos,
b ab
o
Pr
c ia y poder de esa forma hacer previsiones sobre los
n
ere mismos, tomar decisiones u obtener conclusiones.
f
In
DATOS NO AGRUPADOS

Media aritmtica
Mediana
Medidas de Moda
tendencia central Percentiles
(posicin)

Rango (amplitud)
Rango
Medidas de intercuartlico
Varianza
dispersin Coef. de variacin
MEDIDAS DE TENDENCIA
CENTRAL

Mediana
En una serie de datos ordenados
(creciente o decreciente) es la
puntuacin o valor central de la
distribucin estadstica

Datos no agrupados
Si el n de datos es impar: valor
central
Si el n de datos es par: media
aritmtica de los 2 puntos centrales
MEDIDAS DE TENDENCIA
CENTRAL

Mediana
Caractersticas
Menos sensible que la media a la
variacin de las puntuaciones.
Se puede calcular aunque algn
intervalo carezca de lmite.
Ms representativa que la media
cuando puntuaciones muy
extremas.
MEDIDAS DE TENDENCIA
CENTRAL
Moda
Valor de la variable que ms veces se
repite en una serie estadstica
(mxima frecuencia)
Distribuciones: Unimodales o
multimodales
Caractersticas:
Marca de clase (en intervalos)
Sencilla de calcular
Se puede calcular si algn intervalo no
tiene lmites
Poco representativa
MEDIDAS DE TENDENCIA
CENTRAL

Media
Suma de todos los
valores de una variable
dividida por el nmero
total de valores
Slo en variables
cuantitativas
X = xi / N
MEDIDAS DE TENDENCIA
CENTRAL

Media. Clculo
Datos no agrupados: aplicar frmula
Datos agrupados
En tabla de frecuencia: Suma de todos
los valores multiplicados por sus
frecuencias y dividido por el n total.

X = xi fi / N
MEDIDAS DE TENDENCIA
CENTRAL

Media
Caractersticas
La media es sensible a la
variacin de las puntuaciones.
No se puede calcular si algn
intervalo es de lmite abierto.
No es recomendable si valores
muy extremos
MEDIDAS DE
DISPERSIN
Reflejan la dispersin, oscilacin de
los datos, respecto al fenmeno
estudiado.

Complementan las de tendencia


central para la descripcin de una
distribucin
MEDIDAS DE
DISPERSIN

Amplitud o rango
Diferencia entre el valor ms alto
y ms bajo de la distribucin.
Ofrece poca informacin sobre
la agrupacin de los datos.
Indica el campo de
variabilidad.
Suele acompaar a la moda.
MEDIDAS DE DISPERSIN
Varianza
Junto a la desviacin tpica, la que mejor
expresa la variabilidad del fenmeno
Media de los cuadrados de las diferencias entre
cada valor de la variable y la media aritmtica

S2 = (xi x)2 / N S2 = xi2 / N x2


Para datos agrupados:

S2 = fi(xi x)2 / N S2 = fixi2 / N x2


MEDIDAS DE DISPERSIN
Desviacin tpica
Es la raz cuadrada de la varianza

S2 = xi2 / N x2

Para datos agrupados:

S2 = fixi2 / N x2
MEDIDAS DE DISPERSIN
Varianza y desviacin tpica
Caractersticas
Ambas toman siempre valores positivos.
Si todos los datos de una distribucin
son iguales entre s, toman el valor 0.
Slo son aplicables a variables
cuantitativas

La que ms se suele usar es la desviacin tpica.


Si los datos estn muy dispersos, la desviacin
tpica ser muy grande.
giovanni10.wordpress.com/.../
CUANDO ELEGIR LA MEDIANA EN LUGAR DE LA
MEDIA?:

1. CUANDO LA VARIABLE ESTE MEDIDA EN UNA ESCALA


ORDINAL.

2. CUANDO HAYA VALORES EXTREMOS, PUES ESTOS DISTORSIONAN LA


INTERPRETACION DE LA MEDIA. EJEMPLO: 3,4,8,5,6,124 Media=25

LA MEDIA ES MUY SENSIBLE A LAS PUNTUACIONES EXTREMAS

3. CUANDO HAYA INTERVALOS ABIERTOS, YA QUE ESTOS CARECEN


DE PUNTO MEDIO.
LA DISTRIBUCIN
NORMAL

f(X)

Media X
Mediana
Moda

Datos simtricos: coinciden la media, la


mediana y la moda
PROPIEDADES DE LA
DISTRIBUCIN NORMAL:

El rea bajo la curva aproximado del


promedio a ms o menos una
desviacin estndar (1) es de 0.68, a
ms o menos 2 es de .0 95 y a ms o
menos 3 es de 0.99.
PROPIEDADES DE LA
DISTRIBUCIN NORMAL:
La forma de la campana de Gauss depende de los
parmetros y .
Tiene una nica moda que coincide con su media y su
mediana.
La curva normal es asinttica al eje de X.
Es simtrica con respecto a su media . Segn esto, para
este tipo de variables existe una probabilidad de un 50% de
observar un dato mayor que la media, y un 50% de
observar un dato menor.
EN RESUMEN
Podemos concluir que hay una familia de
distribuciones con una forma comn,
diferenciadas por los valores de su media y su
varianza.
La desviacin estndar ( ) determina el grado
de apuntamiento de la curva. Cuanto mayor
sea el valor de , ms se dispersarn los datos
en torno a la media y la curva ser ms plana.
La media indica la posicin de la campana, de
modo que para diferentes valores de la grfica
es desplazada a lo largo del eje horizontal.
De entre todas ellas, la ms utilizada es la
distribucin normal estndar, que
corresponde a una distribucin de media 0 y
varianza 1.
ERRORES EN LOS ANALISIS
QUIMICOS

Es imposible efectuar anlisis


qumicos totalmente libres de
errores o incertidumbres.
La fiabilidad de un resultado se
analiza de diferentes maneras
Se analizan patrones de
composicin conocida
Se aplican pruebas estadsticas a
los datos
En ciencias e ingeniera, el concepto de error
tiene un significado diferente del uso habitual de
este trmino. Coloquialmente, es usual el
empleo del trmino error como anlogo o
equivalente a equivocacin.
En ciencia e ingeniera, el error, est ms bien
asociado al concepto de INCERTEZA,
INCERTIDUMBRE, en la determinacin del
resultado de una medicin.

ERROR: es la medida del sesgo en el resultado de


una medicin.
INCERTIDUMBRE: es el intervalo o rango de los valores
posibles de una medida. Incluye tanto los errores
sistemticos como aleatorios.
La incertidumbre de un resultado es bien diferente de
la precisin, sta da una medida del error aleatorio.
Errores
Groseros o accidentales
Son errores que son tan
importantes que no existe alternativa
real que abandonar el experimento y
empezar de nuevo por completo.
Aleatorio
Estos provocan que Sistemticos
los resultados Provocan que todos los
individuales difieran uno resultados
del otro de manera sean errneos en el mismo
que caigan a ambos lados sentido, son demasiado
del valor medio. grandes, y se denomina tambin
Estos errores sesgo de la medida. Este tipo
afectan la precisin de error es
de un experimento. responsabilidad
Este tipo de errores son del material empleado
los que comete el operador y de su origen y presin
del instrumento utilizado. de fabricacin.
ERRORES
EXPERIMENTALES
Error absoluto.- Nos indica si medimos u
obtuvimos mas o menos que el valor
experimental, y en qu cantidad excedimos
del valor real o qu cantidad nos falt; esto
segn el signo de la sustraccin.

EA = valor experimental valor terico

Error relativo.- Es una forma de conocer el


porcentaje de error que obtuvimos en nuestros
resultados.
ER = (valor experimental valor terico) x 100
(valor terico)
Los errores presentes en un estudio
analtico modifican:

Precisin
Es el grado de confianza con que se puede repetir un
experimento y este puede dar los mismo resultados. Es
utilizado como sinnimo de repetitibilidad.
Exactitud
Es el grado de concordancia entre el resultado de un
ensayo y el valor de referencia aceptado.
TERMINOS IMPORTANTES

Media, Media aritmtica y promedio (X)


son trminos sinnimos. Es la medida de
tendencia central mas utilizada .Se obtiene
dividiendo la suma de los valores de una
serie y dividiendo por el numero de medidas
del conjunto.
Mediana es el resultado alrededor del cual
se reparten los dems por igual. Si la serie
es un numero impar la mediana es el numero
de la mitad. Si la serie es un numero par se
toma el promedio del par central despus de
haber ordenado la serie de menor a mayor.
TERMINOS IMPORTANTES

Ejemplo: calcular la media y la mediana de


10.06, 10.20, 10.08, 10.10.

Media = X =10.06+10.20+10.08+10.10
= 10.11
4

Mediana = 10.08 +10.10 = 10.09


2
CIFRAS SIGNIFICATIVAS

Es el numero necesario de
dgitos para expresar los
resultados de una medicin
congruente con la precisin
de medida.
237 : 2 centenas, 3
decenas y 7 unidades
El numero de cifras significativas incluye todos
los dgitos que se conocen mas el primer
digito incierto.
El numero de cifras
significativas en una
medicin es
independiente de la
colocacin del punto
decimal.
Por ejemplo el numero 92.067:
Este numero tiene cinco cifras
significativas independiente
donde se coloque el punto
decimal. En este caso el cero si
es una cifra significativa.

En el numero 727.0 el cero no se


usa para localizar el punto
decimal es significativo
0.216 Tres Cifras
significativas.
90.7 Tres cifras
significativas.
800.0 Cuatro cifras
significativas.
0.0670 Tres cifras
significativas
TERMINOS IMPORTANTES
Precisin.
El trmino precisin describe la reproducibilidad
de los resultados y se puede definir como la
concordancia que hay entre los valores
numricos de dos o ms mediciones que se han
realizado de idntica manera.

La precisin slo depende


de la distribucin
de los errores aleatorios
y no se relaciona
con el valor verdadero ni
con el valor especificado.
PRECISION

Para describir la precisin de un conjunto


de datos repetidos se utilizan tres
trminos muy conocidos:
La desviacin estndar, la varianza y el
coeficiente de variacin.
La desviacin estndar (DS/DE) es
una medida de dispersin usada en
estadstica que nos dice cunto tienden
a alejarse los valores puntuales del
promedio en una distribucin.

Asi la varianza es la media de los cuadrados de


las diferencias entre cada valor de la variable y la
media aritmtica de la distribucin. Aunque esta
frmula es correcta, en la prctica interesa realizar
inferencias poblacionales, por lo que en el
denominador en vez de n, se usa n-1
TERMINOS IMPORTANTES

METODOS ABSOLUTOS PARA EXPRESAR LA


PRECISION

Desviacin estndar S= Xi-X


n-1
Desviacin respecto a la media es la diferencia
numrica entre un valor experimental y la media

Varianza: S2
Coeficiente de variacin. C.V = S/Media *100
TERMINOS IMPORTANTES

Desviacin estndar relativa (DER) : se calcula


al dividir la desviacin estndar entre la media
del conjunto de datos.
DER se expresa en partes por mil o en %.
DER * 100% = CV.

Dispersin (W): Es la diferencia entre el valor


mas alto y el valor mas bajo del conjunto
TERMINOS IMPORTANTES

EXACTITUD : El trmino denota el grado


de coincidencia del resultado de una
medicin con el valor verdadero o
aceptado de la misma y se expresa en
funcin del error. La exactitud implica
una comparacin con el valor
verdadero o aceptado como tal.
Cuando no se conoce el valor
verdadero se debe usar un valor
aceptado.
TERMINOS IMPORTANTES

METODOS PARA MEDIR LA EXACTITUD


Error absoluto: Es la diferencia entre el
valor experimental y el valor real.
Error relativo: Es el error absoluto
dividido por la cantidad medida.
Ejemplo:
Una muestra tiene 20.34% de Fe y un
analista encuentra que es 20.44%.
Error Absoluto = 20.44-20.34 = 0.10%
Error relativo = 0.1/20.34 = 0.0049 =
4.9 partes por mil
TERMINOS IMPORTANTES

En trminos generales la exactitud


supone una comparacin con un
valor verdadero o aceptado como
tal, la precisin indica la
concordancia entre las medidas que
han sido realizadas de una misma
forma.
Esquema grfico para comprender
la relacin entre exactitud y
precisin

En C existe buena precisin, pero no buena exactitud;


en A buena exactitud y precisin, y en B mala exactitud
y precisin.
DIAGRAMA PRECISIN Y
EXACTITUD
TIPOS DE ERRORES EN DATOS EXPERIMENTALES

ERRORES

Aleatorios Sistemticos
- indeterminados - determinados
- Afectan la precisin - Afectan la
exactitud
ERRORES DETERMINADOS O SISTEMATICOS

FUENTES DE ERRORES SISTEMTICOS

Errores instrumentales: Calibraciones


deficientes

Errores del mtodo: Dificiles de identificar

Errores personales: Descuido, Falta de atencin


EFECTO DE LOS ERRORES SISTEMATICOS
EN LOS RESULTADOS ANALITICOS

Los errores sistemticos pueden ser


constantes o proporcionales

En los errores constantes el error absoluto es


invariable con el tamao de la muestra
,mientras el error relativo cambia al modificar
dicho tamao.

Los errores proporcionales aumentan o


disminuyen segn el tamao de la muestra.
Con los errores proporcionales el error
absoluto varia con el tamao de la muestra,
en cambio el error relativo permanece
constante.
EFECTO DE LOS ERRORES SISTEMATICOS
EN LOS RESULTADOS ANALITICOS

Los errores sistemticos pueden ser


constantes o proporcionales.

En los errores constantes, el error


absoluto es invariable con el tamao de
la muestra, mientras en el error relativo
cambia al modificar el tamao de la
muestra.

Los errores proporcionales aumentan o


disminuyen segn el tamao de la
muestra; con estos errores el error
absoluto varia con el tamao de la
muestra en cambio el error relativo
permanece constante.
ERRORES ALEATORIOS

Son la principal fuente de incertidumbre


en una determinacin.
Muchas variables no controladas y de
no fcil identificacin causan errores
aleatorios.
El efecto acumulativo de las
incertidumbres, aunque estas sean muy
pequeas, hace que las mediciones por
duplicado de una serie flucten al azar.
FUENTES DE LOS ERRORES
ALEATORIOS

Los errores aleatorios obedecen


una curva normal de error o
curva de gauss.
DISTRIBUCIN NORMAL

Al iniciar el anlisis estadstico de una


serie de datos, y despus de la etapa de
deteccin y correccin de errores, un
primer paso consiste en describir la
distribucin de las variables estudiadas
y, en particular, de los datos numricos.
Un modo es con la curva de distribucin
normal que muestra la frecuencia con
que se repiten los datos.
TRATAMIENTO ESTADISTICO DEL
ERROR ALEATORIO

Los mtodos estadsticos permiten


categorizar y caracterizar los datos,
y tomar decisiones objetivas en
cuanto a su calidad e interpretacin.
Hay que diferenciar entre muestra y
poblacin o universo. ( caso del
anlisis de Ca en agua. La poblacin
seria un numero de medidas muy
grande cercano al infinito).
Las leyes de la estadstica se
dedujeron para usarlas en
poblaciones. Para aplicarlas a
muestras se debe hacer ajustes.
TRATAMIENTO ESTADISTICO
DEL ERROR ALEATORIO

Las curvas gaussianas se pueden


representar por medio de una
ecuacin que tiene la media de la
poblacin , y la desviacin estndar
de la poblacin .
La media de la poblacin es y la
media de la muestra es X.
Cmo determina si un valor es realmente
un valor atpico y cmo decide si debe
continuar o no con el anlisis de datos?
Uno de los problemas en el anlisis de datos es
manejar los valores atpicos dentro de un
grupo de datos.
Un valor atpico es una observacin con un valor
que no parece corresponderse con el resto de
los valores en el grupo de datos.

Por lo general surgen dos preguntas:


1) Es este valor realmente un valor atpico?
2) Puedo eliminar este valor y continuar con el
anlisis de datos?
DATOS ATIPICOS

Con respecto a la pregunta 2, debe


saberse que las pruebas estadsticas se
utilizan para identificar valores atpicos,
no para retirarlos del grupo de datos.

Tcnicamente, una observacin no debe


retirarse a menos que una
investigacin halle una causa probable
para justificar esta accin
DATOS ATIPICOS

Si en la investigacin no se encuentra
una causa probable, qu debe
hacerse?
Un enfoque sera realizar un anlisis de
datos con el valor atpico y sin l. Si
las conclusiones son diferentes,
entonces se considera que el valor
atpico tiene influencia y esto
debera indicarse en el informe.
Otra opcin es utilizar estimadores
rigurosos para caracterizar los
grupos de datos, tal como la
mediana de la muestra en lugar de
la media.
RECHAZO DE DATOS

Dos de las pruebas estadsticas


utilizadas con mayor frecuencia en un
grupo de datos son la prueba de
Dixon y la prueba de Grubbs.
La prueba de Dixon utiliza relaciones
de las diferencias entre datos que
parecen atpicos comparados con los
valores del grupo de datos.
RECHAZO DE DATOS

Estas tcnicas estn diseadas para


detectar un nico valor atpico en un
grupo de datos, y por lo tanto no son
adecuadas para la deteccin de
mltiples valores atpicos.
Una tcnica rigurosa y amplia para
identificar eficazmente mltiples
valores atpicos es el procedimiento
para muchos valores atpicos con
generalizacin extrema de la
desviacin de Student.
PRESENTACION DE LOS DATOS
CALCULADOS

Un indicador de la calidad de los datos


es la utilizacin de las cifras
significativas.
Cifras significativas: Son todos los
dgitos que se conocen con certeza y
el primer digito incierto. Por ejemplo
30.24 tiene 4 cifras significativas (4, el
ultimo digito, es incierto)
PRESENTACION DE LOS
DATOS CALCULADOS

El cero puede ser significativo o no


segn su ubicacin en el numero. Un
cero rodeado por otros dgitos
siempre es significativo.
Los ceros al final pueden o no ser
significativos. 2.0 tiene dos cifras
significativas. 2000 tiene una cifra
significativa. 2x103 tiene una.
PRESENTACION DE LOS DATOS
CALCULADOS

Para las sumas y las restas el


resultado debe tener el mismo
numero de decimales que el numero
que tiene menos decimales.
Cuando se suman o restan nmeros
con notacin cientfica se debe
expresar el resultado en la misma
potencia de 10.
En la multiplicacin y la divisin se
debe expresar el resultado con las
cifras significativas del numero que
tenga menor cifras significativas.
PRESENTACION DE LOS DATOS
CALCULADOS

Redondeo de datos:
Se debe aproximar al numero
mayor si el ultimo es mayor de 5 y
al menor si el ultimo es menor de
5.
61.555 se aproxima al numero par
mas cercano . Queda 61.56
De todas maneras el resultado
debe expresarse con la desviacin
estndar calculada.

You might also like