You are on page 1of 33

03/11/2017

Serviço Público Federal


Universidade Federal do Pará
Instituto de Ciências Exatas e Naturais
Faculdade de Química

ESTATÍSTICA APLICADA A QUÍMICA

Erros em Análises Químicas

Prof. Dr. José Rogério Araújo Silva

Belém – PA
2017

PROBLEMAS ANALÍTICOS
 Problemas analíticos: Qualitativo e Quantitativo

Exemplo: “Existe algum metal pesado nessa amostra de água?”


“Quanto metal pesado pode exister nessa amostra de
água?”

 A análise Química é predominantimente QUANTITATIVA

ERROS EM ANÁLISE QUANTITATIVA


 Nenhum resultado quantitativo é de qualquer valor a menos que seja
acompanhado de alguma estimativa de erros inerentes a ele.

Exemplo: Supondo-se que o resultado da síntese de um reagente analítico


foi 104 (para uma grandeza aleatória). Procurando-se em “textbooks”
encontra-se o valores somente abaixo de 100 para a mesma grandeza.
Pode-se afirmar que este reagente é inédito?

OBS: O conhecimento dos erros experimentais é crucial para a correta


interpretação dos resultados.

1
03/11/2017

TIPOS DE ERROS
 Podem ser: Grosseiros, Sistemáticos e Randômicos.

Sistemáticos (determinado)

Ocorrem devido a causas identificáveis e podem em princípio ser eliminados.

Faz que a média de um conjunto de dados seja diferente do valor aceito.

Erros desse tipo resultam em valores que são sistematicamente mais altos ou mais baixos.
Há quatro tipos de erros sistemáticos:

1. Instrumentais. Por exemplo, um instrumento mal calibrado, tal como um termômetro que lê
102°C quando imerso em água em ebulição, e 2°C quando colocado em água com gelo a
pressão atmosférica. Tal termômetro resultará em valores de temperatura que serão
consistentemente mais altos.

2. Observacionais. Por exemplo, a paralaxe na leitura de uma escala com ponteiro.

3. Ambientais. Por exemplo uma fonte elétrica “queimada” que causa correntes elétricas
muito baixas.

4. Teóricos. Devido a simplificações do modelo de sistema ou aproximações nas equações


que o descrevem – por exemplo se a força de atrito que age durante o experimento não for
incluída na teoria, os resultados teóricos e experimentais irão discordar de maneira
sistemática.

TIPOS DE ERROS

Randômicos (indeterminado)

São flutuações positivas e negativas que produzem cerca de metade das medidas com
valores mais baixos e metade mais altos.

Faz que os dados se distribuam de forma mais ou menos simétrica em torno do valor médio.

Algumas vezes pode ser muito difícil de identificar as fontes de erros randômicos.

Possíveis fontes desses erros são:

1. Observacionais. Por exemplo, erros no julgamento de um observador quando lendo uma


escala de um equipamento de medida na menor divisão.

2. Ambiental. Por exemplo, variações imprevisíveis da voltagem da rede elétrica,


temperatura, ou vibrações mecânicas do equipamento.

Os erros aleatórios, diferente dos erros sistemáticos, podem ser geralmente quantificados
por análise estatística, portanto o efeito dos erros aleatórios sobre uma determinada
quantidade ou lei física sob investigação podem geralmente ser determinados.

2
03/11/2017

TITULAÇÃO

Excemplo: 4 estudantes realizaram uma titulação ácido-base de 10 mL NaOH 0,1 M com HCl
0,1 M (f = 1). O experimento foi realizado em 5 replicatas por cada estudante. Obtendo-se os
serguintes resultados:

3
03/11/2017

CONCEITOS BÁSICOS

 Em alguma fase de seu trabalho, o pesquisador depara-se com o


problema de analisar e compreender um conjunto de dados relevantes
ao seu particular objeto de estudo (TEMA).

 Estatística: um conjunto de técnicas que permite, de forma sistemática,


organizar, descrever, analisar e interpretar dados oriundos de estudos
ou experimentos, realizados em qualquer área do conhecimento.

MÉTODO CIENTÍFICO

I. O cientista formula uma questão, problema ou teoria. Pode querer


também testar alguma hipótese;
II. Coletar informações que sejam relevantes: Planejar algum
experimento;
III. Os resultados do passo II são usados para obter conclusões (podem
ser não definitivas;
IV. Se necessário, repetir II e III, ou reformular as hipóteses.

4
03/11/2017

ÁREAS DA ESTATÍSTICA

 Estatística Descritiva: é a etapa inicial da análise utilizada para


descrever e resumir os dados. A disponibilidade de uma grande
quantidade de dados e de métodos computacionais muito eficientes
revigorou está área da estatística.

 Probabilidade: nos permite descrever os fenômenos aleatórios, ou seja,


aqueles em que está presente a incerteza.

 Inferência Estatística: é o estudo de técnicas que possibilitam a


extrapolação, a um grande conjunto de dados, das informações e
conclusões obtidas a partir da amostra.

5
03/11/2017

ETAPAS DA ANÁLISE ESTATÍSTICA

AMOSTRAGEM

Uma área importante em muitas aplicações Estatísticas é a da Tecnologia


de Amostragem.

Exemplos de Aplicação:
 Pesquisa de mercado;
 Pesquisa de opinião;
 Avaliação do processo de produção;
 Praticamente em todo experimento.

6
03/11/2017

Amostragem Aleatória
Cada elemento da população tem a
mesma chance de ser escolhido.

Amostragem Estratificada
Classificar a população em, ao
menos dois estratos e extrair uma
amostra de cada um.

Amostragem Sistemática
Escolher cada elemento de ordem k.

Amostragem por Conglomerados


Dividir em seções a área populacional,
selecionar aleatoriamente algumas dessas
seções e tomar todos os elementos das
mesmas.

Amostragem de Conveniência
Utilizar resultados de fácil acesso.

7
03/11/2017

Variável
Qualquer característica associada a uma população

Classificação de variáveis


Nominal sexo, cor dos olhos
Qualitativa
Ordinal Classe social, grau de instrução


Contínua Peso, altura,salario
Quantitativa
Discreta Número de filhos, número de
carros

16

8
03/11/2017

TRABALHANDO COM NÚMEROS

 REVISÃO EXPOENTES

 ALGARISMOS SIGNIFICATIVOS

17

PRECISÃO x EXATIDÃO

18

9
03/11/2017

Distribuição de Frequência

Frequência e porcentagem dos 36 empregados da


seção de orçamento de uma companhia segundo grau
de instrução
Grau de Frequência, ni Proporção fi Porcentagem fi
instrução
Fundamental 12 0,3333 33,33
Médio 18 0,5000 50,00
Superior 6 0,1667 16,67
Total 36 1,0000 100,00

19

Gráficos Variáveis Qualitativa


• Gráfico em barras para variável Y: grau de
instrução para os dados de frequência da
para a Tabela anterior.

20

10
03/11/2017

Medidas Resumo
Variáveis Quantitativas

MEDIDAS DE POSIÇÃO: Moda, Média, Mediana, Percentís,


Quartis.

MEDIDAS DE DISPERSÃO: Amplitude, Intervalo-Interquartil,


Variância, Desvio Padrão, Coeficiente de Variação.

21

Medidas de Posição

Moda(mo): É o valor (ou atributo) que


ocorre com maior freqüência.Moda

Variavel
Ex: 4,5,4,6,5,8,4,4 qualitativa
Mo = 4

22

11
03/11/2017

Média
n

x  x  x  ...  x x i
x  1 2 3 n
 i 1
n n

Ex:2,5,3,7,8

Média = [(2+5+3+7+8)/5]=5

23

Medidas de Dispersão

Finalidade: Encontrar um valor que resuma a


variabilidade de um conjunto de dados.

Amplitude (A): A=máx-min

Ex: 3,5,2,1,8,6
Dados ordenados:1,2,3,5,6,8 =>
A=max-min, A=7

24

12
03/11/2017

Desvio médio
n

 xi  x
dm( X )  i 1
n 1
Variância
n

 ( x2  x )  ...  ( xn  x )  x  x 
2

2 2 2

var( X ) 
( x1 x )  i 1
i

n 1 n 1

25

Desvio padrão

Desvio Padrão : s  Variância

Coeficiente de Variação (CV)


s
CV  100%
X
É uma medida de dispersão relativa;
Elimina o efeito da magnitude dos dados;
Exprime a variabilidade em relação a média
Útil Comparar duas ou mais variáveis

26

13
03/11/2017

Cálculo da variância

Ex: 3, 4, 5, 6, 7: Vimos que: x 5

(3  5) 2  (4  5) 2  (5  5) 2  (6  5) 2  (7  5) 2 10
S2    2,5
5 1 4

Desvio padrão S  2,5  1,58

27

Exemplo 1: Os seguintes resultados foram obtidos para réplicas da


determinação de chumbo em uma amostra de sangue: 0,752; 0,756;
0,752; 0,751 e 0,760 ppm de Pb. Calcule a média e o desvio padrão
para esse conjunto de dados.

Exemplo 2: A água mineral de uma determinada fonte pode ser


caracterizada por meio da sua composição inorgânica. Assim, sua
assinatura química permite verificar a ocorrência de adulteração de
amostras. Em um estudo realizado por Correia e Ferreira (Quim. Nova,
Vol. 30, No. 2, 481-487, 2007) foram determinados os traços de metais
alcalinos (Na e K) e alcalinos terrosos (Mg, Ca, Sr e Ba) e obtida uma
matriz de dados autoescalonada para os referidos elementos (Tabela 1).
Determine média, variância, desvio padrão e coeficiente de variação
para cada elemento.

28

14
03/11/2017

Tabela 1. Matriz de dados autoescalonados para as amostras de água mineral.

AMOSTRA K Na Mg Ca Sr Ba
A1 -0,491 0,980 -1,129 1,323 -0,519 -0,189
A2 -0,476 0,753 -1,118 1,414 -0,311 0,684
A3 -0,487 0,900 -1,125 1,373 -0,229 0,492
A4 -0,488 0,946 -1,124 1,353 -0,216 0,690
A5 -0,480 0,919 -1,123 1,387 -0,181 0,671
A6 -0,491 0,890 -1,128 1,330 -0,291 0,582
A7 -0,470 1,019 -1,109 1,583 -0,119 0,332
A8 -0,423 0,761 -1,072 1,815 -0,096 0,212
A9 -0,475 1,001 -1,112 1,522 -0,282 0,919
A10 -0,476 1,014 -1,112 1,545 -0,037 0,548

29

Boxplot of K
-0.42

-0.43

-0.44

-0.45

-0.46
K

-0.47

-0.48

-0.49

-0.50

30

15
03/11/2017

Quantis Empíricos
A média e desvio padrão podem não ser medidas
adequadas para representar um conjunto de
dados, pois:

a-) São afetados, de forma exagerada, por


valores extremos;

b-) Apenas com estes dois valores não temos ideia


da simetria ou assimetria da distribuição dos dados.

31

Alguns Quantis:

25ºPercentil= primeiro quartil (Q1), q(0,25)


50ºPercentil= mediana, segundo quartil(md,Q2,q(0,5))
75ºPercentil= terceiro quartil (Q3) , q(0,75)
4º Decil= q(0,4)
95º percentil = q(0,95)

O percentil de ordem p (ou p-quantil) deixa


px100% das observações abaixo dele na amostra
ordenada.

32

16
03/11/2017

Exemplo
Ex: Suponha que tenhamos os seguintes valores
de uma variável x:
15, 5, 3, 8, 10, 2, 7, 11, 12
Ordenando os valores, obtemos:
2<3<5<7<8<10< 11<12<15

Posição Md:0,5(n+1)
Posição de Q1:0,25(n+1)
Posição de Q3:0,75(n+1)

33

Ex(2):0,9 1,0 1,7 2,9 3,1 5,3 5,5 12,2 12,9 14,0 33,6 =>n=11

Md=5,3 Q1=1,7 Q3=12,9

34

17
03/11/2017

Intervalo-Interquartil (d)
É a diferença entre o terceiro quartil e o primeiro
quartil, ou seja,
d= Q3-Q1
Ex(1): 15,5,3,8,10,2,7,11,12
Ordenando os dados: 2,3,5,7,8,10,11,12,15.

Q1=2,5 valor:4 e Q3=7,5 valor:11,5


d =Q3-Q1=11,5 – 4= 7,5

Máx,Min,Q1,Q3,Q2: Importantes para se ter uma boa idéia da


forma dos dados (simétrica ou assimétrica) e construir box-plots.

35

Boxplot

O BOXPLOT representa os dados através de um retângulo


construído com os quartis e fornece informação sobre valores
extremos. Veja o esquema embaixo:

36

18
03/11/2017

Esquema dos cinco números

x(1) Q1 Q2 Q3 x(n)

Total Observações n

Mediana Q2

Quartis Q1 Q3

Extremos x(1) x(n)

37

Boxplot of NEUTRA_CCL4; CARREG_CCL4


-42

-43

-44
Data

-45

-46

-47

-48
NEUTRA_CCL4 CARREG_CCL4

38

19
03/11/2017

Boxplot of NEUTRA_H2O; CARREG_H2O

-50

-60

-70

-80
Data

-90

-100

-110

-120

-130

-140
NEUTRA_H2O CARREG_H2O

39

Boxplot of P_ALC; P_FLAV


60

50

40
Data

30

20

P_ALC P_FLAV

40

20
03/11/2017

Boxplot of C_ALC; C_FLAV


40

35

30

25
Data

20

15

10

C_ALC C_FLAV

41

INTERVALOS DE CONFIANÇA
Na maioria das situações encontradas em análises químicas, o valor verdadeiro
da média μ não pode ser determinado, porque um número imenso de medidas
(aproximadamente infinito) seria necessário.

Podemos estabelecer um intervalo ao redor da média 𝑥 determinada


experimentalmente, no qual se espera que a média da população m esteja
contida com um certo grau de probabilidade.

Intervalo de Confiança (IC): é a faixa de valores entre os quais se espera que


a média da população μ esteja contida com uma certa probabilidade.

Limite de Confiança (LC): Limites estipulados a partir do desvio padrão da


amostra (s).

Exemplo: Afirma-se que é 99% provável que a média verdadeira da população


de um conjunto de medidas envolvendo potássio esteja contida no intervalo
7,25% ± 0,15% de K. Assim, a média deve estar contida no intervalo de 7,10% a
7,40% de K, com 99% de probabilidade

42

21
03/11/2017

Determinação do Intervalo de Confiança quando s é Conhecido ou


s é uma Boa Estimativa de σ
Nível de Confiança: é a probabilidade de que a média verdadeira esteja
localizada em um certo intervalo. Muitas vezes é expresso em termos
percentuais.

Nível de Significância: é a probabilidade de um resultado estar fora do


intervalo de confiança.

A quantidade z representa o desvio de


um resultado da média a população
em relação ao desvio padrão (em
unidades de desvio padrão)

43

Equação para a curva de Erro Gaussiana

Suponha que queiramos saber a área sob a curva entre –1σ e 1σ em


relação à média. Em outras palavras, queremos a área entre μ – σ e μ + σ.

44

22
03/11/2017

45

46

23
03/11/2017

47

48

24
03/11/2017

Exemplo 1: Determine os intervalos de confiança de 80% e 95% para (a) o


primeiro registro 1.108 mg/L de glicose e (b) o valor médio para 7 medidas
(1.100,3 mg/L) para o mês 1, no exemplo. Considere s = 19 como uma boa
estimativa de σ.
49

Exemplo 2: Quantas réplicas de medidas realizadas no mês 1, são


necessárias para decrescer o intervalo de confiança de 95% para 1.100,3
10,0 mg/L de glicose?

IMPORTANTE: É essencial ter sempre em mente que intervalos de confiança


baseados na equação anterior aplicam-se somente na ausência de erros
sistemáticos e apenas se podemos considerar que s é uma boa
aproximação de σ. Indicamos que s é uma boa estimativa de σ pelo uso do
símbolo s  σ (s aproxima-se de σ).

50

25
03/11/2017

Determinação do Intervalo de Confiança Quando σ não for Conhecido

As limitações no tempo ou na quantidade de amostra disponível nos impedem


de fazer medidas suficientes para considerar s como uma boa estimativa de σ.

Para considerar a variabilidade de s, usamos o importante parâmetro estatístico


t (t de Student)

O intervalo de confiança para a média 𝑥 de N réplicas de medidas pode ser


calculado a partir de t por:

51

52

26
03/11/2017

Exemplo 3: Um químico obteve os seguintes dados para o teor alcoólico de


uma amostra de sangue: % de C2H5OH: 0,084; 0,089 e 0,079. Calcule o
intervalo de confiança a 95% para a média considerando (a) que os três
resultados obtidos são a única indicação da precisão do método e (b) que, a
partir da experiência prévia com centenas de amostras, sabemos que o desvio
padrão do método s = 0,005% de C2H5OH é uma boa estimativa de σ.

53

Teste de Hipóteses

Um modelo hipotético é proposto e testado experimentalmente para se avaliar sua


validade:

• Se os resultados desses experimentos não dão suporte para o modelo, nós o


rejeitamos e procuramos outra hipótese;

• Se houver concordância, o modelo hipotético serve de base para experimentos.

Hipótese Nula: postula que duas ou mais quantidades observadas são iguais.

Os exemplos específicos de testes de hipóteses que os químicos usam com


freqüência incluem a comparação:

(1) da média de um conjunto de dados experimentais com aquilo que se acredita


ser o valor verdadeiro;

(2) a média com um valor previsto ou de corte (limite);

(3) a média ou o desvio padrão de dois ou mais conjuntos de dados.

54

27
03/11/2017

Comparação de uma Média Experimental com um Valor Conhecido

Existem dois resultados contraditórios que consideramos em qualquer teste de


hipótese:

H0 : μ = μ0
Ha: μ ≠ μ0

Exemplo: Por exemplo, suponha que estejamos interessados em determinar se a


concentração de chumbo em uma descarga de água residual industrial excede à
concentração máxima permitida de 0,05 ppm. Nosso teste de hipótese poderia ser
representado como segue:

H0 : μ = 0,05 ppm
Ha: μ > 0,05 ppm

Suponha agora que experimentos realizados ao longo de vários anos tenham


determinado que a média de chumbo seja de 0,02 ppm. Recentemente, foram
realizadas alterações no processo industrial e suspeitamos que os níveis médios
de chumbo sejam atualmente diferentes. Logo,

H0 : μ = 0,02 ppm
Ha: μ ≠ 0,02 ppm
55

Teste de Hipóteses

Se um grande número de resultados encontra-se disponível, então s é uma boa


estimativa de σ e o teste z é adequado:

𝑥 − 𝜇0
𝑧= 𝜎
𝑁
Para:
H0 : μ = μ0
Ha: μ ≠ μ0

Ha: μ ≠ μ0, rejeitar H0 se z ≥ zcrit ou se z ≤ –zcrit.


Ha: μ > μ0, rejeitar H0 se z ≥ zcrit
Ha: μ < μ0, rejeitar H0 se z ≤ –zcrit.

56

28
03/11/2017

Para Ha: μ ≠ μ0, podemos rejeitar tanto valores positivos de z quanto valores
negativos de z que excedam os valores críticos.

57

Para Ha: μ > μ0, o teste é denominado teste de uma cauda. Nesse caso,
podemos rejeitar apenas quando z ≥ zcrit

58

29
03/11/2017

Exemplo: Uma classe de 30 alunos determinou a energia de ativação de uma


reação química como 27,7 kcal/mol (valor médio), com um desvio padrão de
5,2 kcal/mol. Os dados estão de acordo com o valor de 30,8 kcal/mol descrito
na literatura em (1) um nível de confiança de 95% e (2) 99%? Estime a
probabilidade de se obter uma média com valor igual àquele da literatura.

59

Teste de Hipóteses

Para um número pequeno de resultados, usamos um procedimento similar ao


teste z, exceto que o teste estatístico é o teste t:

𝑥 − 𝜇0
𝑡= 𝑠
𝑁
Para:
H0 : μ = μ0
Ha: μ ≠ μ0

Ha: μ ≠ μ0, rejeitar H0 se t ≥ tcrit ou se t ≤ –tcrit.


Ha: μ > μ0, rejeitar H0 se t ≥ tcrit
Ha: μ < μ0, rejeitar H0 se t ≤ –tcrit.

60

30
03/11/2017

A curva A é a freqüência de distribuição para o valor aceito, obtida pelo método


sem viés. A curva B ilustra a freqüência de distribuição dos resultados por um
método que pode ter um viés significativo.

61

Exemplo: Um novo procedimento para a determinação rápida da


porcentagem de enxofre em querosene foi testado em uma amostra cujo teor
de S era de 0,123% (μ0 = 0,123%), determinado pela forma da sua
preparação. Os resultados foram % de S = 0,112; 0,118; 0,115 e 0,119. Os
dados indicam que existe um viés no método em um nível de confiança de
95% (tcrit = 3,18)?

62

31
03/11/2017

Erros nos Testes de Hipóteses

A escolha de uma região de rejeição para a hipótese nula é feita de maneira que
possamos entender prontamente os erros envolvidos.

Erro Tipo I: resulta da rejeição de H0 quando esta é verdadeira (Falso Negativo).

Erro Tipo II: consiste em aceitar H0 quando ela é falsa.

Observações:

 Nenhum teste pode garantir que não vamos cometer um erro ou o outro;

 As probabilidades de ocorrência dos erros são o resultado do uso de uma


amostra de dados que provoca interferência sobre a população;

 Como regra geral prática, o valor mais elevado de α que pode ser tolerado,
para uma dada situação, deve ser empregado. Isso assegura o menor erro do
tipo II possível, enquanto mantém o erro do tipo I dentro de limites aceitáveis.

63

Comparação da Precisão

Muitas vezes torna-se necessário comparar as variâncias (ou desvios padrão) de


duas populações.

Um teste estatístico, chamado teste F, pode ser utilizado para avaliar a igualdade
de desvios padrão dos conjuntos de dadossob a condição de que as populações
sigam uma distribuição normal (gaussiana).

𝑯𝟎 : 𝝈𝟐𝟏 = 𝝈𝟐𝟐

𝑯𝒂 : 𝝈𝟐𝟏 ≠ 𝝈𝟐𝟐

Exemplo: Um método padrão usado na determinação dos níveis de monóxido de


carbono (CO) em misturas gasosas é conhecido, a partir de centenas de medidas,
por ter um desvio padrão de 0,21 ppm de CO.

Uma modificação do método gera um valor de s de 0,15 ppm de CO para um


conjunto de dados combinados, com 12 graus de liberdade. Uma segunda
modificação, também baseada em 12 graus de liberdade, tem um desvio padrão
de 0,12 ppm de CO. Ambas as modificações são significativamente mais precisas
que o método original?

64

32
03/11/2017

65

33

You might also like