Professional Documents
Culture Documents
A
Lei
Normal do
Erro aparece na
História da Humanidade
Como uma das mais alargadas
Generalizações da Filosofia natural.
Serve como um instrumento que guia muitos
Investigadores na física, nas ciências sociais e humanas,
Na medicina, na agricultura e na engenharia. É uma ferramenta
Fundamental para interpretação de dados obtidos por observação ou experiência
Até esta altura tem lidado sobretudo com estatísticas descritivas, ou seja,
medidas que o ajudam a sumariar dados, seja numericamente (ex. Média,
desvio padrão), ou graficamente (histogramas, etc.).
Agora precisamos de abordar algumas lições da teoria estatística que nos
permitam avançar para uma classe bem mais sofisticada e “poderosa” de
técnicas de análise quantitativa – a inferência estatística.
Para ser muito honesta devo dizer que se trata tudo de um conjunto de
estratégias para “adivinhar”. Na prática vamos usar a informação que
conhecemos para avançar com “palpites” mais ou menos informados sobre o
que não sabemos.
A informação que conhecemos são as estatísticas (médias, desvios padrão,
etc.), que obtivemos com base na observação de uma amostra.
Usamos estas estatísticas amostrais para construir “palpites”, ou seja,
inferências sobre “a verdade”, ou seja, sobre o que julgamos ser o valor real
respectivo na população.
O nosso trabalho nesta cadeira vai girar em torno dos métodos que podemos
usar para com validade usarmos estatísticas amostrais para estimar
parâmetros populacionais.
1. Teoria da Amostragem
2. Teoria das Probabilidades
1. AMOSTRAS E POPULAÇÕES
Bom, o seu melhor palpite será precisamente o seu resultado amostral: 3 000
euros. O seu problema é que não tem qualquer base para estar confiante que
esse é realmente o valor do rendimento médio na população. Pode ser um
bom palpite, ou pode ser um palpite totalmente inútil. O nosso problema é
não sabermos.
Uma vez que a população não é observada, o que sabemos sobre a amostra
observada não vai ser suficiente para fazermos afirmações sobre a
população com segurança. A ferramenta extra que precisamos é a
Tenho consciência que isto lhe deve parecer bastante estranho. Porque é
que uma distribuição hipotética aparece como tão importante?
Claro que os nossos dados concretos podem estar medidos de várias formas
(altura, comprimento, rendimento, etc.) e por isso a nossa curva normal geral
poderia ter qualquer média e qualquer desvio-padrão (tal como calculados
em cada amostra). Para tornar as coisas mais simples procede-se a uma
estandardização das diferentes métricas para unidades de desvio-padrão.
Y
Z
Agora, muita atenção. Não vamos confundir Scores Z com Áreas sob a curva.
100 120
120 100
Z 1.33
15
Ou seja, o que queremos saber é qual a proporção de casos que ficam entre
μ + 1.33σ.
Felizmente que existem umas tabelas que nos dão informação sobre a área
sob a curva normal para vários valores de Z. Só temos que consultar uma
dessas tabelas.
Imagine que passa 20 anos da sua vida a atirar ao ar um dado (não viciado,
obviamente). Dado que cada número num dado tem uma probabilidade
idêntica de sair, esperar-se-ia que ao fim de 20 anos de lançamentos tivesse
mais ou menos o mesmo número de ocorrências para cada face do dado. Ou
seja, teria uma distribuição de freqência com um aspecto mais ou menos
como isto...