You are on page 1of 15

2.

Distribuições de probabilidade

2.1 Introdução

Uma distribuição de probabilidade é um modelo matemático que relaciona o


valor de uma variável (aleatória) com a probabilidade de ocorrência desse valor
numa determinada população.

Há dois tipos de distribuição de probabilidade:

• Distribuições discretas – quando a variável a medir só pode tomar certos

valores, como sejam os números inteiros 0, 1, 2, …


Exemplo: o número de não conformidades num circuito integrado.

• Distribuições contínuas – quando a variável a medir pode ser expressa numa

escala contínua.
Exemplo: o diâmetro de segmentos de um pistão de motor.

A figura 2.1, (a) e (b) ilustra exemplos, respectivamente, de distribuições de


probabilidade discreta e contínua.

Fig. 2.1 – Distribuições de probabilidade – (a) discreta, (b) contínua

Controlo Estatístico da Qualidade/Artur Guimarães Pág 1 de15


Uma distribuição discreta apresenta-se como uma série de linhas verticais sendo a
altura de cada “pico” directamente proporcional à probabilidade da ocorrência de um
valor da variável aleatória; a probabilidade de que a variável x assuma um
determinado valor xi nota-se por:
p {x = x i } = p ( x i )

Uma distribuição contínua apresenta-se sob a forma de uma curva, função real de
variável real contínua, sendo a área abaixo da curva igual à probabilidade; assim, a
probabilidade da variável aleatória x estar compreendida no intervalo [a, b] nota-se
por:

p {a ≤ x ≤ b } =
b

∫ f ( x ) dx
a

A média µ de uma distribuição de probabilidade é uma medida da tendência


central ou localização da distribuição, sendo definida por:

∑x i

µ= i =1
(2.1)
N
Sendo N a dimensão da população (finita).

A média é exactamente o “centro de massa” da distribuição da população (veja-se


a figura 2.2 que evidencia os conceitos de média, mediana e moda). A média,
determina a localização da distribuição.

Controlo Estatístico da Qualidade/Artur Guimarães Pág 2 de15


Figura 2.2 – Conceitos de média, mediana e moda de uma distribuição

A dispersão de uma distribuição exprime-se pela variância σ2; considerando N


elementos na população, será:

∑ (xi − µ )
N

σ 2
= i =1
(2.2)
N

Controlo Estatístico da Qualidade/Artur Guimarães Pág 3 de15


À medida que aumenta a variação no comportamento de uma população a sua

variância σ 2 aumenta igualmente.


Costuma igualmente utilizar-se o desvio padrão σ para caracterizar a dispersão
de uma população:

∑ (xi − µ )
N

σ = σ = 2 i =1
(2.3)
N

Que se exprime-se nas mesmas unidades da variável aleatória x.

A figura 2.3 apresenta duas distribuições com a mesma média mas diferentes
desvios padrões.

Figura 2.3 – Duas distribuições de probabilidade com a mesma média µ e diferentes desvios
padrões

As definições dadas anteriormente para µ e σ 2 aplicam-se a populações finitas.

Definições mais gerais são as seguintes:

Se x for uma variável aleatória discreta com distribuição de probabilidade p (x) ,


então:

Controlo Estatístico da Qualidade/Artur Guimarães Pág 4 de15



µ = ∑ xi p ( xi ) (2.4)
i =1

∞ 2
σ = ∑ ( xi − µ ) p( xi )
2
(2.5)
i =1

Se x for uma variável aleatória contínua com distribuição de probabilidade


f (x ) , será:


µ = ∫ xf ( x)dx (2.6)
−∞


σ = ∫ ( x − µ ) f ( x)dx
2 2
(2.7)
−∞

2.2 Distribuições discretas

Algumas distribuições discretas são utilizadas frequentemente em problemas de


controlo estatístico da qualidade. Nesta secção são estudadas as distribuições
hipergeométrica, binomial, de Poisson e de Pascal (ou distribuição binomial
negativa).

2.2.1 Distribuição hipergeométrica

Considere-se uma população de dimensão N e suponhamos que D elementos


(D ≤ N ) pertencem a um conjunto específico de interesse (por exemplo não estão
conformes com uma especificação aplicável). Retire-se, sem reposição, uma amostra
aleatória de dimensão n e contabilize-se o nº de elementos x desta amostra que
possuem a característica específica de interesse. Então, x é uma variável aleatória
hipergeométrica com a seguinte distribuição de probabilidade:

Controlo Estatístico da Qualidade/Artur Guimarães Pág 5 de15


⎛ D ⎞⎛ N − D ⎞
⎜ ⎟⎜ ⎟
p( x) = ⎝ x ⎠⎝ n − x ⎠ x = 0,1,2,..., min(n, D) (2.8)
⎛N⎞
⎜ ⎟
⎝n⎠

nD
µ= (2.9)
N

nD ⎛ D ⎞⎛ N − n ⎞
σ2 = ⎜1 − ⎟⎜ ⎟ (2.10)
N ⎝ N ⎠⎝ N − 1 ⎠

Exemplo: Um lote de dimensão 30 contém 3 unidades defeituosas. Qual é a probabilidade de que uma
amostra de 5 unidades retirada aleatoriamente contenha uma unidade não conforme?

⎛ 3 ⎞⎛ 30−3 ⎞
⎜ ⎟⎜ ⎟
P{x = 1} = p (1) = ⎝ 1 ⎠⎝ 5 − 1 ⎠ = 0.369
⎛ 30 ⎞
⎜ ⎟
⎝5⎠

A distribuição hipergeométrica constitui um apropriado modelo de probabilidade


para seleccionar uma amostra aleatória de n items de um lote com dimensão N, dos
quais D são defeituosos ou não conformes.

2.2.2 Distribuição binomial

Consideremos um processo consistindo numa sequência de n acontecimentos


independentes e em que o resultado de cada um é “sucesso” ou “insucesso”
(acontecimentos, experiências ou eventos de Bernoulli); seja constante a
probabilidade p de “sucesso” em qualquer acontecimento. Então, o número de
“sucessos” x em n experiências de Bernoulli segue uma distribuição binomial com

parâmetros n e p (n ≥ 0 e 0 < p < 1):

Controlo Estatístico da Qualidade/Artur Guimarães Pág 6 de15


p( x) = ⎛⎜ ⎞⎟ p x (1 − p )n − x
n
x = 0,1,…,n (2.11)
⎝ x⎠
µ = np (2.12)

σ 2 = np(1 − p ) (2.13)

Exemplo: Um processo de produção opera produzindo 2% de não conformes; de hora a hora é retirada
uma amostra de 50 unidades. Se ocorrerem uma ou mais unidades não conformes o processo é parado e
um técnico de controlo da qualidade é destacado para estudar a causa da produção de defeituosas. Qual
a probabilidade desta ocorrência?

R: P{x ≥ 1} = 1 − P{x < 1} = 1 − P{x = 0}= 1- 0.364 = 0.636

A distribuição binomial é apropriada em controlo estatístico da qualidade para


amostrar uma população “infinitamente grande” e em que p representa a fracção de
defeituosos ou elementos não conformes na população.

2.2.3. A Distribuição de Poisson

Uma distribuição discreta particularmente útil em controlo estatístico da


qualidade é a distribuição de Poisson, que se define da seguinte maneira:

e −λ λx
p(x ) = x = 0, 1,... (2.14.)
x!
Com parâmetro λ 〉 0 .

A média e a variância da distribuição de Poisson são, respectivamente:

µ =λ (2.15)
e
σ2 =λ (2.16)

Note-se que a média e a variância da Distribuição de Poisson são ambas iguais ao


parâmetro λ .

Controlo Estatístico da Qualidade/Artur Guimarães Pág 7 de15


A distribuição de Poisson é utilizada em controlo da qualidade para modelar o número
de defeitos ou não conformidades que ocorrem aleatoriamente numa unidade de produto
(ou por unidade de área, volume ou tempo).

Exemplo: suponhamos que o número de defeitos de brasagem por unidade que ocorre
num componente de semicondutor está distribuído de acordo com a distribuição de
Poisson com parâmetro λ = 4 . Então a probabilidade de que um semicondutor
seleccionado aleatoriamente contenha 2 ou menos defeitos é:
2
e −4 4 x
P{x ≤ 2} = ∑ = 0.0183 + 0.0733 + 0.1464 = 0.2380
x =0 x!

2.2.4 Distribuição de Pascal

A distribuição de Pascal, tal como a binomial, baseia-se em experiências ou


eventos de Bernoulli. Considerem-se então uma sequência de acontecimentos
independentes, cada um dos quais com probabilidade de sucesso p e seja x o evento
em que ocorre o sucesso de ordem ν . Então, x é uma variável aleatória de Pascal e
a sua distribuição de probabilidade é:

x −1⎞ ν
P( x) = ⎛⎜ ⎟ p (1 − p )
x −ν x = ν ,ν + 1,ν + 2,... (2.17)
⎝ν −1⎠
em que ν é inteiro e ≥ 1

ν
µ= (2.18)
p

ν (1 − p )
σ2 = (2.19)
p2

Há duas situações de especial interesse:


a) ν >0 (e não necessariamente inteiro); a distribuição resultante chama-se
binomial negativa; esta distribuição é nalguns casos utilizada na modelação de
situações tais como a ocorrência de não conformidades numa unidade de produto.

Controlo Estatístico da Qualidade/Artur Guimarães Pág 8 de15


Numa distribuição binomial negativa fixamos o “número de sucessos” e
registamos o tamanho da amostra (número de eventos de Bernoulli) requeridos
para atingir aquele número.

b) ν = 1; a distribuição resultante chama-se geométrica e corresponde à


distribuição do número de acontecimentos de Bernoulli até ao primeiro sucesso.

2.3 Distribuições contínuas

Nesta secção serão apresentadas diversas distribuições contínuas que são


importantes em problemas de controlo estatístico da qualidade, incluindo-se aqui a
distribuição normal, a distribuição exponencial, a distribuição gama e a distribuição
de Weibull.

2.3.1 Distribuição normal

É provavelmente a mais importante das distribuições contínuas, quer do ponto de


vista teórico, quer do ponto de vista prático.

Se x é uma variável aleatória normal, então a distribuição de probabilidade de x


define-se do seguinte modo:

1 ⎛ x−µ ⎞ 2
1 − ⎜ ⎟
f ( x) = e 2⎝ σ ⎠ -∞ < x < ∞ (2.20)
σ 2π

A média da distribuição normal é µ (-∞ < x < ∞ ) e a variância é σ 2 > 0.

Na figura 2.5 apresenta-se a distribuição normal, evidenciando-se o seu aspecto


simétrico e unimodal e a curva em forma de sino característica. Usa-se
frequentemente a notação x ~ N ( µ , σ 2 ) para simbolizar que a variável aleatória x

segue uma distribuição normal, com média µ e variância σ 2 .

Controlo Estatístico da Qualidade/Artur Guimarães Pág 9 de15


Figura 2.4 – A distribuição normal

Na figura 2.5 está ilustrada uma interpretação simples do significado do desvio padrão

σ de uma distribuição normal, observando-se que:

- 68.26% dos valores da população estão compreendidos no intervalo µ ± 1σ ;

- 95.46% dos valores da população pertencem ao intervalo µ ± 2σ ;

- 99.73% dos valores da população estão compreendidos no intervalo µ ± 3σ .

Fig. 2.5 – Áreas sob a curva normal

Controlo Estatístico da Qualidade/Artur Guimarães Pág 10 de15


A distribuição cumulativa normal define-se como sendo a probabilidade que a
variável normal x seja menor ou igual que determinado valor a, isto é:
1 ⎛ x−µ ⎞
2
a a − ⎜ ⎟
P{x ≤ a} = F (a ) =
1
∫ ∫σ
2⎝ σ ⎠
f ( x)dx = e dx
−∞ −∞ 2π

Para se calcular este integral é necessário fazer a mudança de variável:


x−µ
Z= (2.22)
σ
Então:

⎧ a−µ⎫ ⎛a−µ⎞
P{x ≤ a} = P ⎨Z ≤ ⎬ = φ⎜ ⎟ (2.23)
⎩ σ ⎭ ⎝ σ ⎠

Em que φ é a função de distribuição cumulativa da distribuição normal


padronizada (média igual a zero, desvio padrão igual a um).
A transformação 2.22 chama-se padronização já que converte uma variável

aleatória N ( µ , σ ) noutra N (0 , 1 ).
2

Podemos utilizar as propriedades de simetria da distribuição normal para calcular


probabilidades. Assim:

P{x ≥ a} = 1 − P{x ≤ a}
P{x ≤ − a} = P{x ≥ a} (2.24)

P{x ≥ − a} = P{x ≤ a}

Exemplo: a tensão de saída de uma fonte de alimentação segue uma distribuição normal com média
12 V e desvio padrão 0.05 V; considerando imites superior e inferior de especificação para a tensão,
respectivamente, 12.10 e 11.90 V, calcular a probabilidade de uma fonte de alimentação escolhida
aleatoriamente estar conforme a especificação.

x ≈ N (12,0.052 )
LSE = 12.10
LIE = 11.90

Controlo Estatístico da Qualidade/Artur Guimarães Pág 11 de15


P{11.90 ≤ x ≤ 12.10} = P{x ≤ 12.10}− P{x ≤ 11.90}
⎧ 12.10 − 12 ⎫
P{x ≤ 12.10} = P ⎨Z ≤ ⎬ = Φ (2) = 0.97725
⎩ 0.05 ⎭
⎧ 11.90 − 12 ⎫
P{x ≤ 11.90} = P ⎨Z ≤ ⎬ = Φ (−2) = 0.02275
⎩ 0.05 ⎭

Então:

P{11.90 ≤ x ≤ 12.10} = Φ(2) − Φ(−2) = 0.97725 − 0.02275 = 0.9545

A probabilidade de uma fonte de alimentação seleccionada aleatoriamente estar


conforme a especificação é de 95.5%.

2.3.2 Distribuição exponencial

A distribuição de probabilidade de uma variável aleatória exponencial define-se


do seguinte modo:

f ( x ) = λ e − λx x ≥ 0 (2.25)

Em que λ >0 é uma constante

1
µ= (2.26)
λ
1
σ2 = (2.27)
λ2

A distribuição cumulativa é dada por:


a
P{x ≤ a} = ∫ λe − λt dt = 1 − e − λa a ≥ 0 (2.28)
0

Na figura 2.6 representam-se três distribuições exponenciais:

Controlo Estatístico da Qualidade/Artur Guimarães Pág 12 de15


Figura. 2.6 – Distribuições exponenciais para três valores do
parâmetro λ

A distribuição exponencial é muito utilizada em problemas de fiabilidade para


modelar o tempo até a ocorrência de falha de um componente ou sistema; nestas
1
aplicações, o parâmetro λ representa a taxa de falhas do sistema e (a média da
λ
distribuição) é o tempo médio até à ocorrência de falha.

Exemplo: um fabricante de calculadoras electrónicas oferece um ano de garantia; se por qualquer


razão uma calculadora avariar naquele prazo é substituída. O tempo até avaria é descrito pela
seguinte distribuição:

f ( x ) = 0.125e −0.125 x x>0

Determinar a percentagem de calculadoras que avariarão no período de garantia.

1 1
P{x ≤ 1} = ∫ λe −λx dx = ∫ 0.125e −0.125 dx =
0 0
−0.125
= 1− e = 0.118

Controlo Estatístico da Qualidade/Artur Guimarães Pág 13 de15


2.3.3 Distribuição gama e distribuição de Weibuil

Faremos aqui apenas uma referência sumária a estes dois tipos de distribuições
contínuas dada a sua aplicação em problemas de fiabilidade não especificamente
tratados no âmbito deste curso, como sejam a modelação do tempo até ocorrência de
avarias em sistemas com redundância ou em sistemas com componentes eléctricos e
mecânicos.

2.3.3.1 Distribuição gama


λ
f ( x) = (λx)υ −1 e − λx x≥0 (2.29)
Γ(υ )
υ (> 0) - parâmetro de forma
λ (> 0) - parâmetro de escala
υ
µ= (2.30)
λ
υ
σ2 = (2.31)
λ2

Γ(υ ) = ∫ xυ −1e − x dx ; υ > 0 ;
0

se υ for um número inteiro positivo, então Γ(υ ) = (υ − 1)!

2.3.3.2 Distribuição de Weibull

β −1 ⎛ x⎞
β
β ⎛ x⎞ −⎜ ⎟
⎝θ ⎠
f ( x) = ⎜ ⎟ e x≥0 (2.32)
θ ⎝θ ⎠
θ (> 0) - parâmetro de escala
β (> 0) - parâmetro de forma
⎛ 1⎞
µ = θΓ⎜⎜1 + ⎟ (2.33)
⎝ β ⎟⎠

⎡ ⎛ 2⎞ ⎛ 1⎞
2⎤
σ 2 = θ 2 ⎢Γ⎜⎜1 + ⎟ − Γ⎜1 + ⎟ ⎥
β ⎟⎠ ⎜⎝ β ⎟⎠
(2.34)
⎢ ⎝ ⎥
⎣ ⎦

Controlo Estatístico da Qualidade/Artur Guimarães Pág 14 de15


2.4 Algumas aproximações úteis

Em certos problemas de controlo da qualidade é por vezes útil fazer aproximações


de um tipo de distribuição por outro, nomeadamente em situações em que é difícil
manipular analiticamente a distribuição original. Tal é o caso das aproximações da
hipergeométrica pela binomial, desta pela distribuição de Poisson e da binomial pela
normal. Na figura 2.8 apresenta-se esquematicamente esta abordagem.

n
(Quanto menor for , melhor a aproximação)
N
n
≤ 0. 1
N

⎛ D ⎞
B ⎜ p = ,n⎟
⎝ N ⎠

p < 0. 1
n ≥ 20
(Quanto menor for p e maior n,
melhor a aproximação)
P

np > 10 (λ = np )
p ≥ 0.5

λ ≥ 15
(Quanto maior, melhor a
aproximação)
N

⎛ µ = np ⎞
⎜ 2 ⎟ µ =σ2 =λ
⎜ σ = np (1 − p ) ⎟
⎝ ⎠

Figura 2.7 – Aproximações das distribuições de probabilidade

Controlo Estatístico da Qualidade/Artur Guimarães Pág 15 de15

You might also like