Professional Documents
Culture Documents
P() = 1.
Esta funo atribui a cada possibilidade isto , a cada elemento
do espao amostral um peso P() 0 que descreve o quo provvel
observarmos cada possvel elemento.
13
14 CHAPTER 3. PROBABILIDADE E EMBARALHAMENTO
Exemplo 1 (Moeda). Suponha que queremos modelar um nico lanamento de
uma moeda. Neste caso podemos xar = 0, 1 onde 1 corresponde a cara e 0
corresponde a coroa. Para denir um espao de probabilidades, devemos escolher
p P(1) [0, 1] e q = P(0) = 1 p. No caso em que p = q = 1/2, cara e
coroa so igualmente provveis e dizemos que a moeda justa.
Exemplo 2 (Dado). Para modelar um nico lanamento de um dado, escolhemos
= 1, 2, . . . , 6. Vrias escolhas de P podem ser feitas; a mais padro supor
que as seis faces so equiprovveis, isto ,
P(1) = P(2) = = P(6) =
1
6
.
Alguns jogos usam dados com mais faces, que poderiam ser modelados com es-
paos amostrais com mais elementos.
Normalmente, estamos interessados emcalcular a probabilidade de umevento,
que nada mais que um subconjunto E . Denimos:
P(E)
E
P() ,
onde (por denio) a soma vale zero se E = .
Exemplo 3 (Distribuio uniforme). Frequentemente consideraremos outras situ-
aes nas quais todos os elementos do espao amostral so (ou podem ser toma-
dos como) equiprovveis. Neste caso, usamos a distribuio de probabilidade que
atribui peso igual a cada elemento de :
: P() =
1
[[
.
Esta a chamada distribuio uniforme sobre .
Exemplo 4 (Campeonato Brasileiro). Imagine um campeonato de futebol com n
times, rotulados com os nmeros de 1 a n. Para facilitar, podemos supr que as re-
gras do campeonato so tais que, ao mdele, os times sero ordenados de primeiro
a ltimo sem a possibilidade de empates na classicao. O espao amostral ,
correspondente a todas as possveis classicaes nais do campeonato, pode ser
tomado como o conjunto das palavras sobre [n]; a escolha de P vai depender da
modelagem feita.
Exerccio 3. Mostre que P() = 1 e que, se E
1
, E
2
so eventos disjuntos,
P(E
1
E
2
) = P(E
1
) +P(E
2
) .
3.2. UM CASO SIMPLES DE ACASO 15
Alm disso, dados quaisquer eventos F
1
, F
2
(no necessariamente disjuntos),
prove que:
P(F
1
F
2
) = P(F
1
) +P(F
2
) P(F
1
F
2
) P(F
1
) +P(F
2
) .
Mostre ainda que o complemento E
c
E de um evento E tem probabilidade
1 P(E).
3.2 Um caso simples de acaso
Vamos comear tentando modelar uma embaralhada ao acaso. Comeamos por
um caso simples.
De cima ao acaso: Escolha um nmero r entre 1 e n ao acaso. Se
r = 1, no faa nada; se r > 1, pegue a carta mais de cima da pilha
e ponha-a na r-sima posio, mantendo a ordem relativa das outras
cartas.
Como entender este modelo? Primeiro, temos que saber como modelamos a
escolha de r. Do ponto de vista formal, isto feito via um espao de probabili-
dades.
Voltando ao embaralhamento, note que a cada escolha de r corresponde um
embaralhamento diferente, ou seja, uma permutao diferente h
r
S
n
. Para
determinar que embalhamento este, vamos ver o que acontece com cada carta.
Note que a primeira carta da pilha acaba na posio r, isto , h
r
(1) = r. As cartas
abaixo desta posio no tem sua posio alterada, mas as cartas que estavam at
a posio r tem de subir para acomodar a chegada da carta da antiga posio 1.
Logo, para cada i [n],
h
r
(i)
_
_
_
r, se i = 1;
i 1, se 2 i r;
i, se r + 1 i n.
Agora vem o ponto-chave:
A escolha aleatria de r corresponde a uma escolha aleatria de
permutao!
O que isto quer dizer? Vamos pensar em termos mais gerais. Imagine que
temos um espao de probabilidade (, P) e que, a cada elemento , cor-
responde uma permutao h
. natural pergun-
tar: qual a probabilidade que sua embaralhada corresponda a uma permutao g
qualquer? Ou seja, qual a probabilidade do evento:
E
g
: h
= g.
Esta probabilidade simplesmente a soma:
Q(g) P(E
g
) =
: h
=g
P() .
Agora note que Q(g) 0 e:
gS
n
Q(g) =
gS
n
P(E
g
) = 1;
anal, os eventos E
g
so disjuntos (a cada corresponde um nico g com h
= g)
e sua unio todo o S
n
. Logo:
Denio 5 (Distribuio induzida). Suponha que (, P) espao de probabil-
idade e que para cada associamos uma permutao h
S
n
. Ento,
se denimos Q como acima, (S
n
, Q) um espao de probabilidades e Q dita
distribuio induzida sobre S
n
.
3.3 Variveis aleatrias e distribuies induzidas
s vezes, estamos interessados em eventos associados a uma variel aleatria,
que nada mais do que uma funo X : onde um outro conjunto
nito. Observe que X induz uma distribuio de probabilidade Q sobre via a
regra:
: Q() = P(X = ) = P( : X() = ) .
Exerccio 4. Prove que Q de fato uma distribuio de probabilidade sobre .
Exemplo 5 (De dados a moedas). Suponha que (, P) corresponde ao exemplo
do dado de seis faces considerado acima, onde supomos que todas as faces so
equiprovveis. Neste caso, = 1, 2, 3, 4, 5, 6. Dena = 0, 1 e seja X()
a paridade de : isto X() = 0 se par e X() = 1 se mpar. X induz
sobre a distribuio Q correspondendo a uma moeda justa:
Q(1) = P(X = 1) = P( : par) =
1
2
.
3.4. INDEPENDNCIA 17
Exemplo 6 (O campeo brasileiro). Recorde o caso do campeonato de futebol
com n times discutido no Exemplo 4. Imagine que, dado um modelo (, P),
queremos apenas saber a probabilidade de cada time ser campeo (e no a do
ranking completo). Podemos expressar isso considerando = [n] e fazendo com
que X() associe a cada possvel ordenao dos times o nmero X() [n]
do time que primeiro colocado nesta ordenao. Neste caso,
Q() = P(X = )
a probabilidade de ser campeo sob o modelo em questo.
3.4 Independncia
Considere agora uma sequncia de espaos de probabilidade (
i
, P
i
) com 1 i
k. Cada um destes espaos corresponde a um dado fenmeno aleatrio, contendo
assim todos os seus possveis resultados. Por exemplo,
1
pode corresponder aos
lanamentos de uma moeda,
2
aos ganhos de um investimento,
3
a uma corrida
de cavalos e por a vai.
Frequentemente queremos considerar a ocorrncia conjunta destes fenmenos.
Por exemplo, uma pessoa que apostou dinheiro numa moeda, numa ao e num
cavalo vai querer saber as suas possibilidades de perdas e ganhos. Neste caso, o
espao adequado a se considerar o produto cartesiano.
=
1
2
k
.
Uma maneira de atribuir probabilidades aos elementos de supor que eles
so independentes. Informalmente, isto quer dizer que cada
i
corresponde a
um evento cuja ocorrncia no interfere nos demais eventos sendo considerados.
Matematicamente, isto corresponde a denir uma distribuio sobre com forma
de produto:
1
1
, . . .
k
k
: P((
1
, . . . ,
k
)) = P
1
(
1
)P
2
(
2
) P
k
(
k
).
Isto implica que se E
1
1
, E
2
2
, . . . , E
k
k
so eventos em cada um
dos espaos amostrais, ento o evento:
E = E
1
E
2
E
3
E
k
tem probabilidade
P(E) = P
1
(E
1
) P
2
(E
2
) P
3
(E
3
) P
k
(E
k
).
Chamamos de espao-produto e P de distribuio-produto.
18 CHAPTER 3. PROBABILIDADE E EMBARALHAMENTO
Exemplo 7 (Vrios lanamentos de uma moeda justa). Suponha que
i
= 0, 1
e P
i
(1) = p = P
i
(0) para cada 1 i k. Isto corresponde a k lanamentos de
uma mesma moeda justa. Podemos tomar
= 0, 1
k
como espao amostral conjunto para os k lanamentos e interpretar cada vetor
= (
1
, . . . ,
k
)
como descrevendo a sequncia
1
, . . . ,
k
dos resultados. Se supomos que os
lanamentos so independentes, ento:
: P() = p
||
(1 p)
k||
,
onde [[ =
1
+
2
+ +
k
o nmero total de caras nos k lanamentos. Em
particular, se p = 1/2,
: P() =
1
2
k
.
Exemplo 8 (O produto de distribuies uniformes). O caso p = 1/2 do exem-
plo anterior, coincide com a distribuio uniforme para cada moeda, e resulta na
distribuio uniforme sobre . Isto no coincidncia: sempre que cada P
i
for
uniforme:
1 i k,
i
i
: P
i
(
i
) =
1
[
i
[
,
temos
= (
1
, . . . ,
k
) : P() =
1
[
1
[
1
[
2
[
1
[
k
[
=
1
[[
,
j que o produto cartesiano
=
1
2
. . .
k
tem [[ = [
1
[ [
2
[ [
k
[ elementos. Em particular, n lanamentos indepen-
dentes de um dado justo tambm tm distribuio uniforme em
= [6] [6]
. .
n vezes
.
3.5. ALGUNS EXEMPLOS INTERESSANTES E IMPORTANTES 19
3.5 Alguns exemplos interessantes e importantes
Nessa seo apresentamos dois exemplos que sero importantes para modelar um
embaralhamento ao acaso e para estudar algumas das suas propriedades.
Exemplo 9 (O nmero de caras emk lanamentos de uma moeda justa). Considere
o espao amostral e a distribuio de probabilidade apresentados no Exemplo 7
no caso em que p = 1/2. Assim, o fenmeno probabiltico em questo aquele
no qual uma moeda justa lanada k vezes independentemente. Consideramos a
varivel aleatria
M() =
k
i=1
i
.
Como
i
= 1 se o resultado do i-simo lanamento igual a cara, e
i
= 0 caso
contrrio, temos que a varivel aleatria M conta o nmero total de caras dentre
os resultados dos k lanamentos.
A distribuio induzida por essa varivel no conjunto = 0, 1, . . . , k
Q() = P(M = ).
Podemos calcular explicitamente o valor de Q() para cada . De fato,
para que M() seja igual a , dentre os k lanamentos, exatamente tm como
resultado cara. Isso o mesmo que dizer que o vetor = (
1
, . . . ,
n
) tem
exatamente entradas iguais a 1. O nmero de maneiras de se obter entradas
iguais a 1 em um total de k entradas igual a:
_
k
_
=
k!
!(k )!
Alm disso, como P a distribuio uniforme, temos que cada resultado tem
probabilidade igual a 1/2
k
. Assim,
Q() = P(M = ) =
_
k
_
1
2
k
Observao 4. Pelo Teorema Binomial sabemos que
k
=0
_
k
_
= 2
k
assim, como esperado, a distribuio de probabilidade Q encontrada no exemplo
anterior satisfaz que
k
=0
Q() = 1.
20 CHAPTER 3. PROBABILIDADE E EMBARALHAMENTO
Note ainda que essa distribuio no uniforme. De fato, o leitor pode vericar
que valores de prximos a k/2 tm peso maior do que valores de prximos a
0 ou a k.
Denio 6. Uma varivel aleatria N satisfazendo que
P(N = ) =
_
k
_
1
2
k
1, . . . , k (3.1)
chamada Varivel Aleatria Binomial com parmetros k e 1/2.
Exemplo 10 (O paradoxo dos aniversrios). Suponha que, no Planeta X um ano
tenha exatamente M dias, onde M 1. Considere uma turma contendo n alunos,
todos eles habitantes do Planeta X. Qual a probabilidade de que haja alunos
dessa turma que faam aniversrio no mesmo dia do ano?
O problema enunciado no exemplo acima conhecido como o paradxo dos
aniversrios por ter uma resposta que, para muitas pessoas, contraintuitiva.
Abaixo mostraremos como obter uma resposta para esse problema supondo que
as datas de aniversrio so independentes e uniformes.
Como cada aluno pode fazer aniversrio em qualquer um dos M dias do ano
temos que existem M
n
diferentes possibilidades para as datas dos aniversrios de
toda a turma. Desse total obtido, vamos agora calcular a quantidade de possibili-
dades nas quais no h coincidncias de aniversrios.
Comeamos numerando os alunos de 1 a n em uma ordem arbitrria (por
exemplo, a ordem da lista de chamada para controle de frequncia). O primeiro
aluno pode fazer aniversrio em qualquer um dos M dias do ano. J o segundo
deve fazer aniversrio em um dos M 1 dias restantes. Do mesmo modo, o
i-simo aluno deve fazer aniversrio em um dos M + 1 i dias que no esto
ocupados pelos alunos anteriores. Desta forma, h um total de:
n
i=1
(M + 1 i) possibilidades para aniversrios sem coincidncia.
No nosso modelo, todas as M
n
possibilidades para os aniversrios dos n alunos
so igualmente provveis, logo a probabilidade de no haver coincidncias
1
M
n
n
i=1
(M + 1 i) =
n
i=1
_
1
i 1
M
_
.
Uma boa aproximao para esta probabilidade dada por
n
i=1
_
1
i 1
M
_
i=1
e
i1
M
= e
n(n1)
2M
.
3.5. ALGUNS EXEMPLOS INTERESSANTES E IMPORTANTES 21
Veja que no nosso planeta M = 365, logo a aproximao indica que a probabil-
idade de no haver coincidncias em uma turma com 23 pessoas de cerca de
50%.
22 CHAPTER 3. PROBABILIDADE E EMBARALHAMENTO
Chapter 4
Probabilidade e embaralhamentos
4.1 Embaralhar algo que acontece ao acaso
J vimos que a ordem na qual n cartas numeradas de 1 a n esto dispostas em uma
pilha pode ser identicada com uma das n! permutaes do conjunto [n]. Mais
ainda, uma embaralhada tambm pode ser identicada com uma permutao. Re-
alizar uma embaralhada, usualmente envolve selecionar um subconjunto de cartas
e fazer operaes envolvendo as cartas selecionadas e, possivelmente, as demais
cartas.
Sabemos que variveis aleatrias X : induzem uma distribuio de
probabilidade em . Da mesma forma, a ao de escolher ao acaso um subcon-
junto de cartas e realizar operaes, tambm ao acaso, com essas e outras cartas
induz uma distribuio de probabilidade em S
n
.
Para esclarecer como uma embaralhada pode acontecer ao acaso, vamos nos
xar em um exemplo.
Exemplo 11 (Transposies ao acaso). Suponha que um conjunto de n cartas
encontra-se organizado em uma pilha, em ordem crescente (1, 2, . . . , n) de cima
para baixo. Considere o seguinte algoritmo para embaralhar cartas.
Primeiro selecionamos aleatoriamente e de maneira uniforme dentre as n pos-
sveis escolhas uma carta. Isso quer dizer que para cada i [n], a escolha da carta
i tem probabilidade 1/n. Escolhemos agora uma outra posio j [n], indepen-
dentemente de i e de maneira uniforme. Trocamos, ento, a cartas que ocupam as
posies escolhidas. Caso elas sejam iguais, nenhuma troca feita.
Aps essa operao a ordeminicial (1, 2, . . . , n) foi provavelmente modicada
para uma outra ordem (a
1
, a
2
, . . . , a
n
), digamos. Assim, o procedimento acima
corresponde a uma embaralhada, ou seja a uma permutao. Mas qual?
A resposta para essa pergunta : depende da carta selecionada e da posio
escolhida. Como tanto a carta quanto posio so escolhidas ao acaso, a prpria
23
24 CHAPTER 4. PROBABILIDADE E EMBARALHAMENTOS
permutao algo que acontece ao acaso. Esse procedimento gera ento uma
varivel aleatria X assumindo valores em S
n
e, como consequncia, induz uma
distribuio de probabilidade Q em S
n
, que dada por
Q() = P(X = ), para cada S
n
.
Para o modelo de embaralhada descrito acima fcil exibir explicitamente a
distribuio Q. Denotamos por (j k) o elemento de S
n
denido por:
(i) =
_
_
_
k, se i = j
j, se i = k
i, caso contrrio.
em palavras, (j k) a permutao que troca j e k entre si e mantm xos os
demais elementos do conjunto [n] xos. Uma permutao desse tipo chamada
de um 2-ciclo ou transposio. Assim, por exemplo, fazendo n = 5, a permutao
(23) aquela que leva a pilha (1, 2, 3, 4, 5) na pilha (1, 3, 2, 4, 5). Denotaremos
por
T o conjunto de todos os elementos de S
n
que so 2-ciclos.
A cada embaralhada, a carta e a posio so escolhidas independentemente e com
probabilidade igual a 1/n. Assim cada possvel par escolhido com probabilidade
1/n
2
. Os resultados das escolhas se dividem em dois casos: ou a carta selecionada
coincide com aquela que ocupa a posio escolhida ou, caso contrio, essas cartas
so distintas. Note que, no primeiro caso, nenhuma transposio feita, ou seja, a
permutao resultante do processo de embaralhamento a identidade. Como esse
caso pode acontecer de n maneiras diferentes, temos que a probabilidade de que
ele ocorra igual a n
1
n
2
=
1
n
. Assim, conclumos que a distribuio Q deve dar
peso 1/n para a permutao identidade. Por outro lado, no segundo caso, uma
carta j e outra k sero trocadas entre si, dando origem a um 2-ciclo (j k). Note
que o esse mesmo 2-ciclo tambm ocorre quando, primeiro selecionamos a carta k
e depois a posio na qual se encontra a carta j. Isso mostra que cada elemento de
T ocorre com probabilidade igual a 2/n
2
, e conclumos que a distribuio Qdeve
dar esse peso a cada um desses elementos. Claramente outros tipos de permutao
nunca acontecem, logo tm peso nulo.
Acabamos de provar que, para a distribuio de probabilidade induzida em S
n
pelo modelo de embaralhada do exemplo anterior :
Q() =
_
_
_
1
n
, se = id,
2
n
2
, se T ,
0, caso contrrio.
Esperamos que o leitor esteja convencido de que, no caso geral, uma embaral-
hada ao acaso pode ser identicada com uma distribuio de probabilidade sobre
S
n
.
4.2. EMBARALHADAS INDEPENDENTES E CONVOLUES 25
Conveno 2. Realizar uma embaralhada ao acaso em um conjunto de cartas cuja
ordenao descrita por uma permutao
0
, tomar uma permutao
1
de
acordo com alguma distribuio de probabilidade Q em S
n
e depois multiplic-la
pela por
0
. O resultado da embaralhada ao acaso a permutao
1
0
.
4.2 Embaralhadas independentes e convolues
Geralmente, o processo de embaralhar um conjunto de n cartas realizado atravs
da repetio de um mesmo tipo simples de embaralhada. No Exemplo 11 cada
embaralhada ao acaso uma simples transposio de duas cartas. No entanto,
caso o processo descrito nesse exemplo fosse iterado vrias vezes poderamos
obter permutaes mais complexas.
Exemplo 12. Suponha que o processo de embaralhadas ao acaso descrito no Ex-
emplo 11, com um total de cinco cartas (n = 5), repetido de maneira indepen-
dente por trs vezes. Sejam
1
= (2 3),
2
= (3 5) e
3
= (4 1) as trs escolhas
independentes de permutaes feitas de acordo com a distribuio Q.
Ento a sequncia de embaralhadas ao acaso (
1
,
2
,
3
) fornece a permutao
3
2
1
= (4 1)(3 5)(2 3). Note que essa permutao composta leva a ordenao
de cartas (1, 2, 3, 4, 5) na ordenao (4, 3, 5, 1, 2).
Fixe uma distribuio de probabilidades Q em S
n
que corresponde a uma
nica embaralhada. Na nossa modelagem, k embaralhadas sero sempre tratadas
como permutaes independentes (
1
,
2
, . . . ,
k
), cada uma delas escolhida de
acordo com a distribuio de probabilidade Q. Isso corresponde a tomar um ele-
mento do espao amostral
=
1
2
k
= S
n
S
n
. .
k vezes
e a distribuio produto
Q
1
Q
2
Q
k
= Q Q
. .
k vezes
,
Assim,
1
,
2
, . . . ,
k
vo representar embaralhadas ao acaso independentes
que sero aplicadas sucessivamente pilha de cartas que inicia em uma disposio
inicial descrita por uma permutao
0
.
Comeando da permutao
0
, (por exemplo,
0
= id, que descreve a orde-
nao emque as cartas esto dispostas de maneira crescente de cima para baixo em
uma pilha) aps a primeira embaralhada ao acaso, obtemos a permutao
1
0
.
Aps a segunda embaralhada ao acaso, obtemos a permutao
2
1
0
, e assim
por diante at realizarmos a k-sima embaralhada ao acaso, aps a qual teremos
26 CHAPTER 4. PROBABILIDADE E EMBARALHAMENTOS
obtido a permutao
k
k1
. . .
1
0
, que descrever a ordem relativa das cartas
na pilha aps a realizao de k embaralhadas aleatrias.
Observao 5. Essa construo de repeties de embaralhadas ao acaso similar
quela do Exemplo 7 no qual uma moeda era lanada k vezes de maneira inde-
pendente. De fato, a nica diferena que o espao amostral e a distribuio de
probabilidades sobre esse espao foram modicados para aqueles que modelam o
embaralhamento ao acaso de cartas, ao invs do lanamento de uma moeda.
Como S
n
umgrupo, a multiplicao de elementos de S
n
ainda umelemento
de S
n
. Denotamos por
(k)
=
k
1
S
n
.
Como cada uma das permutaes
i
escolhida independentemente, ao acaso, de
acordo com a distribuio Q, temos que
(k)
tambm pode ser descrita por uma
distribuio de probabilidade em S
n
. Mas qual essa distribuio?
Pensemos primeiramente em
(2)
=
2
1
. Para um elemento xo g S
n
, vale
que
P(
(2)
= g) = P(
2
1
= g)
=
g
1
S
n
P(
2
g
1
= g,
1
= g
1
)
=
g
1
S
n
P(
2
= gg
1
1
,
1
= g
1
)
=
g
1
S
n
P(
2
= gg
1
1
)P(
1
= g
1
)
=
g
1
S
n
Q(gg
1
1
)Q(g
1
)
=
g
2
,g
1
S
n
;
g
2
g
1
=g
Q(g
2
)Q(g
1
).
Denotaremos a soma na lado direito da ltima igualdade por
Q Q(g) = Q
2
(g) =
g
2
,g
1
S
n
;
g
2
g
1
=g
Q(g
2
)Q(g
1
).
Assim temos que
P(
(2)
= g) = Q
2
(g),
logo Q
2
a distribuio de probabilidade induzida em S
n
pela permutao ao
acaso
(2)
=
2
1
.
Denio 7. Seja Q uma distribuio de probabilidade sobre S
n
. A distribuio
que satisfaz
Q
2
=
g
2
,g
1
S
n
;
g
2
g
1
=g
Q(g
2
)Q(g
1
)
4.2. EMBARALHADAS INDEPENDENTES E CONVOLUES 27
para todo elemento g S
n
chamada de convoluo de Q com Q.
Vamos agora generalizar o procedimento feito anteriormente para encontrar a
distribuio de
(k)
para valores arbitrrios de k.
Vamos mostrar que, para cada g S
n
,
P(
(k)
= g) =
g
k
,...,g
1
S
n
;
g
k
g
1
=g
Q(g
k
) Q(g
1
).
De fato, j sabemos que essa frmula vlida para k = 1 e k = 2. Suponhamos
que, para algum k 2 ela seja tambm vlida. Ento,
P(
(k+1)
= g) = P(
k+1
(k)
= g)
=
hS
n
P(
k+1
h = g,
(k)
= h)
=
hS
n
P(
k+1
= gh
1
,
(k)
= h)
=
hS
n
Q(gh
1
)Q
k
(h)
=
hS
n
g
k
,...,g
1
S
n
;
g
k
g
1
=h
Q(gh
1
)Q(g
k
) Q(g
1
)
=
g
k+1
,g
k
,...,g
1
S
n
;
g
k+1
g
k
g
1
=g
Q(g
k+1
)Q(g
k
) Q(g
1
),
o que encerra a demonstrao.
Denio 8. A distribuio que satisfaz
Q
k
(g) =
g
k
,...,g
1
S
n
;
g
k
g
1
=g
Q(g
k
) Q(g
1
)
para todo elemento g S
n
chamada a convoluo de Q com Q k vezes.
Pelo que mostramos acima, Q
k
a distribuio de probabilidade induzida em
S
n
pelo elemento
(k)
=
k
1
.
Convolues podem tambm ser realizadas entre distribuies distintas umas
das outras. Mas geralmente, suponha que Q
1
e Q
2
so distribuies de probabili-
dade em S
n
. Denimos a convoluo entre Q
1
e Q
2
como sendo a distribuio de
probabilidade em S
n
que atribui a cada elemento g S
n
a probabilidade
Q
2
Q
1
(g) =
g
2
,g
1
S
n
;
g
2
g
1
=g
Q
2
(g
2
)Q
1
(g
1
).
28 CHAPTER 4. PROBABILIDADE E EMBARALHAMENTOS
Uma pequena modicao nos clculos que zemos acima, nos mostra que, para
um par (
1
,
2
) S
n
S
n
distribudo de acordo com Q
1
Q
2
, a distribuio do
produto
2
1
dada pela convoluo Q
2
Q
1
.
No caso em que (
1
, . . . ,
k
) uma k-upla independente de elementos de S
n
,
cada, onde cada
i
tem distribuio Q
i
, a distribuio do produto
k
1
dada
pela convoluo:
Q
k
Q
1
(g) =
g
k
,...,g
1
S
n
;
g
k
g
1
=g
Q
k
(g
k
) Q
1
(g
1
).
4.3 A distribuio uniforme e suas propriedades
Nessa seo vamos estudar uma distribuio de probabilidade particular em S
n
,
denominada distribuio uniforme. Assim como no contexto geral do Exemplo
3, essa a distribuio sob a qual todos os elementos do espao amostral S
n
so
equiprovveis.
Denio 9. A distribuio uniforme sobre S
n
a distribuio de probabilidade
que satisfaz
() =
1
n!
para cada elemento S
n
.
Observao 6. Lembramos que a ordem das cartas em uma pilha pode ser descrita
por uma palavra (a
1
, a
2
, . . . , a
n
) que, por sua vez pode ser identicada com uma
permutao. Assim, uma distribuio de probabilidade sobre S
n
pode ser usada
para modelar tambm uma escolha ao acaso da ordem das cartas em uma pilha.
Intuitivamente, a distribuio uniforme aquela na qual a ordem das cartas
escolhida mais ao acaso.
Suponha que a ordem das cartas em uma pilha descrita pela distribuio uni-
forme. Ser que realizar uma embaralhada vai mudar a distribuio que descreve
o estado da pilha?
Vamos mostrar que a distribuio uniforme preservada por qualquer embar-
alhada xa. Matematicamente temos o seguinte:
Fato 2. A distribuio uniforme invariante sob as operaes de grupo em S
n
.
Para demonstrar esse fato, considere um evento qualquer A, isto , um sub-
conjunto de permutaes A =
1
, . . . ,
k
S
n
distintas. Como o evento A
tem k elementos e cada um deles tem peso igual a
1
n!
sob , temos que (A) =
k
n!
.
Seja S
n
qualquer. Denimos agora A =
1
, . . . ,
k
o evento que
consiste em multiplicar por todos os elementos de A. Notemos agora, que os
elementos de A so dois-a-dois distintos. De fato, se fosse
i
=
j
para
i ,= j, ento multiplicando por
1
de ambos os lados obteramos que
i
=
j
,
4.4. UNIFORMIDADE PERFEITA 29
uma contradio. Dessa forma, temos que A tem tambm k elementos, logo
(A) = (A).
4.4 Uniformidade perfeita
Descreveremos agora um algoritmo que nos permite gerar, a partir de uma pilha
de cartas ordenadas de maneira crescente de cima para baixo, uma pilha ordenada
ao acaso na qual cada uma das possveis ordens equiprovvel. Para isso vamos
aplicar embaralhadas escolhidas ao acaso em uma pilha que inicialmente tem a
ordem dada pela palavra (1, 2, . . . , n) e obteremos ao nal uma pilha na qual cada
uma das ordens aparece com probabilidade igual a
1
n!
.
Denotamos por a
0
= (1, 2, . . . , n) a palavra que descreve a ordem inicial das
cartas na pilha. Para cada k = 1, 2, . . . , n 1, sejam l
k
nmeros escolhidos
independentemente e uniformemente ao acaso no conjunto k, . . . , n. Isso quer
dizer que l
k
assume cada um dos n k + 1 possveis valores em k, . . . , n com
probabilidade igual a
1
nk+1
e de maneira independente dos demais valores de l
j
para j ,= k. Realizamos agora a seguinte operao:
trocamos entre si a carta que ocupa atualmente a posio 1
e a carta que ocupa atualmente a posio l
1
.
Ao nal desse passo, a ordem das cartas na pilha descrita por uma palavra a
1
=
(a
1
1
, a
1
2
, . . . , a
1
n
). A carta que ocupa a primeira posio, isto , a carta de nmero
a
1
1
, era a carta que ocupava a posio l
1
. Isso o mesmo que armar que a carta
que ocupa a primeira posio foi escolhida uniformemente ao acaso no conjunto
1, . . . , n, logo,
P(a
1
1
= j) =
1
n
para cada j 1, . . . , n.
Seja a
k1
= (a
k1
1
, a
k1
2
, . . . , a
k1
n
) a ordem da pilha aps o passo de nmero
k 1 ter sido realizado. Denimos de maneira recursiva a ordem a
k
da pilha aps
o k-simo passo da seguinte forma:
trocamos entre si a carta que ocupa atualmente a posio k
e a carta que ocupa atualmente a posio l
k
.
Note que, no k-simo passo, a carta que assumir a posio k (isto , a carta a
k
k
)
uma das cartas que, aps o k 1-simo passo, ocupavam posies menores ou
igual do que k. Em particular essa carta no mais poder sair da posio k em
passos subsequentes. Note ainda que essa carta , escolhida uniformemente no
conjunto das cartas que ainda no foram escolhidas nos passos anteriores, isto
30 CHAPTER 4. PROBABILIDADE E EMBARALHAMENTOS
no conjunto complementar a a
1
1
, a
2
2
, . . . , a
k1
k1
. Assim, cada escolha para a carta
a
k
k
nesse conjunto complementar tem probabilidade igual a
1
nk+1
.
Isso mostra que para qualquer k-upla de nmeros distintos j
1
, j
2
, . . ., j
k
, vale
que
P(a
k
1
= j
1
, a
k
2
= j
2
, . . . , a
k
k
= j
k
) =
1
n
1
(n 1)
1
(n k + 1)
. (4.1)
Denotamos, para qualquer palavra (j
1
, j
2
, . . . , j
n
),
Q(j
1
, j
2
, . . . , j
n
) = P(a
k
1
= j
1
, a
k
2
= j
2
, . . . , a
n
n
= j
n
).
Ento Q a distribuio de probabilidade induzida no conjunto das palavras pela
sequncia de embralhadas ao acaso descritas acima. Atravs da identicao de
palavras com permutaes, podemos entender Q como uma distribuio de prob-
abilidade em S
n
.
Em particular, fazendo k = n na Equao 4.1, obtemos que
Q(j
1
, j
2
, . . . , j
n
) =
1
n!
,
isto, , Q corresponde distribuio uniforme em S
n
.
4.5 Aproximando a distribuio uniforme
Como vimos na Seo 4.2, um processo de embaralhamento de cartas pode ser
modelado pela multiplicao sucessiva de permutaes escolhidas ao acaso e in-
dependentemente de acordo com uma distribuio de probabilidade Q denida
em S
n
. Assim, em geral, no podemos ter certeza de qual a ordem relativa entre
as cartas aps a k-sima embaralhada, mas sim a probabilidade de que essa ordem
seja dada por uma permutao g S
n
, que igual a Q
k
(g).
Intuitivamente falando, o objetivo principal de um embaralhamento fazer
comque essa distribuio de probabilidade Q
k
se aproxime sucientemente daquela
que associa a cada g S
n
o peso
1
n!
, isto a distribuio uniforme em S
n
. Assim,
o que gostaramos de saber : quantas embaralhadas seriam necessrias para que
essas distribuies estejam prximas?.
Nosso objetivo nessa seo formalizar o conceito de distncia entre dis-
tribuies, dando sentido matemtico argumentao do pargrafo anterior. O
conceito chave para tal propsito denido a seguir:
Denio 10. Seja um espao amostral nito e Q
1
e Q
2
duas distribuies de
probabilidade em . Denimos a distncia em variao total entre Q
1
e Q
2
como
sendo:
d
vt
(Q
1
, Q
2
) = sup
A
[Q
1
(A) Q
2
(A)[ .
4.5. APROXIMANDO A DISTRIBUIO UNIFORME 31
Seja T() o conjunto de todas as distribuies de probabilidade em . Ento
a distncia em variao total realmente uma distncia em T(). Convidamos o
leitor a mostrar isso no seguinte:
Exerccio 5. Mostre que, para quaisquer Q
1
, Q
2
e Q
3
distribuies em S
n
, vale
que:
1. d
vt
(Q
1
, Q
2
) 0 e d
vt
(Q
1
, Q
2
) = 0 se, e somente se, Q
1
= Q
2
;
2. d
vt
(Q
1
, Q
2
) = d
vt
(Q
2
, Q
1
);
3. d
vt
(Q
1
, Q
2
) d
vt
(Q
1
, Q
3
) + d
vt
(Q
3
, Q
2
).
Conclua que d
vt
realmente uma distncia em T().
Exemplo 13. Tomemos = S
n
e seja a distribuio uniforme em S
n
. Ento
para cada distribuio Q S
n
, temos que
d
vt
(Q, ) = max
AS
n
Q(A)
[A[
n!
.
Como caso particular, considere Q a distribuio de probabilidade concentrada
em
0
= id, isto , a distrituio satisfazendo:
Q(A) =
_
1, se id A,
0, caso contrrio.
Para essa distribuio temos que Q(A)
|A|
n!
no negativo e sempre assume o
seu mximo quando A = id. Sendo assim,
d
vt
(Q, ) = Q(id)
[id[
n!
= 1
1
n!
.
Note que, quanto maior n, mais longe essa distribuio Q se encontra da dis-
tribuio estacionria.
Como vimos no exemplo 4.4, aps realizarmos uma quantidade nita de trans-
posies ao acaso possvel que atinjamos exatamente a distribuio uniforme.
De fato, naquele exemplo, se denotarmos a distribuio da k-sima embaralhada
por Q
k
, ento vale que Q
1
Q
2
Q
n
= . (Observe, no entanto que, no caso
desse exemplo cada uma das transposies tinha uma distribuio de probabili-
dade diferente).
Em outros modelos de embaralhamento, a distribuio uniforme geralmente
no atingida aps a realizao de uma quantidade nita de embaralhadas. O que
podemos esperar, no entanto, que a distribuio de probabilidade que descreve
o estado da pilha aps k embaralhadas se aproxime arbitrariamente da uniforme
32 CHAPTER 4. PROBABILIDADE E EMBARALHAMENTOS
quando k sucientemente grande. Isto ser verdade, por exemplo, no modelo de
embaralhamento mais realista que denimos na seo 4.6.
Podemos ento formular nossa pergunta principal. Seja Q a distribuio de
probabilidade induzida em S
n
por uma embaralhada. Aps k embaralhadas inde-
pendentes temos que a distribuio que descreve o estado da pilha a convoluo
Q
k
.
Pergunta: Quantas embaralhadas so necessrias isto , o quo
grande k precisa ser para que Q
k
e estejam prximas?
Para ser mais preciso devemos dizer o que queremos dizer com estejam prx-
imas. Para isso, xemos um valor que pode ser entendido como uma tolern-
cia. Queremos ento saber qual a quantidade mnima de embaralhadas que
precisamos realizar para que
d
vt
(Q
k
, ) < .
A prxima denio se torna ento til:
Denio 11 (Tempo de mistura). Seja > 0 xado e Q uma distribuio de
probabilidade em S
n
. Denimos o tempo de mistura como sendo:
t
mix
() = infk 0; d
vt
(Q
k
, ) .
Quando escolhemos =
1
4
, escrevemos simplesmente, t
mix
, isto , t
mix
= t
mix
(1/4).
Feita precisa a noo de aproximar a distribuio uniforme, podemos agora
enunciar precisamente o tipo de problema que queremos responder ao nal desse
curso:
Problema: Fixada uma distncia de tolercia > 0, como o tempo
de mistura t
mix
() se comporta em funo de n, quantidade de cartas
na pilha n?
.
4.6 O embaralhamento de Gilbert-Shannon-Reeds
Nessa seo apresentaremos ummodelo para embaralhamentos que mais realista
do que o modelo de transposio ao acaso e o modelo de cima-para-o-acaso que
foram apresentados anteriormente.
Lembramos que nas sees 4.1 e 4.2 vimos que um modelo para embaral-
hamentos consiste em aplicar sucessivamente esquerda uma sequncia de per-
mutaes
1
,
2
, . . . escolhida independentemente e ao acaso de acordo com uma
4.6. O EMBARALHAMENTO DE GILBERT-SHANNON-REEDS 33
distribuio de probabilidade em S
n
. Assim, especicar um mtodo de embaral-
hamento se reduz a especicar uma distribuio de probabilidade Q em S
n
.
Vamos agora discutir informalmente ummtodo de embaralhamento. Amatemtica
vir depois. Em um modelo de embaralhamento realista, um jogador inicialmente
corta a pilha de n cartas em duas pilhas, a primeira delas contendo M cartas e
a outra contendo n M. Esse corte feito ao acaso, signicando que a quanti-
dade M escolhida ao acaso de acordo com uma distribuio de probabilidade
em [n] = 1, 2, 3, . . . , n. Feito isso, o jogador ento intercala as cartas das duas
pilhas formando novamente uma nica pilha contendo todas as n cartas. A inter-
calao tambm realizada ao acaso, signicando que o jogador escolhe ao acaso
uma dentre as vrias maneiras de intercalar as cartas das duas pilhas entre si.
Uma maneira prtica de realizar o embaralhamento dada abaixo:
corte ao acaso a pilha originial em duas pilhas, uma contendo M e a outra
contendo n M cartas.
coloque as pilhas lado a lada sobre uma mesa.
faa com que as cartas das duas pilhas caiam gradativamente, e ao acaso,
uma sobre as outras, formando novamente um nica pilha.
Esses processos podem ser matematicamente descritos como segue:
1. Seja M uma varivel aleatria binomial com parmetros m e
1
2
(veja a
Equao 3.1). Divida a pilha em duas outras pilhas, sendo a primeira con-
tendo M e a segunda contendo n M cartas. Existem agora
_
n
M
_
maneiras
de intercalar as duas pilhas. Escolha uniformemente uma dentre essas maneiras
e intercale as duas pilhas.
2. Seja M uma varivel aleatria binomial com parmetros m e
1
2
. Divida
a pilha em duas outras pilhas, sendo a primeira contendo M e a segunda
contendo n M cartas. Segure as pilhas lado-a-lado sobre uma mesa e
deixe com as suas cartas caiam umas sobre as outras formando uma nica
pilha seguindo a seguinte regra: se, em um dado momento, a primeira
pilha contem a cartas e a segunda pilha contem b cartas, ento a prxima
carta cair da primeira pilha com probabilidade igual a
a
(a+b)
e da segunda
pilha com probabilidade igual a
b
(a+b)
.
Denio 12. O modelo de embaralhamento denido pelos itens 1 e 2 acima
chamdo Embaralhamento de Gilbert-Shannon-Reeds.
Para que a denio faa sentido, preciso mostrar que os itens 1 e 2 na
denio do embaralhamento de Gilbert-Shannon-Reeds so equivalentes, isto ,
que os procedimentos neles descritos induzem a mesma distribuio de probabil-
idade em S
n
. Precisamos antes de uma denio.
34 CHAPTER 4. PROBABILIDADE E EMBARALHAMENTOS
Denio 13. Seja S
n
uma permutao e (a
1
, a
2
, . . . , a
n
) a sua representao
como uma palavra. Uma sequncia levantadora de uma sequncia maximal
(estritamente) crescente (a
i
1
, . . . , a
i
k
) contida na palavra (a
1
, a
2
, . . . , a
n
).
Exemplo 14. Seja n = 10 e suponha que, aps a realizao de uma embaral-
hada do embaralhamento de Gilbert-Shannon-Reeds a pilha encontra-se ordenada
segundo a palavra:
(1, 2, 7, 3, 8, 4, 5, 9, 10, 6).
A permutao correspondente possui duas sequncias levantadoras, a saber:
(1, 2, 3, 4, 5, 6) e (7, 8, 9, 10)
Suponha que realizamos uma nica embaralhada segundo o modelo de em-
baralhamento de Gilbert-Shannon-Reeds em uma pilha contendo n cartas inicial-
mente ordenada de maneira crescente, de cima para baixo. Ento a pilha resul-
tante ter exatamente uma ou exatamente duas sequncias levantadoras. De fato
se for M = k para algum 0 < k < n ento teremos duas pilhas 1, . . . , k e
k + 1, . . . , n. Ao intercalar as cartas dessas duas pilhas entre si, a ordem rel-
ativa em cada uma das pilhas preservada. Note que possvel que uma nica
sequncia levantadora seja formada, por exemplo no caso em que as cartas da
primeira pilha so todas posicionadas sobre as cartas da segunda pilha. Tambm,
caso M = 0 ou M = n a permutao resultante ter uma nica sequncia levan-
tadora.
Mostraremos agora que a distribuio de probabilidade induzida em S
n
por
ambas as formas de denir o modelo de embaralhamento de Gilbert-Shannon-
Reeds dada por
Q() =
_
_
_
1
2
n
, se tem duas seq. levantadoras ;
n+1
2
n
, se = id;
0, caso contrrio.
Primeiro analisamos o mtodo descrito no item 1. claro que permutaes
que no so iguais identidade ou tm mais do que duas sequncias levanta-
doras no podem ser geradas por uma embaralhada, logo tm peso nulo na dis-
tribuio. Seja uma permutao contendo exatamente duas sequncias levanta-
doras (1, . . . , k) e (k + 1, . . . , n). Para que tal permutao seja gerada, devemos
ter obrigatoriamente que M = k, o que ocorre com probabilidade igual a
_
n
k
_
2
n
.
Por outra lado, xado que M = k, a permutao decorre de uma das
_
n
k
_
inter-
calaes possveis, logo ser obitida com probabilidade igual a
_
n
k
_
1
. Segue da
que a probabilidade de que o procedimento resulte na permutao igual a
_
n
k
_
2
n
_
n
k
_
1
=
1
2
n
.
4.6. O EMBARALHAMENTO DE GILBERT-SHANNON-REEDS 35
A permutao identidade pode ser gerada, de (n+1) maneiras diferentes, a saber:
M = 0
M = n
M = k para 0 < k < n e a intercalao feita de tal modo que todas as
k cartas da primeira pilha so colocadas acima de todas as n k cartas da
segunda pilha.
Os dois primeiros casos claramente tm probabilidade igual a 2
n
. Aplicando o
mesmo racioco usados para permutaes comduas sequncias levantadoras pode-
mos mostrar que o terceiro caso tambm tem probabilidade igual a 2
n
. Assim
conclumos que
Q(id) =
n + 1
2
n
Agora analisamos o mtodo descrito no item 2. Seja uma permutao con-
tendo duas sequncias levantadoras (1, . . . , k) e (k + 1, . . . , n). Ento, obrigato-
riamente, M = k, o que ocorre com probabilidade igual a
_
n
k
_
2
n
. Fixado isso,
qualquer maneira de fazer as cartas das pilhas 1, . . . , k e k + 1, . . . , n tem
probabilidade igual a
k!(n k)!
n!
=
_
n
k
_
1
. (4.2)
Segue da que a probabilidade da permutao ser gerada
_
n
k
_
2
n
_
n
k
_
1
=
1
2
n
.
Para se convencer sobre a validade da frmula 4.2 o leitor deve pensar em um
exemplo:
Exemplo 15. Considere n = 7 e k = 3 e suponha que as cartas cairam de forma a
gerar a permutao descrita pela palavra
(1, 4, 2, 5, 6, 7, 3)
Reconstruindo o embaralhamento, claramente obtemos que as duas pilhas eram
inicialmente (1, 2, 3) e (4, 5, 6, 7). E ento as cartas cairam na ordem dada pela
palavra acima. A probabilidade de que a carta 1 tenha sido a primeira a cair
igual a
3
7
, pois h trs cartas na primeira pilha e sete no total. Depois disso, a
probabilidade de que a carta 4 caia igual a
4
6
j que h quatro cartas na segunda
pilha e seis no total. Em seguida, as cartas 2, 5, 6, 7 e 3 caem com probabilidades
iguais a
2
5
,
3
4
,
2
3
,
1
2
e
1
1
respectivamente. Assim, a probabilidade de que as cartas
tenham cado na ordem especicada pela palavra acima igual a
3
7
4
6
2
5
3
4
2
3
1
2
1
1
=
(3 2 1)(4 3 2 1)
7 6 5 4 3 2 1
=
3! 4!
7!
36 CHAPTER 4. PROBABILIDADE E EMBARALHAMENTOS
Chapter 5
Tcnicas de prova
Agora j sabemos o que queremos provar, mas ainda no sabemos como faz-lo.
Neste captulo apresentamos nossas principais tcnicas para estudar a distncia de
uma distribuio sobre permutaes para a distribuio uniforme.
5.1 Eventos fortemente uniformes
Vamos imaginar que temos uma distribuio Q sobre permutaes que induzida
por um espao de probabilidade (, P) e uma varivel aleatria X : S
n
.
Vamos fazer uma denio.
Denio 14 (Evento fortemente uniforme - EFU). Um evento E dito
fortemente uniforme se:
S
n
: P(E X = ) =
P(E)
n!
.
Vamos pensar num caso bastante simples.
Exemplo 16. Imagine que = 0, 1 S
n
e que P uniforme; isto modela
uma escolha de moeda justa b 0, 1 e de permutao uniforme g S
n
.
Denimos:
X(b, g) g se b = 1 ou id se b = 0.
Ou seja, se a moeda d cara, X uma permutao uniformemente distribuda em
S
n
; se b = 0, X a identidade. Neste caso, vemos que:
E b = 1 1 S
n
EFU, pois P(E) = 1/2 e
g S
n
: P(E X = g) = P((1, g)) =
1
2n!
.
37
38 CHAPTER 5. TCNICAS DE PROVA
Veja ainda que:
Q(id) =
1
2
+
1
2n!
e Q(g) =
1
2n!
para g S
n
id.
Do que nos servem eventos fortemente uniformes? A proposio a seguir nos
diz o que devemos fazer.
Proposio 1. Suponha que Q uma distribuio sobre S
n
que induzida por
(, P) e X : S
n
. Ento, para qualquer EFU E ,
d
vt
(Q, ) 1 P(E) .
Observao 7. O resultado da proposio acima, nos fornece a seguinte cota
d
vt
(Q, ) 1/2. Escolhendo A = S
n
id na denio de d
vt
, vemos que
d
vt
(Q, ) = 1/2 1/2n!, logo a cota dada pelo EFU bastante precisa neste
caso.
Para provar a Proposio, precisamos mostrar que para qualquer subconjunto
A S
n
:
[A[
n!
Q(A)
1 P(E) ,
pois a d
vt
o mximo das quantidades no lado direito. Comeamos provando que:
Para todo A S
n
:
[A[
n!
Q(A) 1 P(E) . (5.1)
Veja que:
Q(A) =
gA
Q(g) =
gA
P(X = g)
pela denio de distribuio induzida. Como E um EFU,
g S
n
: P(X = g) P(X = g E) =
P(E)
n!
,
logo
Q(A)
gA
P(E)
n!
= P(E)
[A[
n!
e deduzimos:
[A[
n!
Q(A) (1 P(E))
[A[
n!
1 P(E) ,
como desejado, j que [A[ [S
n
[ = n!.
5.2. INVERTENDO EMBARALHAMENTOS 39
Agora conclumos a prova. Pela desigualdade (5.1), temos que
[A[
n!
Q(A)
1 P(E)
sempre que a diferena de que tomamos mdulo do lado direito positiva ou zero.
Para terminar a prova, s precisamos mostrar agora que a mesma desigualdade
vale se a diferena negativa. Neste caso, basta provar que
Q(A)
[A[
n!
1 P(E) .
Para isso, vamos reaproveitar o resultado em (5.1). Dena o conjunto B = S
n
A,
o complementar de A. Veja que Q(B)+Q(A) = 1, portanto Q(B) = 1Q(A).
De forma anloga, como [B[ = n! [A[, [B[/n! = 1 [A[/n!. Deduzimos que:
Q(A)
[A[
n!
=
[B[
n!
Q(B) .
Como B subconjunto de S
n
, podemos aplicar (5.1) a este conjunto para concluir
que:
Q(A)
[A[
n!
=
[B[
n!
Q(B) 1 P(E) ,
como queramos demonstrar.
5.2 Invertendo embaralhamentos
Aplicar a tcnica de EFUs exige que se compreenda bem o que o embaralhamento
faz, o que nem sempre fcil. Nesta seo mostraremos que, sempre que for
conveniente, possvel trocar o embaralhamento estudado por um outro, chamado
de embaralhamento invertido, que pode ser bem mais fcil de analisar.
Denio 15. Suponha que Q uma distribuio de probabilidade sobre S
n
. A
distribuio invertida de Q, denotada por Q
1
, aquela denida pela receita:
Q
1
(g) Q(g
1
) (g S
n
).
Intuitivamente, uma embaralhada segundo Q
1
corresponde a sortear g se-
gundo Q e depois embaralhar as cartas no segundo g, mas segundo g
1
.
Por que Q
1
tambm uma distribuio de probabilidade? Claramente, Q
1
(g)
0 para cada g. Alm disso, a operao que leva g em sua inversa uma bijeo
do grupo S
n
consigo mesmo. Isto , para cada g existe um nico h com g
1
= h.
Portanto:
gS
n
Q
1
(g) =
gS
n
Q
_
g
1
_
=
hS
n
Q(h) = 1.
Portanto, os pesos Q
1
(g) satisfazem a denio de distribuio de probabilidade.
40 CHAPTER 5. TCNICAS DE PROVA
Exerccio 6. Mostre que, ao inverter duas vezes uma distribuio, voltamos dis-
tribuio original (isto tem a ver que a operao inversa em S
n
satisfaz (g
1
)
1
=
g).
Exerccio 7. Mostre que a invertida da distribuio uniforme a prpria dis-
tribuio uniforme.
Como dissemos acima, nosso interesse mostrar que trocar Q por sua verso
invertida no altera o problema que queremos estudar. Provaremos isto em duas
partes. A primeira nos diz que, para inverter uma convoluo, basta inverter as
distribuies convoludas".
Proposio 2. Para qualquer Q como acima e t > 0 inteiro,
(Q
1
)
t
= (Q
t
)
1
.
A prova disto no difcil. Veja que, para qualquer g S
n
,
(Q
t
)
1
(g) = Q
t
(g
1
)
a soma de Q(g
1
) Q(g
k
) sobre todas as escolhas de g
1
, , g
k
S
n
com
g
1
g
k
= g
1
.
Denindo
h
1
= g
1
k
, h
2
= g
1
k1
, . . . , h
k
= g
1
1
,
e lembrando da regra da inversa do produto, vemos que:
g
1
g
k
= g
1
se e somente se h
1
h
2
h
k
= g.
Como a inversa uma bijeo de S
n
, temos que:
Q
t
(g
1
) =
h
1
,...,h
k
S
n
:
h
1
h
k
=g
Q(h
1
k
)Q(h
1
k1
) Q(h
1
1
)
=
h
1
,...,h
k
S
n
:
h
1
h
k
=g
Q
1
(h
1
) Q
1
(h
k
)
= (Q
1
)
t
(g)
Logo
g S
n
: (Q
t
)
1
(g) = (Q
1
)
t
(g), CQD.
Nosso segundo resultado sobre distribuies invertidas que elas esto to
perto (ou longe) da distribuio uniforme quanto as originais.
5.3. OINVERSODOEMBARALHAMENTODE GILBER-SHANNON-REEDS41
Proposio 3. Para qualquer Q como acima:
d
vt
(Q, ) = d
vt
(Q
1
, ).
Para provar isto, vamos denir, para cada subconjunto A S
n
, a sua imagem
invertida:
A
1
g
1
: g A.
Como j dissemos antes, a operao inverso uma bijeo de S
n
em si mesmo.
Logo A e A
1
sempre tm o mesmo nmero de elementos. Vamos mostrar que
sempre vale a seguinte identidade.
Q(A) = Q
1
(A
1
) e Q
_
A
1
_
= Q
1
(A). (5.2)
Portanto, para qualquer A S
n
,
max
AS
n
Q(A)
|A|
n!
= max
AS
n
Q
1
(A
1
)
|A
1
|
n!
= max
BS
n
Q
1
(B)
|B|
n!
,
ou seja,
d
vt
(Q, ) d
vt
(Q
1
, ).
Do mesmo modo, invertendo os papis das distribuies,
d
vt
(Q
1
, ) d
vt
(Q, )
e temos a desigualdade desejada. Para provar (5.2), comeamos observando que
Q(A) =
aA
Q(a) =
bA
1
Q
_
b
1
_
.
Para mostrar isso, basta tomar b a
1
e notar que isto resulta numa corre-
spondncia biunvoca entre A e A
1
. Pela denio da invertida,
bA
1
Q
_
b
1
_
=
bA
1
Q
1
(b) = Q
1
(A
1
),
portanto Q(A) = Q
1
(A
1
). A prova de que Q(A
1
) = Q
1
(A) anloga.
5.3 Oinverso do embaralhamento de Gilber-Shannon-
Reeds
Na Seo 4.6 deduzimos a seguinte expresso para a distribuio induzida em S
n
pelo embaralhamento de Gilbert-Shannon-Reeds:
Q() =
_
_
_
1
2
n
, se tem duas seq. levantadoras ;
n+1
2
n
, se = id;
0, caso contrrio.
42 CHAPTER 5. TCNICAS DE PROVA
Nosso objetivo nessa seo interpretar a distribuio inversa Q
1
encon-
trando quais so as operaes com cartas que induzem essa distribuio em S
n
.
Isso nos fornecer uma descrio do embaralhamento inverso de Gilbert-Shannon-
Reeds. Como Q
1
() = Q(
1
) temos que:
Q
1
() =
_
_
_
1
2
n
, se
1
tem duas seq. levantadoras ;
n+1
2
n
, se = id;
0, caso contrrio.
Para mostrar como induzir essa distribuio em S
n
a partir de operaes com
cartas, consideramos que uma pilha com n cartas encontra-se inicialmente orde-
nada de maneira crescente de cima para baixo. Para cada i 1, . . . , n, lance
independentemente uma moeda justa. Selecione com a mo esquerda todas as
cartas i para as quais o resultado do lanamento da i-sima moeda foi coroa, for-
mando com elas uma pilha que mantm a ordem parcial. Com a mo direita,
selecione todas as cartas para as quais o resultado foi igual a cara, formando tam-
bm uma pilha que mantm a ordem relativa entre elas. Posicione agora a pilha
de cartas da mo esquerda sobre aquela que est na mo direita, formando uma
nica pilha.
Mostraremos que esse modelo de embaralhamento induz sobre S
n
a distribuio
Q
1
dada acima. Para ver isso, note que cada possvel resultado para o lanamento
conjunto das n moedas tem probabilidade igual a 1/2
n
j que o experimento con-
siste de n lanamentos independentes de uma moeda justa. Observamos agora que
as operaes do modelo descrito acima no alteram o embaralhamento da pilha
em exatamente n + 1 resultados dos lanamentos das n moedas. De fato, se para
algum k 0, . . . , n temos que todos os k primeiros lanamentos tm como
resultado coroa e todos os n k ltimos lanamentos tm como resultado cara,
ento a pilha que car na mo direita ser a (1, . . . , k) (ou nenhuma pilha quando
k = 0) enquanto que a pilha que car na mo direita ser a pilha (k + 1, . . . , n)
(ou nenhuma pilha quando k = n). Assim, ao posicionarmos a primeira pilha so-
bre a segunda obteremos a pilha original (1, . . . , n). Segue da que a distribuio
de probabilidade induzida em S
n
confere peso igual a (n + 1)/2
n
para a permu-
tao identidade, como queramos.
Suponha agora que a permutao induzida seja tal que
1
tenha, exata-
mente, duas sequncias levantadoras representadas por (a
i
1
, . . . , a
i
k
) e (a
j
1
, . . . , a
j
l
)
. Ento o processo de lanamentos de moedas que gerou deve atribuir coroa aos
ndices i
1
, . . . , i
k
e cara aos indces j
1
, . . . , j
k
(ou vice-versa). Em todo caso,
haver um nico resultado para o lanamento conjunto das n moedas que dar
origem a . Assim o peso atribudo a pela distribuio de probabilidade in-
duzida igual a 1/2
n
.
5.4. UM RESUMO 43
5.4 Um resumo
Qual o resultado disto tudo? A ideia que, para analisar t embaralhadas suces-
sivas modeladas por uma distribuio Q, basta analisar t embaralhadas invertidas
repetidas. Anal, utilizando em conjunto as Proposies 2 e 3 acima, vemos que:
d
vt
(Q
t
, ) = d
vt
((Q
1
)
t
, ).
Assim, para mostrar que, para um determinado t, d
vt
(Q
t
, ) pequena, basta
encontrarmos um evento fortemente uniforme para (Q
1
)
t
. Esta ser a estratgia
que adotaremos para provar nosso resultado principal.
44 CHAPTER 5. TCNICAS DE PROVA
Chapter 6
Doze embaralhadas bastam
Nesse captulo, sero utilizadas os conceitos e as tcnicas apresentadas no captulo
anterior para demonstrar o resultado de que, para um baralho contendo 52 cartas,
bastam doze embaralhadas para que a distribuio esteja perto da uniforme.
6.1 Bits e embaralhamentos
Lembramos que, para analisar a distncia em variao total entre Q
t
e , basta
considerar a distncia entre (Q
1
)
t
e , j que, como mostrado na Proposio
3, essas duas distncias coincidem. Obteremos uma cota superior para o tempo
de mistura do embaralhamento de Gilbert-Shannon-Reeds utilizando um evento
fortemente uniforme (EFU) para (Q
t
)
1
mas, para isto, precisamos de uma forma
alternativa para descrever (Q
1
)
t
.
Lembramos que a um lanamento de moedas, associamos o dgito 0 ao re-
sultado coroa e o dgito 1 para o resultado cara. Como vimos na Seo 5.3 o
inverso do embaralhamento de Gilbert-Shannon-Reeds associa a cada carta um
rtulo 0 ou 1 independentemente e depois, posiciona todas as cartas que rece-
beram o rtulo 0 sobre as cartas que receberam o rtulo 1, sem alterar a posio
relativa inicial das cartas que recebem o mesmo rtulo.
Ao analisarmos duas embaralhadas independentes, cada carta ter associada a
si uma das sequncia de dois bits 00, 10, 01 e 11. Assim, todas as cartas rotuladas
com a sequncia 00 caro posicionadas acima daquelas rotuladas com a sequn-
cia 10 que, por sua vez, caro sobre aquelas rotuladas com a sequncia 01 que,
nalmente, caro sobre as rotuladas com a sequncia 11. Cartas rotuladas com
a mesma sequncia de dois dgitos permanecem ordenadas de forma crescente de
cima para baixo.
Do mesmo modo, para um dado tempo t podemos associar a cada carta i [n]
45
46 CHAPTER 6. DOZE EMBARALHADAS BASTAM
a sequncia de bits atribuda a i:
b(i) (b
1
(i), b
2
(i), . . . , b
t
(i)) 0, 1
t
As cartas na pilha so ordenadas segundo a ordem induzida por suas sequncias.
Mais exatamente, a carta i ca acima de j se e somente se ocorre um dos seguintes
casos.
Caso 1 Se b(i) = b(j), ento i est por cima de j se e somente se j estava assim no
incio.
Caso 2 Se b(i) ,= b(j), seja 1 s t o ltimo instante de tempo em que b
s
(i) ,=
b
s
(j) (de modo que b
u
(i) = b
u
(j) se s < u t). Ento i est por cima de j
se e somente se b
s
(i) = 0 e b
s
(i) = 1.
6.2 O evento fortemente uniforme
Lembrando que xamos um t acima, podemos denir o nosso evento fortemente
uniforme E. Ele ocorre se e somente se cada i [n] recebe uma sequncia distinta
de bits.
E 1 i < j n : b(i) ,= b(j)
.
Vamos mostrar que E de fato um EFU. Como cada sequncia de dgitos
gerada por lanamentos independentes de moedas honestas, ento cada uma das
sequncias de t bits tema mesma probabilidade, a saber 1/2
t
. Dentro do evento E,
as sequncias de t dgitos so todas elas distintas, e portanto a posio das cartas
na pilha ca totalmente determinada por essas sequncias, sem levar em conta os
nomes iniciais das cartas. Isto , se trocamos os rtulos iniciais das cartas, isto
no muda a probabilidade P
_
E
(t)
= g
_
para qualquer g S
n
, onde
(t)
descreve o estado da pilha aps t embaralhadas.
Vejamos agora que isto implica que para qualquer g S
n
P
_
E
(t)
= g
_
= P
_
E
(t)
= id
_
. (6.1)
Para isto, imagine que modicamos as posies iniciais das cartas de acordo
com a permutao g. Deste modo, a ordenao no tempo t
(t)
g. Como j vimos
acima, alterar os nomes iniciais das cartas no altera probabilidades em E, logo:
P
_
E
(t)
= g
_
= P
_
E
(t)
g = g
_
Mas
(t)
g = g a mesma coisa que
(t)
= id, logo a Equao (6.1) vlida.
6.3. UMA COTA PARA O TEMPO DE MISTURA 47
Para terminar a prova de que E EFU, observamos que os valores de P
_
E
(t)
= g
_
tm de ser todos iguais. Alm disso, os eventos E
(t)
= g so disjuntos e
sua unio E. Portanto, para qualquer h S
n
n! P
_
E
(t)
= h
_
=
gS
n
P
_
E
(t)
= g
_
= P(E) ,
logo
P
_
E
(t)
= h
_
=
P(E)
n!
.
6.3 Uma cota para o tempo de mistura
Podemos agora obter uma limitao superior para o tempo de mistura do embar-
alhamento de Gilbert-Shannon-Reeds em funo de n, a quantidade de cartas.
Proposio 4. Para o embaralhamento de Gilbert-Shannon-Reeds em uma pilha
de n cartas, o tempo de mistura satisfaz:
t
mix
1 + log
2
(2n(n 1)),
onde o log
2
arredondado para cima (para se tornar inteiro).
Proof. Se E vale ento at o tempo t, diferentes sequncias de dgitos foram
atribudas a cada uma das n cartas. Assim, calcular a probabilidade do evento
E equivalente a resolver o seguinte probema: Suponha que, em algum planeta
do universo, o ano tem durao de 2
t
dias. Qual a probabilidade de que, em um
grupo de n habitantes desse planeta, todos tenham nascido em dias distintos do
ano, supondo que as datas de nascimento sejam uniformes e independentes?
J calculamos esta probabilidade no Exemplo 10, logo podemos escrever:
P(E) =
1
(2
t
)
k
n1
k=0
_
2
t
k + 1
_
=
n1
k=0
_
1
k
2
t
_
.
Portanto, para qualquer t inteiro,
d
vt
(Q
t
, ) 1 P(E) = 1
n1
k=0
_
1
k
2
t
_
.
Observe que
1
n1
k=0
_
1
k
2
t
_
= 1
n2
k=0
_
1
k
2
t
_
+
n 1
2
t
n2
k=0
_
1
k
2
t
_
48 CHAPTER 6. DOZE EMBARALHADAS BASTAM
e que os produtrios acima so menores ou iguais a 1. Logo
d
vt
(Q
t
, ) 1
n2
k=0
_
1
k
2
t
_
+
n 1
2
t
Como temos um termo a menos no produto, podemos iterar a nossa ideia e desco-
brir que
d
vt
(Q
t
, )
n 1
2
t
+
n 2
2
t
+
n 3
2
t
+ +
1
2
t
=
n(n 1)
2
t+1
.
Tomando t = 1 + log
2
(2n(n 1)) (arredondado para cima), vemos que a quanti-
dade do lado direito 1/4.
6.4 Porque doze embaralhadas bastam
Quando n = 52 e t = 12, obtemos a partir dos mesmos clculos acima que
d
vt
(Q
t
, ) 0, 34,
o que aproximadamente o mesmo nvel de preciso atingido por sete embaral-
hadas como mostraremos no prximo captulo (veja a Tabela ??). Por isto dizemos
que 12 embaralhadas bastam!
Chapter 7
Porque sete embaralhadas bastam, e
outros adendos
Nesta seo discutimos brevemente como a prova de Bayer e Diaconis [2] de
que sete embaralhadas bastam. Tambm falaremos da convergncia abrupta para
o equilbrio.
7.1 De doze para sete
A prova de Bayer e Diaconis parte de uma denio do que so sequncias levan-
tadoras que foram denidas na Seo 4.6.
Note que a permutao identidade tem somente uma sequncia levantadora.
Quando fazemos uma embaralhada GSR, ou mantemos as cartas no lugar, ou
criamos uma permutao que tem exatamente duas sequncias levantadoras. A
anlise que zemos no captulo 4 mostra que todas as permutaes com duas se-
quncias levantadoras so igualmente provveis. Portanto,
Depois de uma embarlahada GSR, as probabilidades de cada permu-
tao s dependem do seu nmero de sequncias levantadoras.
Um dos principais resultados intermedirios de Bayer e Diaconis [2, Teorema
3] que esta mesma situao persiste aps um nmero maior de embaralhadas.
De fato, para qualquer t > 0 inteiro, se g S
n
tem r sequncias levantadoras,
Q
t
(g) =
_
2
t
+nr
n
_
2
tn
,
onde usamos o coeciente binomial
_
u
v
_
0 se u < v ou
1
v!
v1
i=0
(u i) para u v.
49
50CHAPTER7. PORQUE SETE EMBARALHADAS BASTAM, E OUTROS ADENDOS
Esta frmula surpreendente resultado de uma discusso longa, em que so anal-
isados embaralhamentos em que se corta a pilha em a partes para um a arbitrrio
(a = 2 no modelo GSR). Alguns argumentos espertos da combinatria de permu-
taes so usados para chegar a este teorema.
A anlise acima j basta para provar que Q
t
(g) 1/n!. De fato, se 2
t
r 0
temos uma frmula explcita
_
2
t
+ n r
n
_
=
2
tn
n!
n1
i=0
_
1 +
n r i
2
tn
_
,
e no difcil mostrar que o produto converge a 1 quando t +.
Cotas para valores de t xos exigem alguns esforos adicionais. O primeiro
usar uma frmula distinta para a d
vt
:
d
vt
(Q
t
, ) =
gS
n
: Q
t
(g)>1/n!
Q
t
(g)
1
n!
.
Alm disso, precisamos de uma frmula ou estimativa para o nmero a
n,r
de
permutaes com r sequncias crescentes, que vem da rea de Combinatria das
permutaes. De posse destes dois ingredientes, podemos escrever:
d
vt
(Q
t
, ) =
1rn:
(
2
t
+nr
n
)
2
tn
>
1
n!
a
n,r
_
_
2
t
+nr
n
_
2
tn
1
n!
_
.
Esta frmula representa um progresso enorme sobre um clculo de fora bruta.
Embora S
n
tenha n! elementos (mais de 2
120
para n = 52), a soma acima tem n
termos, todos fceis de calcular. Isto torna factvel calcular os valores exatos da
distncia de variao total para n = 52 ou qualquer outro nmero razovel de
cartas.
t 1 2 3 4 5 6 7 8 9
d
vt
1.000 1.000 1.000 1.000 0.924 0.614 0.334 0.167 0.085
Table 7.1: Os valores da distncia de variao total como funo do tempo,
calculados at 3 casas decimais, para um baralho de 52 cartas. Valores maiores
de t so considerados em [2].
A tabela ?? contem os valores de d
vt
(Q
t
, ) para 1 t 9. Note que a
distncia praticamente 1 at t = 4 ou 5 e que a partir da ela basicamente
dividida por 2 em cada passo. O resultado de que sete embaralhadas bastam
baseia-se na escolha de 0.3 como o nvel de erro permitido.
7.2. CONVERGNCIA ABRUPTA PARA A DISTRIBUIO UNIFORME 51
7.2 Convergncia abrupta para a distribuio uni-
forme
Tambm possvel cotar a distncia d
vt
(Q
t
, ) para n grande. Neste caso, aparece
um fenmeno surpreendente. Imagine que denimos uma funo que nos d a dis-
tncia para equilbrio depois de andarmos x vezes o tempo de mistura.
f
n
(x) d
vt
(Q
t
, ) onde t ,x t
mix
|.
Note que esta funo depende de n. Bayer e Diaconis mostram que, quando
mandamos n para innito, vemos que f
n
(x) 1 se x < 1 e f
n
(x) 0 se x > 1;
isto , f
n
converge a uma funo-degrau. Isto chamado de efeito corte (cut off
effect em ingls) e nos diz que o esforo feito para chegar um pouquinho perto da
uniformidade no muito menor do que o necessrio para chegar extremamente
perto.
Uma constatao surpreendente que o mesmo fenmeno ocorre com outros
modelos de embaralhamento. Por exemplo:
De-cima-ao-acaso: em cada passo toma-se a carta de cima da pilha e se a
reinsere numa posio escolhida uniformemente [1].
Transposies aleatrias: Em cada passo escolhe-se 1 i, j n indepen-
dentemente e uniformemente ao acaso, fazendo depois a transposio das
cartas nas posies i e j [9].
A anlise destes e de outros exemplos requer tcnicas sosticadas de Anlise,
Teoria de Representaes e Combinatria. Algumas destas conexes acabam indo
nas duas direes. O artigo [3] indica vrias conexes entre tpicos centrais em
lgebra e a anlise de embaralhamentos.
Espera-se que muitos outros passeios aleatrios sobre estruturas nitas tenham
este mesmo efeito de corte. No entanto, a distribuio limite vai depender do
exemplo em questo. Entender esta classe de problemas requer algum estudo
sobre cadeias de Markov, que formalizam a ideia do que passear ao acaso em
um conjunto. O livro de Levin, Peres e Wilmer [15] uma excelente introduo a
esta rea.
52 Referncias
Bibliography
[1] ALDOUS, D. e DIACONIS, P. (1986). Shufing cards and stop-
ping times." The American Mathematical Monthly 93 (5), 333-348
[2] BAYER, D. e DIACONIS, P. (1992). Trailing the Dovetail Shufe
to its Lair". The Annals of Applied Probability 2 (2): 294.
[3] DIACONIS, P. (2003). Mathematical Developments from the
Analysis of Rife-Shufing". Em Groups, Combinatorics and Ge-
ometry, 73-97, World Scientic.
[4] DIACONIS, P. (2008). The Markov Chain Monte Carlo revolu-
tion". Bulletin of the American Mathematical Society 46 (2), 179-
205.
[5] DIACONIS, P. (1988). Group representations in probability and
statistics. Institute for Mathematical Statistics.
[6] DIACONIS, P. e GRAHAM, R. (2011). Magical Mathematics: The
Mathematical Ideas that Animate Great Magic Tricks. Princeton
University Press.
[7] DIACONIS, P., HOLMES, S. e MONTGOMERY, R. (2007). Dy-
namical Bias in the Coin Toss." SIAM Review, 49 (2), 211-235.
[8] DIACONIS, P. e SALOFF-COSTE, L. (1996). Logarithmic
Sobolev inequalities for nite Markov chains". The Annals of Ap-
plied Probability 6 (3), 695-750.
[9] DIACONIS, P. e SHAHSHAHANI, M. (1981) Generating a ran-
dom permutation with random transpositions". Probability Theory
and Related Fields 57 (2), 159-179.
[10] DURRETT, R. (2003). Shufing chromosomes." Journal of The-
oretical Probability 16 (3), 725-750.
53
54 BIBLIOGRAPHY
[11] FELLER, W. (1976). Introduo Teoria das Probabilidade e suas
Aplicaes. Edgard Blcher.
[12] GARCIA, A. e LECQUAIN, I. (2002). Elementos de lgebra. Pro-
jeto Euclides, IMPA-SBM, Rio de Janeiro.
[13] HOANG, V. T., MORRIS, B. e ROGAWAY, P. (2012). An Enci-
phering Scheme Based on a Card Shufe. Nos anais de Advances in
Cryptology - CRYPTO 2012, pginas 1-13. Lecture Notes in Com-
puter Science vol. 7417, Springer.
[14] KOLATA, G. (1990). In Shufing Cards, 7 Is Winning Number. Ar-
tigo do New York Times na edio de 9 de janeiro de 1990.
[15] LEVIN, D., PERES, Y. e WILMER, E. (2008). Markov Chains and
Mixing Times. American Mathematical Society.