Notas Curso Marcelo Hilario

A matemtica de embaralhar cartas
Marcelo Hilrio (UFMG) e Roberto Imbuzeiro Oliveira (IMPA)

March 4, 2013
Contents
Prefcio VII
1 Introduo 1
1.1 Onde est a Matemtica? . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Vida e obra de Persi Diaconis . . . . . . . . . . . . . . . . . . . . 2
2 O grupo de permutaes, ou: onde vive o embaralhamento? 5
2.1 Pilhas e palavras . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.2 Palavras e permutaes . . . . . . . . . . . . . . . . . . . . . . . 7
2.3 Embaralhar e desembaralhar . . . . . . . . . . . . . . . . . . . . 8
2.4 O nmero de elementos em S
n
. . . . . . . . . . . . . . . . . . . 11
3 Probabilidade e embaralhamento 13
3.1 Espaos de probabilidade e eventos . . . . . . . . . . . . . . . . . 13
3.2 Um caso simples de acaso . . . . . . . . . . . . . . . . . . . . . 15
3.3 Variveis aleatrias e distribuies induzidas . . . . . . . . . . . . 16
3.4 Independncia . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3.5 Alguns exemplos interessantes e importantes . . . . . . . . . . . 19
4 Probabilidade e embaralhamentos 23
4.1 Embaralhar algo que acontece ao acaso . . . . . . . . . . . . . . 23
4.2 Embaralhadas independentes e convolues . . . . . . . . . . . . 25
4.3 A distribuio uniforme e suas propriedades . . . . . . . . . . . . 28
4.4 Uniformidade perfeita . . . . . . . . . . . . . . . . . . . . . . . . 29
4.5 Aproximando a distribuio uniforme . . . . . . . . . . . . . . . 30
4.6 O embaralhamento de Gilbert-Shannon-Reeds . . . . . . . . . . . 32
5 Tcnicas de prova 37
5.1 Eventos fortemente uniformes . . . . . . . . . . . . . . . . . . . 37
5.2 Invertendo embaralhamentos . . . . . . . . . . . . . . . . . . . . 39
5.3 O inverso do embaralhamento de Gilber-Shannon-Reeds . . . . . 41
V
VI CONTENTS
5.4 Um resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
6 Doze embaralhadas bastam 45
6.1 Bits e embaralhamentos . . . . . . . . . . . . . . . . . . . . . . . 45
6.2 O evento fortemente uniforme . . . . . . . . . . . . . . . . . . . 46
6.3 Uma cota para o tempo de mistura . . . . . . . . . . . . . . . . . 47
6.4 Porque doze embaralhadas bastam . . . . . . . . . . . . . . . . . 48
7 Porque sete embaralhadas bastam, e outros adendos 49
7.1 De doze para sete . . . . . . . . . . . . . . . . . . . . . . . . . . 49
7.2 Convergncia abrupta para a distribuio uniforme . . . . . . . . 51
Referncias 52
Prefcio
Obrigado a Bianca, Antnio, Joo, Maria, Maurcio, Beth, Renato e Leandro.
Belo Horizonte/Rio de Janeiro, setembro de 2012.
VII
Chapter 1
Introduo
Muitos de vocs j devem ter jogado cartas e vivenciado a seguinte situao: de-
pois de uma partida de buraco, embaralha-se as cartas para outra partida e, por
acidente, uma das canastras da partida anterior vem inteira na mo de um dos jo-
gadores. Normalmente explica-se este tipo de incidente dizendo que o baralho foi
mal embaralhado. Sendo um pouco mais precisos, podemos dizer que o baralho
guardou alguma memria do jogo anterior.
Nosso objetivo neste curso estudar como embaralhar bem. Mais do que
uma curiosidade, este problema vale muito dinheiro para cassinos e apostadores,
que podem se aproveitar de maus embaralhamentos para ganhar vantagens em
jogos de azar. Por estas e outras razes, o estudo de embaralhamentos ganhou um
destaque popular muito grande, especialmente a partir de uma reportagem do New
York Times que dizia [14]:
Sete embaralhadas do tipo certo so necessrias e sucientes para embaralhar
bem um baralho padro com 52 cartas.
A armao vem de um artigo de Dave Bayer e Persi Diaconis, publicado
em 1992 no peridico Annals of Applied Probability [2]. Grosso modo, estes
matemticos provaram que, com seis ou menos embaralhadas, o baralho ainda
guarda memria da ordem anterior, enquanto que sete ou mais embaralhadas so
sucientes para desfazer esta memria.
1.1 Onde est a Matemtica?
Para provar uma armao deste tipo, necessrio primeiramente dar denies
matemticas precisas dos conceitos envolvidos. Por exemplo:
Como se descreve um embaralhamento, ou muitos embaralhamentos?
1
2 CHAPTER 1. INTRODUO
Como se descreve a incerteza vinda das embaralhadas?
Como se quantica a perda de memria?
Mostraremos neste curso que um embaralhamento uma permutao; que a
incerteza corresponde a uma distribuio de probabilidade sobre permutaes; que
a estrutura de grupo das permutaes serve para descrever muitos embaralhamen-
tos; e que a perda de memria pode ser quanticada atravs do chamado tempo
de mistura. Esta combinao de conceitos de Probabilidade e Teoria de Grupos
(em particular do grupo de permutaes) explica muito da atrao que o assunto
exerce sobre os matemticos. Alm disso, como qualquer teoria matemtica sobre
objetos fundamentais, ela tambm aparece em outros problemas aplicados, indo
desde a Criptograa Gentica (ver [10, 13, 15] para mais informaes).
Um dos nossos objetivos nestas notas explicar estes conceitos por trs do
resultado de Bayer e Diaconis. Infelizmente no teremos tempo ou espao para
dar uma prova completa do resultado deles, mas veremos a demonstrao de um
resultado mais fraco:
Doze embaralhadas so sucientes para embaralhar bem um baralho padro
com 52 cartas.
Este teorema de Aldous e Diaconis [1], que tem uma prova absolutamente elemen-
tar. Um esboo da prova de Bayer e Diaconis dado no nal das notas, juntamente
com indicaes sobre desdobramentos destes resultados.
1.2 Vida e obra de Persi Diaconis
Antes de entrarmos na Matemtica propriamente dita, gostaramos de comentar
um pouco sobre a vida de Persi Diaconis, um dos homens por trs dos resultados
descritos acima. Diaconis um matemtico americano de ascendncia grega que
um dos grandes probabilistas dos ltimos 40 anos. No s isso, ele um dos
matemticos menos convencionais dos tempos recentes, com interesses que vo
desde truques mgicos at matrizes aleatrias.
A singularidade de Persi se reete e se explica pela sua histria de vida. De-
pois de muitos anos admirando o trabalho de ilusionistas, ele resolveu, sair de
casa, aos 14 anos, para ser assistente de um mgico chamado Dai Vernon. No
teve tempo de terminar a escola mas, mesmo assim, os seus professores, que o
consideravam timo aluno, deixaram que ele se formasse mesmo sem frequentar
as aulas.
Em algum momento buscou a Probabilidade para entender melhor a Mgica.
O livro clssico de Feller [11] lhe pareceu muito complicado e, para superar esta
1.2. VIDA E OBRA DE PERSI DIACONIS 3
diculdade, resolveu estudar no curso noturno do City College em Nova Iorque.
Foi sgado pela Matemtica e resolveu fazer doutorado em Harvard, onde se
graduou em 1974. Diga-se de passagem, sua entrada em Harvard foi muito aju-
dada por Martin Gardner, fabuloso matemtico amador e colunista da Scientic
American, que escreveu uma carta de recomendao elogiando seus truques com
o baralho.
Ao longo de sua carreira de pesquisador, Persi vem estudando assuntos desde
a aleatoriedade no cara-e-coroa [7] e a anlise de experimentos sobre paranormal-
idade at a teoria de grupos e a anlise estatstica de grafos. Seu trabalho reete
de forma nica os seus muitos interesses dentro e fora da matemtica. No in-
comum que ele retorne s suas paixes antigas, como a mgica, que assunto do
livro recente com Ron Graham [6].
Talvez sua linha de trabalho mais importante seja o estudo da convergncia
ao equilbrio de Cadeias de Markov. Informalmente, uma cadeia de Markov nada
mais que um passeio aleatrio em algum tipo de espao que pode ser uma
variedade, um grupo ou uma congurao de esferas numa caixa. Diaconis um
dos principais responsveis pelo interesse recente na teoria quantitativa de Cadeias
de Markov, e tem trabalhos seminais integrando este assunto com a lgebra [5],
a Anlise [8] e diversos aspectos dos algoritmos Markov Chain Monte Carlo [4].
O livro recente de Levin, Peres e Wilmer [15] uma tima introduo a estes e
outros assuntos.
Por m, Persi tambm um excelente expositor, que escreve timos artigos de
divulgao e profere palestras pelo mundo. Um de ns (R.I.O.) teve seu interesse
em Probabilidade e Combinatria aguados por uma palestra sua no Colquio
Brasileiro de Matemtica de 1999. Aqueles leitores que quiserem correr o mesmo
risco devem procurar assistir a uma apresentao sua ou buscar mais informaes
na sua lista de publicaes
http://www-stat.stanford.edu/cgates/PERSI/year.html
e nas vrias pginas a seu respeito na Internet.
4 CHAPTER 1. INTRODUO
Chapter 2
O grupo de permutaes, ou: onde
vive o embaralhamento?
Neste captulo vamos fazer uma primeira abordagem matemtica do que embar-
alhar cartas. A principal mensagem ser que:
Embaralhar tem tudo a ver com permutar.
Por esta razo ser importante estudarmos um pouco as propriedades ele-
mentares de permutaes. Para quem quiser, o livro [12] uma boa referncia
em portugus para um estudo mais aprofundado do assunto.
2.1 Pilhas e palavras
Vamos comear com um acordo. um fato que h jogos de baralho que usam
nmeros diferentes de cartas; pense por exemplo em buraco, blackjack e truco.
Por esta razo faz sentido tratar o nmero de cartas como uma varivel n, que
suporemos ser um nmero natural diferente de zero. Alm disto, as propriedades
que estudaremos no dependem dos nomes ou eventuais valores das cartas em
diferentes jogos; por isso daremos a elas os nomes 1, 2, 3, 4, 5, . . . , n. Desta
forma, o conjunto de cartas ser representado pelo conjunto:
[n] 1, 2, 3, 4, 5, . . . , n = conjunto dos naturais de 1 a n.
Nosso trabalho ser entender o que acontece com a ordem das cartas ao longo
dos embaralhamentos. Para isso, precisamos comear explicando como descreve-
mos a ordem das cartas. Vamos sempre imaginar que as cartas esto empilhadas.
A posio de uma carta ser determinada contando de cima para baixo. Por ex-
emplo, se n = 5 e a pilha est na ordem da Figura 2.1, dizemos que a carta 1 est
5
6CHAPTER2. OGRUPODE PERMUTAES, OU: ONDE VIVE OEMBARALHAMENTO?
1
2
3
4
5
Figure 2.1: A gura acima mostra uma pilha com cinco cartas (isto , n = 5) na
ordem (2, 3, 5, 1, 4).
na posio 4, a carta 2 est na posio 1, a carta 3 est na posio 2, a carta 4 est
na posio 5 e a carta 5 est na posio 3.
De modo geral, a ordem de uma pilha corresponde a uma lista ordenada:
a = (a
1
, a
2
, . . . , a
n
)
onde a
1
o nome da primeira carta (a mais de cima), a
2
o nome da segunda
e assim por diante. Por exemplo, a pilha da gura acima representada pela lista
(2, 3, 5, 1, 4). Assim, para representar uma pilha de cartas, uma lista (a
1
, . . . , a
n
)
deve ser uma palavra.
Denio 1 (Palavra). Uma palavra sobre [n] uma lista
(a
1
, a
2
, . . . , a
n
)
onde cada nmero i [n] aparece exatamente uma vez: isto , para cada i [n]
existe exatamente um ndice j com a
j
= i. O conjunto de palavras ser chamado
de P
n
.
Este requerimento de exatamente uma vez garante duas coisas:
1. Primeiro, que toda carta i [n] est em algum lugar da pilha.
2. Segundo, que nenhuma carta est duplicada.
Deste modo, as palavras so uma representao boa para pilhas de cartas.
2.2. PALAVRAS E PERMUTAES 7
2.2 Palavras e permutaes
No entanto, existe uma representao que ser muito mais conveniente. Para
conceb-la, vamos pensar na seguinte questo.
Dada uma palavra a = (a
1
, a
2
, . . . , a
n
), o que precisamos fazer para
mover a pilha de cartas da ordem cannica (1, 2, 3, . . . , n) para a
ordem dada por a?
A Figura 2.2 abaixo contm um exemplo de como modicar a ordem cannica
(1, 2, 3, 4, 5) para obter a pilha que aparece na Figura 2.1.
1
2
3
4
5
1
2
3
4
5
Figure 2.2: A pilha (2, 3, 5, 1, 4) pode ser obtida da pilha (1, 2, 3, 4, 5) atravs
das operaes indicadas pelas setas.
Veja que cada carta i [n] deve ser levada a uma posio g(i) [n]. Isto ,
mexer a pilha signica denir uma funo
g : [n] [n]
que especica, para cada carta i, sua posio na pilha a. Para que g cumpra seu
papel, necessrio que a
g(i)
= i; dito de outro modo: queremos que a carta i
acabe na g(i)-sima posio.
Note que as propriedades da palavra (a
1
, a
2
, . . . , a
n
) se reetem em g. Em
primeiro lugar:
A funo g injetiva: se i
1
, i
2
[n] so distintos, ento g(i
1
) ,= g(i
2
).
i 1 2 3 4 5
g(i) 4 1 2 5 3
Table 2.1: A funo g correspondente situao ilustrada na Figura 2.2. Note
que g uma bijeo do conjunto [5] em si mesmo.
Isto vale porque as cartas i
1
, i
2
tm de ir para posies distintas. Alm disso,
temos que:
A funo g sobrejetiva: dado qualquer j [n], existe algum i [n]
com g(i) = j.
Isto vale porque, necessariamente, existe uma carta na j-sima posio.
Conclumos que g uma bijeo de [n] em [n], ou seja, g uma permutao
de [n].
Denio 2 (Permutao). Uma permutao de [n] uma bijeo de [n] em [n]. O
conjunto das permutaes de [n] denotado por S
n
e chamado de grupo simtrico
de n elementos.
J deve ter cado claro que a correspondncia entre palavras e permutaes
que denimos acima biunvoca. Isto , dada uma palavra, existe uma nica
permutao correspondente, e vice-versa. Portanto, quando falarmos de ordens
de cartas, normalmente trabalharemos com permutaes. A razo para o nome
grupo simtrico car um pouco mais clara no nal do captulo.
2.3 Embaralhar e desembaralhar
A grande vantagem de trabalhar com permutaes ao invs de palavras que
embaralhar e desembaralhar tm descries mais naturais.
Primeiro vamos pensar o que acontece quando embaralhamos as cartas. Em-
baralhar levar cada carta da pilha original para uma nova posio. Ou seja, a
carta na i-sima posio levada a uma nova posio, que chamamos de h(i). O
mesmo raciocnio que usamos antes para g se aplica a h: como cada carta levada
a uma posio e nenhuma posio ca vazia, h uma permutao de [n]. Ou seja:
Conveno 1 (Embaralhar = permutar). Cada embaralhada de [n] corresponde a
uma permutao h S
n
, que corresponde a dizer que, para cada i [n], a carta
que ocupava a posio i na pilha antes da embaralhada foi parar na posio h(i).
Note que esta conveno permite, por exemplo, que no faamos nada com a
ordem das cartas. Isto corresponde permutao identidade id S
n
que envia 1
em 1, 2 em 2 e etc.
2.3. EMBARALHAR E DESEMBARALHAR 9
Veja que agora j sabemos como interpretar ordens e embaralhadas como per-
mutaes. Como estas duas coisas interagem? Mais concretamente: suponha que,
antes da embaralhada h, a pilha estava na ordem descrita por uma permutao g.
A que permutao corresponde a nova ordem? Recorde que, para denir a per-
mutao g, imaginamos que a pilha estava na ordem cannica" (1, 2, 3, . . . , n) e
foi para uma nova ordem, em que a carta 1 ocupa a posio g(1), a carta 2 ocupa
a posio g(2) e assim por diante. Agora a embaralhada h envia a carta em cada
posio j para h(j). Se pensamos na ao conjunta de g e h, vemos que a carta
1 tem de ir parar na a posio h(g(1)), a carta 2 na posio h(g(2)) e assim por
diante. Ou seja:
Fato 1 (Embaralhar e produtos de permutaes). Suponha que uma pilha de [n]
cartas est na ordem dada pela permutao g S
n
. Suponha ainda que esta pilha
embaralhada segundo a permutao h. Ento a nova ordem da pilha descrita
pela permutao composta
hg h g,
que chamada de produto de h e g.
A Figura 2.3 ilustra isso num caso particular.
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
g h
hog
Figure 2.3: A pilha (1, 2, 3, 4, 5) levada pela permutao g na pilha
(2, 3, 5, 1, 4), que por sua vez levada, pela permutao h, na pilha (3, 2, 1, 5, 4).
A permutao composta hg = h g aquela que leva diretamente a pilha
(1, 2, 3, 4, 5) na (3, 2, 1, 5, 4).
Da mesma forma, se partimos da ordem dada por g e embaralhamos as cartas
sucessivamente de acordo com permutaes h
1
, h
2
, . . . , h
k
, a ordem nal dada
pelo produto:
h
k
h
k1
. . . h
1
g = h
k
h
k1
h
1
g.
Um ponto implcito nesta denio que a composio de permutaes , ela
prpria, uma permutao. Isto , a composio de duas ou mais bijees de [n]
em [n] tambm uma bijeo de [n] em [n].
Observao 1 (No-comutatividade). Ateno: num produto de permutaes, a
ordem dos fatores pode alterar o produto! Podemos observar isto na gura 3,
onde g
2
g
1
,= g
1
g
2
. Neste sentido, a multiplicao de permutaes como a
multiplicao de matrizes.
Observao 2 (Elemento neutro). fcil mostrar que id g = g id = g para todo
g S
n
: isto , embaralhar sem mexer no muda a ordem!
Agora vamos pensar em como recolocamos as cartas na ordem cannica. Ou
seja, partindo da ordem g S
n
queremos desembaralhar as cartas e bot-las na
ordem (1, 2, 3, . . . , n). A Figura 2.4 ilustra isso num caso particular; veja que a
desembaralhada a imagem espelhada da permutao original.
1
4 5 1
1
2
2 3
3
4
4 5
5 2 3
Figure 2.4: A primeira embaralhada leva a pilha (1, 2, 3, 4, 5) na pilha
(2, 3, 5, 1, 4). A embaralhada inversa retorna a pilha sua ordem original.
De modo geral, se as cartas esto na ordem g, queremos reorden-las por uma
permutao h tal que hg = id a identidade: ou seja, hg(i) = i para cada i [n].
No difcil ver que isto corresponde a inverter g.
2.4. O NMERO DE ELEMENTOS EM S
N
11
Denio 3 (Inversa de uma permutao). Dada g S
n
, denimos uma nova
permutao g
1
S
n
, chamada de permutao inversa de g, pela seguinte regra.
Regra: Se i, j [n] satisfazem g(i) = j, ento denimos g
1
(j) = i.
Ou seja, g
1
a funo inversa de g.
A existncia de g
1
uma consequncia do fato geral que toda bijeo tem
uma funo inversa. No difcil mostrar que g
1
satisfaz g
1
g = g g
1
= id.
Ou seja, a inversa de g funciona como uma inversa multiplicativa.
Exerccio 1. Mostre que (g
1
)
1
= g, ou que o avesso do avesso o direito. (Em
termos da Figura 2.4, isto nos diz que espelhar duas vezes a permutao resulta
na mesma gura.)
Eis um fato de que precisaremos a seguir:
Exerccio 2. Demonstre que para quaisquer g
1
, g
2
S
n
(g
2
g
1
)
1
= g
1
1
g
1
2
Isto , a inversa do produto o produto das inversas na ordem trocada.
Observao 3 (Grupos). Na lgebra abstrata, um grupo G um conjunto munido
de uma operao associativa de mutiplicao, para a qual existe um elemento
neutro, e tal que todos os elementos de G possuem um inverso. O que acabamos
de ver mostra que S
n
um grupo com as operaes que acabamos de descrever.
2.4 O nmero de elementos em S
n
Para xar um pouco o que j zemos, vamos parar brevemente para considerar
quantos elementos S
n
tem. O leitor provavelmente j sabe que S
n
tem n! =
1 2 3 n elementos. No entanto, apresentamos uma demonstrao
como reviso.
Seja P
n
o conjunto das palavras sobre [n]. J vimos acima que h uma corre-
spondncia biunvoca entre os elementos de S
n
e os de P
n
. Como conjuntos em
correspondncia biunvoca tm o mesmo nmero de elementos, basta calcularmos
o nmero de elementos de P
n
.
Para fazer isto, encontraremos uma outra correspondncia biunvoca , desta
vez entre
X
n
[1] [2] [3] [4] [n]
e P
n
. Como X
n
tem n! elementos, isto implica o resultado desejado.
Seja x = (x
1
, x
2
, . . . , x
n
) veja que a primeira coordenada x
1
obrigatoria-
mente 1, a segunda 1 ou 2, a terceira est entre 1 e 3 e assim por diante. Para
construir (x), fazemos o seguinte:
1. Primeiro escrevemos uma palavra s com o nmero 1: (1)
2. Agora vamos acrescentar o nmero 2 palavra. Note que h duas palavras
possveis que podemos formar (1, 2) e (2, 1). Usaremos a seguinte regra: se
x
2
= 1, botamos o 2 esquerda do 1; caso contrrio, se x
2
= 2, botamos
direita.
3. A esta altura j temos uma palavra com dois nmeros e devemos acrescentar
o 3 em algum dos trs espaos possveis. A regra que usamos a seguinte:
escrevemos o 3 de modo que haja x
3
1 nmeros esquerda dele.
4. Os passos seguintes continuam do mesmo modo. Suponha que j pusemos
os nmeros de 1 at k 1 na palavra, em alguma ordem. H k lugares
possveis em que podemos inserir o nmero k; escolhemos aquele que tem
x
k
1 dos nmeros anteriores sua esquerda.
5. Ao nal do processo, temos uma palavra (a
1
, . . . , a
n
) sobre [n]; esta , por
denio, a palavra (x) correspondente a x X
n
.
Para provar que uma biunvoca, basta ver que inversvel. Mas isto
fcil. Dada uma palavra a = (a
1
, . . . , a
n
) P
n
, determinamos o x X
n
com
(x) = a da seguinte forma: para cada k [n], x
k
igual a um mais o nmero
de elementos 1 j k 1 que esto esquerda de k na palavra a acrescido de
uma unidade.
Chapter 3
Probabilidade e embaralhamento
No captulo anterior falamos sobre o que embaralhar. No entanto, isto ainda
no suciente para modelarmos o problema de embaralhar cartas. Como j
discutimos na Introduo,
Embaralhar algo que acontece ao acaso.
O objetivo deste captulo esclarecer isto. Para isso reveremos alguns conceitos
bsicos de Probabilidade discreta. Para quem quiser se aprofundar mais, a refer-
ncia clssica sobre Probabilidade em espaos discretos o livro de Feller [11].
O livro de Levin, Peres e Wilmer [15] tambm cobre boa parte do que estudamos
aqui.
3.1 Espaos de probabilidade e eventos
Comeamos falando umpouco sobre como modelar o acaso. Emtermos matemti-
cos, precisamos denir um espao de probabilidades.
Denio 4. Um espao de probabilidades (discreto) um par (, P) composto
de:
um espao amostral, que um conjunto ,= , que sempre suporemos ser
nito. Este conjunto descreve todos os possveis resultados de um determi-
nado fenmeno aleatrio.
uma distribuio de probabilidade, que uma funo
P : [0, 1] tal que
P() = 1.
Esta funo atribui a cada possibilidade isto , a cada elemento
do espao amostral um peso P() 0 que descreve o quo provvel
observarmos cada possvel elemento.
13
14 CHAPTER 3. PROBABILIDADE E EMBARALHAMENTO
Exemplo 1 (Moeda). Suponha que queremos modelar um nico lanamento de
uma moeda. Neste caso podemos xar = 0, 1 onde 1 corresponde a cara e 0
corresponde a coroa. Para denir um espao de probabilidades, devemos escolher
p P(1) [0, 1] e q = P(0) = 1 p. No caso em que p = q = 1/2, cara e
coroa so igualmente provveis e dizemos que a moeda justa.
Exemplo 2 (Dado). Para modelar um nico lanamento de um dado, escolhemos
= 1, 2, . . . , 6. Vrias escolhas de P podem ser feitas; a mais padro supor
que as seis faces so equiprovveis, isto ,
P(1) = P(2) = = P(6) =
1
6
.
Alguns jogos usam dados com mais faces, que poderiam ser modelados com es-
paos amostrais com mais elementos.
Normalmente, estamos interessados emcalcular a probabilidade de umevento,
que nada mais que um subconjunto E . Denimos:
P(E)
E
P() ,
onde (por denio) a soma vale zero se E = .
Exemplo 3 (Distribuio uniforme). Frequentemente consideraremos outras situ-
aes nas quais todos os elementos do espao amostral so (ou podem ser toma-
dos como) equiprovveis. Neste caso, usamos a distribuio de probabilidade que
atribui peso igual a cada elemento de :
: P() =
1
[[
.
Esta a chamada distribuio uniforme sobre .
Exemplo 4 (Campeonato Brasileiro). Imagine um campeonato de futebol com n
times, rotulados com os nmeros de 1 a n. Para facilitar, podemos supr que as re-
gras do campeonato so tais que, ao mdele, os times sero ordenados de primeiro
a ltimo sem a possibilidade de empates na classicao. O espao amostral ,
correspondente a todas as possveis classicaes nais do campeonato, pode ser
tomado como o conjunto das palavras sobre [n]; a escolha de P vai depender da
modelagem feita.
Exerccio 3. Mostre que P() = 1 e que, se E
1
, E
2
so eventos disjuntos,
P(E
1
E
2
) = P(E
1
) +P(E
2
) .
3.2. UM CASO SIMPLES DE ACASO 15
Alm disso, dados quaisquer eventos F
1
, F
2
(no necessariamente disjuntos),
prove que:
P(F
1
F
2
) = P(F
1
) +P(F
2
) P(F
1
F
2
) P(F
1
) +P(F
2
) .
Mostre ainda que o complemento E
c
E de um evento E tem probabilidade
1 P(E).
3.2 Um caso simples de acaso
Vamos comear tentando modelar uma embaralhada ao acaso. Comeamos por
um caso simples.
De cima ao acaso: Escolha um nmero r entre 1 e n ao acaso. Se
r = 1, no faa nada; se r > 1, pegue a carta mais de cima da pilha
e ponha-a na r-sima posio, mantendo a ordem relativa das outras
cartas.
Como entender este modelo? Primeiro, temos que saber como modelamos a
escolha de r. Do ponto de vista formal, isto feito via um espao de probabili-
dades.
Voltando ao embaralhamento, note que a cada escolha de r corresponde um
embaralhamento diferente, ou seja, uma permutao diferente h
r
S
n
. Para
determinar que embalhamento este, vamos ver o que acontece com cada carta.
Note que a primeira carta da pilha acaba na posio r, isto , h
r
(1) = r. As cartas
abaixo desta posio no tem sua posio alterada, mas as cartas que estavam at
a posio r tem de subir para acomodar a chegada da carta da antiga posio 1.
Logo, para cada i [n],
h
r
(i)
_
_
_
r, se i = 1;
i 1, se 2 i r;
i, se r + 1 i n.
Agora vem o ponto-chave:
A escolha aleatria de r corresponde a uma escolha aleatria de
permutao!
O que isto quer dizer? Vamos pensar em termos mais gerais. Imagine que
temos um espao de probabilidade (, P) e que, a cada elemento , cor-
responde uma permutao h
. A ideia que isto descreve a seguinte: primeiro

voc escolhe , depois faz a permutao correspondente h
. natural pergun-
tar: qual a probabilidade que sua embaralhada corresponda a uma permutao g
qualquer? Ou seja, qual a probabilidade do evento:
E
g
: h
= g.
Esta probabilidade simplesmente a soma:
Q(g) P(E
g
) =
: h
=g
P() .
Agora note que Q(g) 0 e:
gS
n
Q(g) =
gS
n
P(E
g
) = 1;
anal, os eventos E
g
so disjuntos (a cada corresponde um nico g com h
= g)
e sua unio todo o S
n
. Logo:
Denio 5 (Distribuio induzida). Suponha que (, P) espao de probabil-
idade e que para cada associamos uma permutao h
S
n
. Ento,
se denimos Q como acima, (S
n
, Q) um espao de probabilidades e Q dita
distribuio induzida sobre S
n
.
3.3 Variveis aleatrias e distribuies induzidas
s vezes, estamos interessados em eventos associados a uma variel aleatria,
que nada mais do que uma funo X : onde um outro conjunto
nito. Observe que X induz uma distribuio de probabilidade Q sobre via a
regra:
: Q() = P(X = ) = P( : X() = ) .
Exerccio 4. Prove que Q de fato uma distribuio de probabilidade sobre .
Exemplo 5 (De dados a moedas). Suponha que (, P) corresponde ao exemplo
do dado de seis faces considerado acima, onde supomos que todas as faces so
equiprovveis. Neste caso, = 1, 2, 3, 4, 5, 6. Dena = 0, 1 e seja X()
a paridade de : isto X() = 0 se par e X() = 1 se mpar. X induz
sobre a distribuio Q correspondendo a uma moeda justa:
Q(1) = P(X = 1) = P( : par) =
1
2
.
3.4. INDEPENDNCIA 17
Exemplo 6 (O campeo brasileiro). Recorde o caso do campeonato de futebol
com n times discutido no Exemplo 4. Imagine que, dado um modelo (, P),
queremos apenas saber a probabilidade de cada time ser campeo (e no a do
ranking completo). Podemos expressar isso considerando = [n] e fazendo com
que X() associe a cada possvel ordenao dos times o nmero X() [n]
do time que primeiro colocado nesta ordenao. Neste caso,
Q() = P(X = )
a probabilidade de ser campeo sob o modelo em questo.
3.4 Independncia
Considere agora uma sequncia de espaos de probabilidade (
i
, P
i
) com 1 i
k. Cada um destes espaos corresponde a um dado fenmeno aleatrio, contendo
assim todos os seus possveis resultados. Por exemplo,
1
pode corresponder aos
lanamentos de uma moeda,
2
aos ganhos de um investimento,
3
a uma corrida
de cavalos e por a vai.
Frequentemente queremos considerar a ocorrncia conjunta destes fenmenos.
Por exemplo, uma pessoa que apostou dinheiro numa moeda, numa ao e num
cavalo vai querer saber as suas possibilidades de perdas e ganhos. Neste caso, o
espao adequado a se considerar o produto cartesiano.
=
1

2

k
.
Uma maneira de atribuir probabilidades aos elementos de supor que eles
so independentes. Informalmente, isto quer dizer que cada
i
corresponde a
um evento cuja ocorrncia no interfere nos demais eventos sendo considerados.
Matematicamente, isto corresponde a denir uma distribuio sobre com forma
de produto:
1

1
, . . .
k

k
: P((
1
, . . . ,
k
)) = P
1
(
1
)P
2
(
2
) P
k
(
k
).
Isto implica que se E
1

1
, E
2

2
, . . . , E
k

k
so eventos em cada um
dos espaos amostrais, ento o evento:
E = E
1
E
2
E
3
E
k

tem probabilidade
P(E) = P
1
(E
1
) P
2
(E
2
) P
3
(E
3
) P
k
(E
k
).
Chamamos de espao-produto e P de distribuio-produto.
Exemplo 7 (Vrios lanamentos de uma moeda justa). Suponha que
i
= 0, 1
e P
i
(1) = p = P
i
(0) para cada 1 i k. Isto corresponde a k lanamentos de
uma mesma moeda justa. Podemos tomar
= 0, 1
k
como espao amostral conjunto para os k lanamentos e interpretar cada vetor
= (
1
, . . . ,
k
)
como descrevendo a sequncia
1
, . . . ,
k
dos resultados. Se supomos que os
lanamentos so independentes, ento:
: P() = p
||
(1 p)
k||
,
onde [[ =
1
+
2
+ +
k
o nmero total de caras nos k lanamentos. Em
particular, se p = 1/2,
: P() =
1
2
k
.
Exemplo 8 (O produto de distribuies uniformes). O caso p = 1/2 do exem-
plo anterior, coincide com a distribuio uniforme para cada moeda, e resulta na
distribuio uniforme sobre . Isto no coincidncia: sempre que cada P
i
for
uniforme:
1 i k,
i

i
: P
i
(
i
) =
1
[
i
[
,
temos
= (
1
, . . . ,
k
) : P() =
1
[
1
[

1
[
2
[

1
[
k
[
=
1
[[
,
j que o produto cartesiano
=
1

2
. . .
k
tem [[ = [
1
[ [
2
[ [
k
[ elementos. Em particular, n lanamentos indepen-
dentes de um dado justo tambm tm distribuio uniforme em
= [6] [6]
. .
n vezes
.
3.5. ALGUNS EXEMPLOS INTERESSANTES E IMPORTANTES 19
3.5 Alguns exemplos interessantes e importantes
Nessa seo apresentamos dois exemplos que sero importantes para modelar um
embaralhamento ao acaso e para estudar algumas das suas propriedades.
Exemplo 9 (O nmero de caras emk lanamentos de uma moeda justa). Considere
o espao amostral e a distribuio de probabilidade apresentados no Exemplo 7
no caso em que p = 1/2. Assim, o fenmeno probabiltico em questo aquele
no qual uma moeda justa lanada k vezes independentemente. Consideramos a
varivel aleatria
M() =
k
i=1
i
.
Como
i
= 1 se o resultado do i-simo lanamento igual a cara, e
i
= 0 caso
contrrio, temos que a varivel aleatria M conta o nmero total de caras dentre
os resultados dos k lanamentos.
A distribuio induzida por essa varivel no conjunto = 0, 1, . . . , k
Q() = P(M = ).
Podemos calcular explicitamente o valor de Q() para cada . De fato,
para que M() seja igual a , dentre os k lanamentos, exatamente tm como
resultado cara. Isso o mesmo que dizer que o vetor = (
1
, . . . ,
n
) tem
exatamente entradas iguais a 1. O nmero de maneiras de se obter entradas
iguais a 1 em um total de k entradas igual a:
_
k
_
=
k!
!(k )!
Alm disso, como P a distribuio uniforme, temos que cada resultado tem
probabilidade igual a 1/2
k
. Assim,
Q() = P(M = ) =
_
k
_
1
2
k
Observao 4. Pelo Teorema Binomial sabemos que
k
=0
_
k
_
= 2
k
assim, como esperado, a distribuio de probabilidade Q encontrada no exemplo
anterior satisfaz que
k
=0
Q() = 1.
Note ainda que essa distribuio no uniforme. De fato, o leitor pode vericar
que valores de prximos a k/2 tm peso maior do que valores de prximos a
0 ou a k.
Denio 6. Uma varivel aleatria N satisfazendo que
P(N = ) =
_
k
_
1
2
k
1, . . . , k (3.1)
chamada Varivel Aleatria Binomial com parmetros k e 1/2.
Exemplo 10 (O paradoxo dos aniversrios). Suponha que, no Planeta X um ano
tenha exatamente M dias, onde M 1. Considere uma turma contendo n alunos,
todos eles habitantes do Planeta X. Qual a probabilidade de que haja alunos
dessa turma que faam aniversrio no mesmo dia do ano?
O problema enunciado no exemplo acima conhecido como o paradxo dos
aniversrios por ter uma resposta que, para muitas pessoas, contraintuitiva.
Abaixo mostraremos como obter uma resposta para esse problema supondo que
as datas de aniversrio so independentes e uniformes.
Como cada aluno pode fazer aniversrio em qualquer um dos M dias do ano
temos que existem M
n
diferentes possibilidades para as datas dos aniversrios de
toda a turma. Desse total obtido, vamos agora calcular a quantidade de possibili-
dades nas quais no h coincidncias de aniversrios.
Comeamos numerando os alunos de 1 a n em uma ordem arbitrria (por
exemplo, a ordem da lista de chamada para controle de frequncia). O primeiro
aluno pode fazer aniversrio em qualquer um dos M dias do ano. J o segundo
deve fazer aniversrio em um dos M 1 dias restantes. Do mesmo modo, o
i-simo aluno deve fazer aniversrio em um dos M + 1 i dias que no esto
ocupados pelos alunos anteriores. Desta forma, h um total de:
n
i=1
(M + 1 i) possibilidades para aniversrios sem coincidncia.
No nosso modelo, todas as M
n
possibilidades para os aniversrios dos n alunos
so igualmente provveis, logo a probabilidade de no haver coincidncias
1
M
n
n
i=1
(M + 1 i) =
n
i=1
_
1
i 1
M
_
.
Uma boa aproximao para esta probabilidade dada por
n
i=1
_
1
i 1
M
_
i=1
e
i1
M
= e
n(n1)
2M
.
3.5. ALGUNS EXEMPLOS INTERESSANTES E IMPORTANTES 21
Veja que no nosso planeta M = 365, logo a aproximao indica que a probabil-
idade de no haver coincidncias em uma turma com 23 pessoas de cerca de
50%.
Chapter 4
Probabilidade e embaralhamentos
4.1 Embaralhar algo que acontece ao acaso
J vimos que a ordem na qual n cartas numeradas de 1 a n esto dispostas em uma
pilha pode ser identicada com uma das n! permutaes do conjunto [n]. Mais
ainda, uma embaralhada tambm pode ser identicada com uma permutao. Re-
alizar uma embaralhada, usualmente envolve selecionar um subconjunto de cartas
e fazer operaes envolvendo as cartas selecionadas e, possivelmente, as demais
cartas.
Sabemos que variveis aleatrias X : induzem uma distribuio de
probabilidade em . Da mesma forma, a ao de escolher ao acaso um subcon-
junto de cartas e realizar operaes, tambm ao acaso, com essas e outras cartas
induz uma distribuio de probabilidade em S
n
.
Para esclarecer como uma embaralhada pode acontecer ao acaso, vamos nos
xar em um exemplo.
Exemplo 11 (Transposies ao acaso). Suponha que um conjunto de n cartas
encontra-se organizado em uma pilha, em ordem crescente (1, 2, . . . , n) de cima
para baixo. Considere o seguinte algoritmo para embaralhar cartas.
Primeiro selecionamos aleatoriamente e de maneira uniforme dentre as n pos-
sveis escolhas uma carta. Isso quer dizer que para cada i [n], a escolha da carta
i tem probabilidade 1/n. Escolhemos agora uma outra posio j [n], indepen-
dentemente de i e de maneira uniforme. Trocamos, ento, a cartas que ocupam as
posies escolhidas. Caso elas sejam iguais, nenhuma troca feita.
Aps essa operao a ordeminicial (1, 2, . . . , n) foi provavelmente modicada
para uma outra ordem (a
1
, a
2
, . . . , a
n
), digamos. Assim, o procedimento acima
corresponde a uma embaralhada, ou seja a uma permutao. Mas qual?
A resposta para essa pergunta : depende da carta selecionada e da posio
escolhida. Como tanto a carta quanto posio so escolhidas ao acaso, a prpria
23
24 CHAPTER 4. PROBABILIDADE E EMBARALHAMENTOS
permutao algo que acontece ao acaso. Esse procedimento gera ento uma
varivel aleatria X assumindo valores em S
n
e, como consequncia, induz uma
distribuio de probabilidade Q em S
n
, que dada por
Q() = P(X = ), para cada S
n
.
Para o modelo de embaralhada descrito acima fcil exibir explicitamente a
distribuio Q. Denotamos por (j k) o elemento de S
n
denido por:
(i) =
_
_
_
k, se i = j
j, se i = k
i, caso contrrio.
em palavras, (j k) a permutao que troca j e k entre si e mantm xos os
demais elementos do conjunto [n] xos. Uma permutao desse tipo chamada
de um 2-ciclo ou transposio. Assim, por exemplo, fazendo n = 5, a permutao
(23) aquela que leva a pilha (1, 2, 3, 4, 5) na pilha (1, 3, 2, 4, 5). Denotaremos
por
T o conjunto de todos os elementos de S
n
que so 2-ciclos.
A cada embaralhada, a carta e a posio so escolhidas independentemente e com
probabilidade igual a 1/n. Assim cada possvel par escolhido com probabilidade
1/n
2
. Os resultados das escolhas se dividem em dois casos: ou a carta selecionada
coincide com aquela que ocupa a posio escolhida ou, caso contrio, essas cartas
so distintas. Note que, no primeiro caso, nenhuma transposio feita, ou seja, a
permutao resultante do processo de embaralhamento a identidade. Como esse
caso pode acontecer de n maneiras diferentes, temos que a probabilidade de que
ele ocorra igual a n
1
n
2
=
1
n
. Assim, conclumos que a distribuio Q deve dar
peso 1/n para a permutao identidade. Por outro lado, no segundo caso, uma
carta j e outra k sero trocadas entre si, dando origem a um 2-ciclo (j k). Note
que o esse mesmo 2-ciclo tambm ocorre quando, primeiro selecionamos a carta k
e depois a posio na qual se encontra a carta j. Isso mostra que cada elemento de
T ocorre com probabilidade igual a 2/n
2
, e conclumos que a distribuio Qdeve
dar esse peso a cada um desses elementos. Claramente outros tipos de permutao
nunca acontecem, logo tm peso nulo.
Acabamos de provar que, para a distribuio de probabilidade induzida em S
n
pelo modelo de embaralhada do exemplo anterior :
Q() =
_
_
_
1
n
, se = id,
2
n
2
, se T ,
0, caso contrrio.
Esperamos que o leitor esteja convencido de que, no caso geral, uma embaral-
hada ao acaso pode ser identicada com uma distribuio de probabilidade sobre
S
n
.
4.2. EMBARALHADAS INDEPENDENTES E CONVOLUES 25
Conveno 2. Realizar uma embaralhada ao acaso em um conjunto de cartas cuja
ordenao descrita por uma permutao
0
, tomar uma permutao
1
de
acordo com alguma distribuio de probabilidade Q em S
n
e depois multiplic-la
pela por
0
. O resultado da embaralhada ao acaso a permutao
1

0
.
4.2 Embaralhadas independentes e convolues
Geralmente, o processo de embaralhar um conjunto de n cartas realizado atravs
da repetio de um mesmo tipo simples de embaralhada. No Exemplo 11 cada
embaralhada ao acaso uma simples transposio de duas cartas. No entanto,
caso o processo descrito nesse exemplo fosse iterado vrias vezes poderamos
obter permutaes mais complexas.
Exemplo 12. Suponha que o processo de embaralhadas ao acaso descrito no Ex-
emplo 11, com um total de cinco cartas (n = 5), repetido de maneira indepen-
dente por trs vezes. Sejam
1
= (2 3),
2
= (3 5) e
3
= (4 1) as trs escolhas
independentes de permutaes feitas de acordo com a distribuio Q.
Ento a sequncia de embaralhadas ao acaso (
1
,
2
,
3
) fornece a permutao
3

2

1
= (4 1)(3 5)(2 3). Note que essa permutao composta leva a ordenao
de cartas (1, 2, 3, 4, 5) na ordenao (4, 3, 5, 1, 2).
Fixe uma distribuio de probabilidades Q em S
n
que corresponde a uma
nica embaralhada. Na nossa modelagem, k embaralhadas sero sempre tratadas
como permutaes independentes (
1
,
2
, . . . ,
k
), cada uma delas escolhida de
acordo com a distribuio de probabilidade Q. Isso corresponde a tomar um ele-
mento do espao amostral
=
1

2

k
= S
n
S
n
. .
k vezes
e a distribuio produto
Q
1
Q
2
Q
k
= Q Q
. .
k vezes
,
Assim,
1
,
2
, . . . ,
k
vo representar embaralhadas ao acaso independentes
que sero aplicadas sucessivamente pilha de cartas que inicia em uma disposio
inicial descrita por uma permutao
0
.
Comeando da permutao
0
, (por exemplo,
0
= id, que descreve a orde-
nao emque as cartas esto dispostas de maneira crescente de cima para baixo em
uma pilha) aps a primeira embaralhada ao acaso, obtemos a permutao
1

0
.
Aps a segunda embaralhada ao acaso, obtemos a permutao
2

1

0
, e assim
por diante at realizarmos a k-sima embaralhada ao acaso, aps a qual teremos
obtido a permutao
k

k1
. . .
1

0
, que descrever a ordem relativa das cartas
na pilha aps a realizao de k embaralhadas aleatrias.
Observao 5. Essa construo de repeties de embaralhadas ao acaso similar
quela do Exemplo 7 no qual uma moeda era lanada k vezes de maneira inde-
pendente. De fato, a nica diferena que o espao amostral e a distribuio de
probabilidades sobre esse espao foram modicados para aqueles que modelam o
embaralhamento ao acaso de cartas, ao invs do lanamento de uma moeda.
Como S
n
umgrupo, a multiplicao de elementos de S
n
ainda umelemento
de S
n
. Denotamos por
(k)
=
k

1
S
n
.
Como cada uma das permutaes
i
escolhida independentemente, ao acaso, de
acordo com a distribuio Q, temos que
(k)
tambm pode ser descrita por uma
distribuio de probabilidade em S
n
. Mas qual essa distribuio?
Pensemos primeiramente em
(2)
=
2
1
. Para um elemento xo g S
n
, vale
que
P(
(2)
= g) = P(
2
1
= g)
=
g
1
S
n
P(
2
g
1
= g,
1
= g
1
)
=
g
1
S
n
P(
2
= gg
1
1
,
1
= g
1
)
=
g
1
S
n
P(
2
= gg
1
1
)P(
1
= g
1
)
=
g
1
S
n
Q(gg
1
1
)Q(g
1
)
=
g
2
,g
1
S
n
;
g
2
g
1
=g
Q(g
2
)Q(g
1
).
Denotaremos a soma na lado direito da ltima igualdade por
Q Q(g) = Q
2
(g) =
g
2
,g
1
S
n
;
g
2
g
1
=g
Q(g
2
)Q(g
1
).
Assim temos que
P(
(2)
= g) = Q
2
(g),
logo Q
2
a distribuio de probabilidade induzida em S
n
pela permutao ao
acaso
(2)
=
2
1
.
Denio 7. Seja Q uma distribuio de probabilidade sobre S
n
. A distribuio
que satisfaz
Q
2
=
g
2
,g
1
S
n
;
g
2
g
1
=g
Q(g
2
)Q(g
1
)
4.2. EMBARALHADAS INDEPENDENTES E CONVOLUES 27
para todo elemento g S
n
chamada de convoluo de Q com Q.
Vamos agora generalizar o procedimento feito anteriormente para encontrar a
distribuio de
(k)
para valores arbitrrios de k.
Vamos mostrar que, para cada g S
n
,
P(
(k)
= g) =
g
k
,...,g
1
S
n
;
g
k
g
1
=g
Q(g
k
) Q(g
1
).
De fato, j sabemos que essa frmula vlida para k = 1 e k = 2. Suponhamos
que, para algum k 2 ela seja tambm vlida. Ento,
P(
(k+1)
= g) = P(
k+1
(k)
= g)
=
hS
n
P(
k+1
h = g,
(k)
= h)
=
hS
n
P(
k+1
= gh
1
,
(k)
= h)
=
hS
n
Q(gh
1
)Q
k
(h)
=
hS
n
g
k
,...,g
1
S
n
;
g
k
g
1
=h
Q(gh
1
)Q(g
k
) Q(g
1
)
=
g
k+1
,g
k
,...,g
1
S
n
;
g
k+1
g
k
g
1
=g
Q(g
k+1
)Q(g
k
) Q(g
1
),
o que encerra a demonstrao.
Denio 8. A distribuio que satisfaz
Q
k
(g) =
g
k
,...,g
1
S
n
;
g
k
g
1
=g
Q(g
k
) Q(g
1
)
para todo elemento g S
n
chamada a convoluo de Q com Q k vezes.
Pelo que mostramos acima, Q
k
a distribuio de probabilidade induzida em
S
n
pelo elemento
(k)
=
k

1
.
Convolues podem tambm ser realizadas entre distribuies distintas umas
das outras. Mas geralmente, suponha que Q
1
e Q
2
so distribuies de probabili-
dade em S
n
. Denimos a convoluo entre Q
1
e Q
2
como sendo a distribuio de
probabilidade em S
n
que atribui a cada elemento g S
n
a probabilidade
Q
2
Q
1
(g) =
g
2
,g
1
S
n
;
g
2
g
1
=g
Q
2
(g
2
)Q
1
(g
1
).
Uma pequena modicao nos clculos que zemos acima, nos mostra que, para
um par (
1
,
2
) S
n
S
n
distribudo de acordo com Q
1
Q
2
, a distribuio do
produto
2
1
dada pela convoluo Q
2
Q
1
.
No caso em que (
1
, . . . ,
k
) uma k-upla independente de elementos de S
n
,
cada, onde cada
i
tem distribuio Q
i
, a distribuio do produto
k

1
dada
pela convoluo:
Q
k
Q
1
(g) =
g
k
,...,g
1
S
n
;
g
k
g
1
=g
Q
k
(g
k
) Q
1
(g
1
).
4.3 A distribuio uniforme e suas propriedades
Nessa seo vamos estudar uma distribuio de probabilidade particular em S
n
,
denominada distribuio uniforme. Assim como no contexto geral do Exemplo
3, essa a distribuio sob a qual todos os elementos do espao amostral S
n
so
equiprovveis.
Denio 9. A distribuio uniforme sobre S
n
a distribuio de probabilidade
que satisfaz
() =
1
n!
para cada elemento S
n
.
Observao 6. Lembramos que a ordem das cartas em uma pilha pode ser descrita
por uma palavra (a
1
, a
2
, . . . , a
n
) que, por sua vez pode ser identicada com uma
permutao. Assim, uma distribuio de probabilidade sobre S
n
pode ser usada
para modelar tambm uma escolha ao acaso da ordem das cartas em uma pilha.
Intuitivamente, a distribuio uniforme aquela na qual a ordem das cartas
escolhida mais ao acaso.
Suponha que a ordem das cartas em uma pilha descrita pela distribuio uni-
forme. Ser que realizar uma embaralhada vai mudar a distribuio que descreve
o estado da pilha?
Vamos mostrar que a distribuio uniforme preservada por qualquer embar-
alhada xa. Matematicamente temos o seguinte:
Fato 2. A distribuio uniforme invariante sob as operaes de grupo em S
n
.
Para demonstrar esse fato, considere um evento qualquer A, isto , um sub-
conjunto de permutaes A =
1
, . . . ,
k
S
n
distintas. Como o evento A
tem k elementos e cada um deles tem peso igual a
1
n!
sob , temos que (A) =
k
n!
.
Seja S
n
qualquer. Denimos agora A =
1
, . . . ,
k
o evento que
consiste em multiplicar por todos os elementos de A. Notemos agora, que os
elementos de A so dois-a-dois distintos. De fato, se fosse
i
=
j
para
i ,= j, ento multiplicando por
1
de ambos os lados obteramos que
i
=
j
,
4.4. UNIFORMIDADE PERFEITA 29
uma contradio. Dessa forma, temos que A tem tambm k elementos, logo
(A) = (A).
4.4 Uniformidade perfeita
Descreveremos agora um algoritmo que nos permite gerar, a partir de uma pilha
de cartas ordenadas de maneira crescente de cima para baixo, uma pilha ordenada
ao acaso na qual cada uma das possveis ordens equiprovvel. Para isso vamos
aplicar embaralhadas escolhidas ao acaso em uma pilha que inicialmente tem a
ordem dada pela palavra (1, 2, . . . , n) e obteremos ao nal uma pilha na qual cada
uma das ordens aparece com probabilidade igual a
1
n!
.
Denotamos por a
0
= (1, 2, . . . , n) a palavra que descreve a ordem inicial das
cartas na pilha. Para cada k = 1, 2, . . . , n 1, sejam l
k
nmeros escolhidos
independentemente e uniformemente ao acaso no conjunto k, . . . , n. Isso quer
dizer que l
k
assume cada um dos n k + 1 possveis valores em k, . . . , n com
probabilidade igual a
1
nk+1
e de maneira independente dos demais valores de l
j
para j ,= k. Realizamos agora a seguinte operao:
trocamos entre si a carta que ocupa atualmente a posio 1
e a carta que ocupa atualmente a posio l
1
.
Ao nal desse passo, a ordem das cartas na pilha descrita por uma palavra a
1
=
(a
1
1
, a
1
2
, . . . , a
1
n
). A carta que ocupa a primeira posio, isto , a carta de nmero
a
1
1
, era a carta que ocupava a posio l
1
. Isso o mesmo que armar que a carta
que ocupa a primeira posio foi escolhida uniformemente ao acaso no conjunto
1, . . . , n, logo,
P(a
1
1
= j) =
1
n
para cada j 1, . . . , n.
Seja a
k1
= (a
k1
1
, a
k1
2
, . . . , a
k1
n
) a ordem da pilha aps o passo de nmero
k 1 ter sido realizado. Denimos de maneira recursiva a ordem a
k
da pilha aps
o k-simo passo da seguinte forma:
trocamos entre si a carta que ocupa atualmente a posio k
e a carta que ocupa atualmente a posio l
k
.
Note que, no k-simo passo, a carta que assumir a posio k (isto , a carta a
k
k
)
uma das cartas que, aps o k 1-simo passo, ocupavam posies menores ou
igual do que k. Em particular essa carta no mais poder sair da posio k em
passos subsequentes. Note ainda que essa carta , escolhida uniformemente no
conjunto das cartas que ainda no foram escolhidas nos passos anteriores, isto
no conjunto complementar a a
1
1
, a
2
2
, . . . , a
k1
k1
. Assim, cada escolha para a carta
a
k
k
nesse conjunto complementar tem probabilidade igual a
1
nk+1
.
Isso mostra que para qualquer k-upla de nmeros distintos j
1
, j
2
, . . ., j
k
, vale
que
P(a
k
1
= j
1
, a
k
2
= j
2
, . . . , a
k
k
= j
k
) =
1
n
1
(n 1)

1
(n k + 1)
. (4.1)
Denotamos, para qualquer palavra (j
1
, j
2
, . . . , j
n
),
Q(j
1
, j
2
, . . . , j
n
) = P(a
k
1
= j
1
, a
k
2
= j
2
, . . . , a
n
n
= j
n
).
Ento Q a distribuio de probabilidade induzida no conjunto das palavras pela
sequncia de embralhadas ao acaso descritas acima. Atravs da identicao de
palavras com permutaes, podemos entender Q como uma distribuio de prob-
abilidade em S
n
.
Em particular, fazendo k = n na Equao 4.1, obtemos que
Q(j
1
, j
2
, . . . , j
n
) =
1
n!
,
isto, , Q corresponde distribuio uniforme em S
n
.
4.5 Aproximando a distribuio uniforme
Como vimos na Seo 4.2, um processo de embaralhamento de cartas pode ser
modelado pela multiplicao sucessiva de permutaes escolhidas ao acaso e in-
dependentemente de acordo com uma distribuio de probabilidade Q denida
em S
n
. Assim, em geral, no podemos ter certeza de qual a ordem relativa entre
as cartas aps a k-sima embaralhada, mas sim a probabilidade de que essa ordem
seja dada por uma permutao g S
n
, que igual a Q
k
(g).
Intuitivamente falando, o objetivo principal de um embaralhamento fazer
comque essa distribuio de probabilidade Q
k
se aproxime sucientemente daquela
que associa a cada g S
n
o peso
1
n!
, isto a distribuio uniforme em S
n
. Assim,
o que gostaramos de saber : quantas embaralhadas seriam necessrias para que
essas distribuies estejam prximas?.
Nosso objetivo nessa seo formalizar o conceito de distncia entre dis-
tribuies, dando sentido matemtico argumentao do pargrafo anterior. O
conceito chave para tal propsito denido a seguir:
Denio 10. Seja um espao amostral nito e Q
1
e Q
2
duas distribuies de
probabilidade em . Denimos a distncia em variao total entre Q
1
e Q
2
como
sendo:
d
vt
(Q
1
, Q
2
) = sup
A
[Q
1
(A) Q
2
(A)[ .
4.5. APROXIMANDO A DISTRIBUIO UNIFORME 31
Seja T() o conjunto de todas as distribuies de probabilidade em . Ento
a distncia em variao total realmente uma distncia em T(). Convidamos o
leitor a mostrar isso no seguinte:
Exerccio 5. Mostre que, para quaisquer Q
1
, Q
2
e Q
3
distribuies em S
n
, vale
que:
1. d
vt
(Q
1
, Q
2
) 0 e d
vt
(Q
1
, Q
2
) = 0 se, e somente se, Q
1
= Q
2
;
2. d
vt
(Q
1
, Q
2
) = d
vt
(Q
2
, Q
1
);
3. d
vt
(Q
1
, Q
2
) d
vt
(Q
1
, Q
3
) + d
vt
(Q
3
, Q
2
).
Conclua que d
vt
realmente uma distncia em T().
Exemplo 13. Tomemos = S
n
e seja a distribuio uniforme em S
n
. Ento
para cada distribuio Q S
n
, temos que
d
vt
(Q, ) = max
AS
n
Q(A)
[A[
n!
.
Como caso particular, considere Q a distribuio de probabilidade concentrada
em
0
= id, isto , a distrituio satisfazendo:
Q(A) =
_
1, se id A,
0, caso contrrio.
Para essa distribuio temos que Q(A)
|A|
n!
no negativo e sempre assume o
seu mximo quando A = id. Sendo assim,
d
vt
(Q, ) = Q(id)
[id[
n!
= 1
1
n!
.
Note que, quanto maior n, mais longe essa distribuio Q se encontra da dis-
tribuio estacionria.
Como vimos no exemplo 4.4, aps realizarmos uma quantidade nita de trans-
posies ao acaso possvel que atinjamos exatamente a distribuio uniforme.
De fato, naquele exemplo, se denotarmos a distribuio da k-sima embaralhada
por Q
k
, ento vale que Q
1
Q
2
Q
n
= . (Observe, no entanto que, no caso
desse exemplo cada uma das transposies tinha uma distribuio de probabili-
dade diferente).
Em outros modelos de embaralhamento, a distribuio uniforme geralmente
no atingida aps a realizao de uma quantidade nita de embaralhadas. O que
podemos esperar, no entanto, que a distribuio de probabilidade que descreve
o estado da pilha aps k embaralhadas se aproxime arbitrariamente da uniforme
quando k sucientemente grande. Isto ser verdade, por exemplo, no modelo de
embaralhamento mais realista que denimos na seo 4.6.
Podemos ento formular nossa pergunta principal. Seja Q a distribuio de
probabilidade induzida em S
n
por uma embaralhada. Aps k embaralhadas inde-
pendentes temos que a distribuio que descreve o estado da pilha a convoluo
Q
k
.
Pergunta: Quantas embaralhadas so necessrias isto , o quo
grande k precisa ser para que Q
k
e estejam prximas?
Para ser mais preciso devemos dizer o que queremos dizer com estejam prx-
imas. Para isso, xemos um valor que pode ser entendido como uma tolern-
cia. Queremos ento saber qual a quantidade mnima de embaralhadas que
precisamos realizar para que
d
vt
(Q
k
, ) < .
A prxima denio se torna ento til:
Denio 11 (Tempo de mistura). Seja > 0 xado e Q uma distribuio de
probabilidade em S
n
. Denimos o tempo de mistura como sendo:
t
mix
() = infk 0; d
vt
(Q
k
, ) .
Quando escolhemos =
1
4
, escrevemos simplesmente, t
mix
, isto , t
mix
= t
mix
(1/4).
Feita precisa a noo de aproximar a distribuio uniforme, podemos agora
enunciar precisamente o tipo de problema que queremos responder ao nal desse
curso:
Problema: Fixada uma distncia de tolercia > 0, como o tempo
de mistura t
mix
() se comporta em funo de n, quantidade de cartas
na pilha n?
.
4.6 O embaralhamento de Gilbert-Shannon-Reeds
Nessa seo apresentaremos ummodelo para embaralhamentos que mais realista
do que o modelo de transposio ao acaso e o modelo de cima-para-o-acaso que
foram apresentados anteriormente.
Lembramos que nas sees 4.1 e 4.2 vimos que um modelo para embaral-
hamentos consiste em aplicar sucessivamente esquerda uma sequncia de per-
mutaes
1
,
2
, . . . escolhida independentemente e ao acaso de acordo com uma
4.6. O EMBARALHAMENTO DE GILBERT-SHANNON-REEDS 33
distribuio de probabilidade em S
n
. Assim, especicar um mtodo de embaral-
hamento se reduz a especicar uma distribuio de probabilidade Q em S
n
.
Vamos agora discutir informalmente ummtodo de embaralhamento. Amatemtica
vir depois. Em um modelo de embaralhamento realista, um jogador inicialmente
corta a pilha de n cartas em duas pilhas, a primeira delas contendo M cartas e
a outra contendo n M. Esse corte feito ao acaso, signicando que a quanti-
dade M escolhida ao acaso de acordo com uma distribuio de probabilidade
em [n] = 1, 2, 3, . . . , n. Feito isso, o jogador ento intercala as cartas das duas
pilhas formando novamente uma nica pilha contendo todas as n cartas. A inter-
calao tambm realizada ao acaso, signicando que o jogador escolhe ao acaso
uma dentre as vrias maneiras de intercalar as cartas das duas pilhas entre si.
Uma maneira prtica de realizar o embaralhamento dada abaixo:
corte ao acaso a pilha originial em duas pilhas, uma contendo M e a outra
contendo n M cartas.
coloque as pilhas lado a lada sobre uma mesa.
faa com que as cartas das duas pilhas caiam gradativamente, e ao acaso,
uma sobre as outras, formando novamente um nica pilha.
Esses processos podem ser matematicamente descritos como segue:
1. Seja M uma varivel aleatria binomial com parmetros m e
1
2
(veja a
Equao 3.1). Divida a pilha em duas outras pilhas, sendo a primeira con-
tendo M e a segunda contendo n M cartas. Existem agora
_
n
M
_
maneiras
de intercalar as duas pilhas. Escolha uniformemente uma dentre essas maneiras
e intercale as duas pilhas.
2. Seja M uma varivel aleatria binomial com parmetros m e
1
2
. Divida
a pilha em duas outras pilhas, sendo a primeira contendo M e a segunda
contendo n M cartas. Segure as pilhas lado-a-lado sobre uma mesa e
deixe com as suas cartas caiam umas sobre as outras formando uma nica
pilha seguindo a seguinte regra: se, em um dado momento, a primeira
pilha contem a cartas e a segunda pilha contem b cartas, ento a prxima
carta cair da primeira pilha com probabilidade igual a
a
(a+b)
e da segunda
pilha com probabilidade igual a
b
(a+b)
.
Denio 12. O modelo de embaralhamento denido pelos itens 1 e 2 acima
chamdo Embaralhamento de Gilbert-Shannon-Reeds.
Para que a denio faa sentido, preciso mostrar que os itens 1 e 2 na
denio do embaralhamento de Gilbert-Shannon-Reeds so equivalentes, isto ,
que os procedimentos neles descritos induzem a mesma distribuio de probabil-
idade em S
n
. Precisamos antes de uma denio.
Denio 13. Seja S
n
uma permutao e (a
1
, a
2
, . . . , a
n
) a sua representao
como uma palavra. Uma sequncia levantadora de uma sequncia maximal
(estritamente) crescente (a
i
1
, . . . , a
i
k
) contida na palavra (a
1
, a
2
, . . . , a
n
).
Exemplo 14. Seja n = 10 e suponha que, aps a realizao de uma embaral-
hada do embaralhamento de Gilbert-Shannon-Reeds a pilha encontra-se ordenada
segundo a palavra:
(1, 2, 7, 3, 8, 4, 5, 9, 10, 6).
A permutao correspondente possui duas sequncias levantadoras, a saber:
(1, 2, 3, 4, 5, 6) e (7, 8, 9, 10)
Suponha que realizamos uma nica embaralhada segundo o modelo de em-
baralhamento de Gilbert-Shannon-Reeds em uma pilha contendo n cartas inicial-
mente ordenada de maneira crescente, de cima para baixo. Ento a pilha resul-
tante ter exatamente uma ou exatamente duas sequncias levantadoras. De fato
se for M = k para algum 0 < k < n ento teremos duas pilhas 1, . . . , k e
k + 1, . . . , n. Ao intercalar as cartas dessas duas pilhas entre si, a ordem rel-
ativa em cada uma das pilhas preservada. Note que possvel que uma nica
sequncia levantadora seja formada, por exemplo no caso em que as cartas da
primeira pilha so todas posicionadas sobre as cartas da segunda pilha. Tambm,
caso M = 0 ou M = n a permutao resultante ter uma nica sequncia levan-
tadora.
Mostraremos agora que a distribuio de probabilidade induzida em S
n
por
ambas as formas de denir o modelo de embaralhamento de Gilbert-Shannon-
Reeds dada por
Q() =
_
_
_
1
2
n
, se tem duas seq. levantadoras ;
n+1
2
n
, se = id;
0, caso contrrio.
Primeiro analisamos o mtodo descrito no item 1. claro que permutaes
que no so iguais identidade ou tm mais do que duas sequncias levanta-
doras no podem ser geradas por uma embaralhada, logo tm peso nulo na dis-
tribuio. Seja uma permutao contendo exatamente duas sequncias levanta-
doras (1, . . . , k) e (k + 1, . . . , n). Para que tal permutao seja gerada, devemos
ter obrigatoriamente que M = k, o que ocorre com probabilidade igual a
_
n
k
_
2
n
.
Por outra lado, xado que M = k, a permutao decorre de uma das
_
n
k
_
inter-
calaes possveis, logo ser obitida com probabilidade igual a
_
n
k
_
1
. Segue da
que a probabilidade de que o procedimento resulte na permutao igual a
_
n
k
_
2
n
_
n
k
_
1
=
1
2
n
.
4.6. O EMBARALHAMENTO DE GILBERT-SHANNON-REEDS 35
A permutao identidade pode ser gerada, de (n+1) maneiras diferentes, a saber:
M = 0
M = n
M = k para 0 < k < n e a intercalao feita de tal modo que todas as
k cartas da primeira pilha so colocadas acima de todas as n k cartas da
segunda pilha.
Os dois primeiros casos claramente tm probabilidade igual a 2
n
. Aplicando o
mesmo racioco usados para permutaes comduas sequncias levantadoras pode-
mos mostrar que o terceiro caso tambm tem probabilidade igual a 2
n
. Assim
conclumos que
Q(id) =
n + 1
2
n
Agora analisamos o mtodo descrito no item 2. Seja uma permutao con-
tendo duas sequncias levantadoras (1, . . . , k) e (k + 1, . . . , n). Ento, obrigato-
riamente, M = k, o que ocorre com probabilidade igual a
_
n
k
_
2
n
. Fixado isso,
qualquer maneira de fazer as cartas das pilhas 1, . . . , k e k + 1, . . . , n tem
probabilidade igual a
k!(n k)!
n!
=
_
n
k
_
1
. (4.2)
Segue da que a probabilidade da permutao ser gerada
_
n
k
_
2
n
_
n
k
_
1
=
1
2
n
.
Para se convencer sobre a validade da frmula 4.2 o leitor deve pensar em um
exemplo:
Exemplo 15. Considere n = 7 e k = 3 e suponha que as cartas cairam de forma a
gerar a permutao descrita pela palavra
(1, 4, 2, 5, 6, 7, 3)
Reconstruindo o embaralhamento, claramente obtemos que as duas pilhas eram
inicialmente (1, 2, 3) e (4, 5, 6, 7). E ento as cartas cairam na ordem dada pela
palavra acima. A probabilidade de que a carta 1 tenha sido a primeira a cair
igual a
3
7
, pois h trs cartas na primeira pilha e sete no total. Depois disso, a
probabilidade de que a carta 4 caia igual a
4
6
j que h quatro cartas na segunda
pilha e seis no total. Em seguida, as cartas 2, 5, 6, 7 e 3 caem com probabilidades
iguais a
2
5
,
3
4
,
2
3
,
1
2
e
1
1
respectivamente. Assim, a probabilidade de que as cartas
tenham cado na ordem especicada pela palavra acima igual a
3
7

4
6

2
5

3
4

2
3

1
2

1
1
=
(3 2 1)(4 3 2 1)
7 6 5 4 3 2 1
=
3! 4!
7!
Chapter 5
Tcnicas de prova
Agora j sabemos o que queremos provar, mas ainda no sabemos como faz-lo.
Neste captulo apresentamos nossas principais tcnicas para estudar a distncia de
uma distribuio sobre permutaes para a distribuio uniforme.
5.1 Eventos fortemente uniformes
Vamos imaginar que temos uma distribuio Q sobre permutaes que induzida
por um espao de probabilidade (, P) e uma varivel aleatria X : S
n
.
Vamos fazer uma denio.
Denio 14 (Evento fortemente uniforme - EFU). Um evento E dito
fortemente uniforme se:
S
n
: P(E X = ) =
P(E)
n!
.
Vamos pensar num caso bastante simples.
Exemplo 16. Imagine que = 0, 1 S
n
e que P uniforme; isto modela
uma escolha de moeda justa b 0, 1 e de permutao uniforme g S
n
.
Denimos:
X(b, g) g se b = 1 ou id se b = 0.
Ou seja, se a moeda d cara, X uma permutao uniformemente distribuda em
S
n
; se b = 0, X a identidade. Neste caso, vemos que:
E b = 1 1 S
n
EFU, pois P(E) = 1/2 e
g S
n
: P(E X = g) = P((1, g)) =
1
2n!
.
37
38 CHAPTER 5. TCNICAS DE PROVA
Veja ainda que:
Q(id) =
1
2
+
1
2n!
e Q(g) =
1
2n!
para g S
n
id.
Do que nos servem eventos fortemente uniformes? A proposio a seguir nos
diz o que devemos fazer.
Proposio 1. Suponha que Q uma distribuio sobre S
n
que induzida por
(, P) e X : S
n
. Ento, para qualquer EFU E ,
d
vt
(Q, ) 1 P(E) .
Observao 7. O resultado da proposio acima, nos fornece a seguinte cota
d
vt
(Q, ) 1/2. Escolhendo A = S
n
id na denio de d
vt
, vemos que
d
vt
(Q, ) = 1/2 1/2n!, logo a cota dada pelo EFU bastante precisa neste
caso.
Para provar a Proposio, precisamos mostrar que para qualquer subconjunto
A S
n
:

[A[
n!
Q(A)
1 P(E) ,
pois a d
vt
o mximo das quantidades no lado direito. Comeamos provando que:
Para todo A S
n
:
[A[
n!
Q(A) 1 P(E) . (5.1)
Veja que:
Q(A) =
gA
Q(g) =
gA
P(X = g)
pela denio de distribuio induzida. Como E um EFU,
g S
n
: P(X = g) P(X = g E) =
P(E)
n!
,
logo
Q(A)
gA
P(E)
n!
= P(E)
[A[
n!
e deduzimos:
[A[
n!
Q(A) (1 P(E))
[A[
n!
1 P(E) ,
como desejado, j que [A[ [S
n
[ = n!.
5.2. INVERTENDO EMBARALHAMENTOS 39
Agora conclumos a prova. Pela desigualdade (5.1), temos que
[A[
n!
Q(A)
1 P(E)
sempre que a diferena de que tomamos mdulo do lado direito positiva ou zero.
Para terminar a prova, s precisamos mostrar agora que a mesma desigualdade
vale se a diferena negativa. Neste caso, basta provar que
Q(A)
[A[
n!
1 P(E) .
Para isso, vamos reaproveitar o resultado em (5.1). Dena o conjunto B = S
n
A,
o complementar de A. Veja que Q(B)+Q(A) = 1, portanto Q(B) = 1Q(A).
De forma anloga, como [B[ = n! [A[, [B[/n! = 1 [A[/n!. Deduzimos que:
Q(A)
[A[
n!
=
[B[
n!
Q(B) .
Como B subconjunto de S
n
, podemos aplicar (5.1) a este conjunto para concluir
que:
Q(A)
[A[
n!
=
[B[
n!
Q(B) 1 P(E) ,
como queramos demonstrar.
5.2 Invertendo embaralhamentos
Aplicar a tcnica de EFUs exige que se compreenda bem o que o embaralhamento
faz, o que nem sempre fcil. Nesta seo mostraremos que, sempre que for
conveniente, possvel trocar o embaralhamento estudado por um outro, chamado
de embaralhamento invertido, que pode ser bem mais fcil de analisar.
Denio 15. Suponha que Q uma distribuio de probabilidade sobre S
n
. A
distribuio invertida de Q, denotada por Q
1
, aquela denida pela receita:
Q
1
(g) Q(g
1
) (g S
n
).
Intuitivamente, uma embaralhada segundo Q
1
corresponde a sortear g se-
gundo Q e depois embaralhar as cartas no segundo g, mas segundo g
1
.
Por que Q
1
tambm uma distribuio de probabilidade? Claramente, Q
1
(g)
0 para cada g. Alm disso, a operao que leva g em sua inversa uma bijeo
do grupo S
n
consigo mesmo. Isto , para cada g existe um nico h com g
1
= h.
Portanto:

gS
n
Q
1
(g) =
gS
n
Q
_
g
1
_
=
hS
n
Q(h) = 1.
Portanto, os pesos Q
1
(g) satisfazem a denio de distribuio de probabilidade.
Exerccio 6. Mostre que, ao inverter duas vezes uma distribuio, voltamos dis-
tribuio original (isto tem a ver que a operao inversa em S
n
satisfaz (g
1
)
1
=
g).
Exerccio 7. Mostre que a invertida da distribuio uniforme a prpria dis-
tribuio uniforme.
Como dissemos acima, nosso interesse mostrar que trocar Q por sua verso
invertida no altera o problema que queremos estudar. Provaremos isto em duas
partes. A primeira nos diz que, para inverter uma convoluo, basta inverter as
distribuies convoludas".
Proposio 2. Para qualquer Q como acima e t > 0 inteiro,
(Q
1
)
t
= (Q
t
)
1
.
A prova disto no difcil. Veja que, para qualquer g S
n
,
(Q
t
)
1
(g) = Q
t
(g
1
)
a soma de Q(g
1
) Q(g
k
) sobre todas as escolhas de g
1
, , g
k
S
n
com
g
1
g
k
= g
1
.
Denindo
h
1
= g
1
k
, h
2
= g
1
k1
, . . . , h
k
= g
1
1
,
e lembrando da regra da inversa do produto, vemos que:
g
1
g
k
= g
1
se e somente se h
1
h
2
h
k
= g.
Como a inversa uma bijeo de S
n
, temos que:
Q
t
(g
1
) =
h
1
,...,h
k
S
n
:
h
1
h
k
=g
Q(h
1
k
)Q(h
1
k1
) Q(h
1
1
)
=
h
1
,...,h
k
S
n
:
h
1
h
k
=g
Q
1
(h
1
) Q
1
(h
k
)
= (Q
1
)
t
(g)
Logo
g S
n
: (Q
t
)
1
(g) = (Q
1
)
t
(g), CQD.
Nosso segundo resultado sobre distribuies invertidas que elas esto to
perto (ou longe) da distribuio uniforme quanto as originais.
5.3. OINVERSODOEMBARALHAMENTODE GILBER-SHANNON-REEDS41
Proposio 3. Para qualquer Q como acima:
d
vt
(Q, ) = d
vt
(Q
1
, ).
Para provar isto, vamos denir, para cada subconjunto A S
n
, a sua imagem
invertida:
A
1
g
1
: g A.
Como j dissemos antes, a operao inverso uma bijeo de S
n
em si mesmo.
Logo A e A
1
sempre tm o mesmo nmero de elementos. Vamos mostrar que
sempre vale a seguinte identidade.
Q(A) = Q
1
(A
1
) e Q
_
A
1
_
= Q
1
(A). (5.2)
Portanto, para qualquer A S
n
,
max
AS
n
Q(A)
|A|
n!
= max
AS
n
Q
1
(A
1
)
|A
1
|
n!
= max
BS
n
Q
1
(B)
|B|
n!
,
ou seja,
d
vt
(Q, ) d
vt
(Q
1
, ).
Do mesmo modo, invertendo os papis das distribuies,
d
vt
(Q
1
, ) d
vt
(Q, )
e temos a desigualdade desejada. Para provar (5.2), comeamos observando que
Q(A) =
aA
Q(a) =
bA
1
Q
_
b
1
_
.
Para mostrar isso, basta tomar b a
1
e notar que isto resulta numa corre-
spondncia biunvoca entre A e A
1
. Pela denio da invertida,
bA
1
Q
_
b
1
_
=
bA
1
Q
1
(b) = Q
1
(A
1
),
portanto Q(A) = Q
1
(A
1
). A prova de que Q(A
1
) = Q
1
(A) anloga.
5.3 Oinverso do embaralhamento de Gilber-Shannon-
Reeds
Na Seo 4.6 deduzimos a seguinte expresso para a distribuio induzida em S
n
pelo embaralhamento de Gilbert-Shannon-Reeds:
Q() =
_
_
_
1
2
n
, se tem duas seq. levantadoras ;
n+1
2
n
, se = id;
0, caso contrrio.
Nosso objetivo nessa seo interpretar a distribuio inversa Q
1
encon-
trando quais so as operaes com cartas que induzem essa distribuio em S
n
.
Isso nos fornecer uma descrio do embaralhamento inverso de Gilbert-Shannon-
Reeds. Como Q
1
() = Q(
1
) temos que:
Q
1
() =
_
_
_
1
2
n
, se
1
tem duas seq. levantadoras ;
n+1
2
n
, se = id;
0, caso contrrio.
Para mostrar como induzir essa distribuio em S
n
a partir de operaes com
cartas, consideramos que uma pilha com n cartas encontra-se inicialmente orde-
nada de maneira crescente de cima para baixo. Para cada i 1, . . . , n, lance
independentemente uma moeda justa. Selecione com a mo esquerda todas as
cartas i para as quais o resultado do lanamento da i-sima moeda foi coroa, for-
mando com elas uma pilha que mantm a ordem parcial. Com a mo direita,
selecione todas as cartas para as quais o resultado foi igual a cara, formando tam-
bm uma pilha que mantm a ordem relativa entre elas. Posicione agora a pilha
de cartas da mo esquerda sobre aquela que est na mo direita, formando uma
nica pilha.
Mostraremos que esse modelo de embaralhamento induz sobre S
n
a distribuio
Q
1
dada acima. Para ver isso, note que cada possvel resultado para o lanamento
conjunto das n moedas tem probabilidade igual a 1/2
n
j que o experimento con-
siste de n lanamentos independentes de uma moeda justa. Observamos agora que
as operaes do modelo descrito acima no alteram o embaralhamento da pilha
em exatamente n + 1 resultados dos lanamentos das n moedas. De fato, se para
algum k 0, . . . , n temos que todos os k primeiros lanamentos tm como
resultado coroa e todos os n k ltimos lanamentos tm como resultado cara,
ento a pilha que car na mo direita ser a (1, . . . , k) (ou nenhuma pilha quando
k = 0) enquanto que a pilha que car na mo direita ser a pilha (k + 1, . . . , n)
(ou nenhuma pilha quando k = n). Assim, ao posicionarmos a primeira pilha so-
bre a segunda obteremos a pilha original (1, . . . , n). Segue da que a distribuio
de probabilidade induzida em S
n
confere peso igual a (n + 1)/2
n
para a permu-
tao identidade, como queramos.
Suponha agora que a permutao induzida seja tal que
1
tenha, exata-
mente, duas sequncias levantadoras representadas por (a
i
1
, . . . , a
i
k
) e (a
j
1
, . . . , a
j
l
)
. Ento o processo de lanamentos de moedas que gerou deve atribuir coroa aos
ndices i
1
, . . . , i
k
e cara aos indces j
1
, . . . , j
k
(ou vice-versa). Em todo caso,
haver um nico resultado para o lanamento conjunto das n moedas que dar
origem a . Assim o peso atribudo a pela distribuio de probabilidade in-
duzida igual a 1/2
n
.
5.4. UM RESUMO 43
5.4 Um resumo
Qual o resultado disto tudo? A ideia que, para analisar t embaralhadas suces-
sivas modeladas por uma distribuio Q, basta analisar t embaralhadas invertidas
repetidas. Anal, utilizando em conjunto as Proposies 2 e 3 acima, vemos que:
d
vt
(Q
t
, ) = d
vt
((Q
1
)
t
, ).
Assim, para mostrar que, para um determinado t, d
vt
(Q
t
, ) pequena, basta
encontrarmos um evento fortemente uniforme para (Q
1
)
t
. Esta ser a estratgia
que adotaremos para provar nosso resultado principal.
Chapter 6
Doze embaralhadas bastam
Nesse captulo, sero utilizadas os conceitos e as tcnicas apresentadas no captulo
anterior para demonstrar o resultado de que, para um baralho contendo 52 cartas,
bastam doze embaralhadas para que a distribuio esteja perto da uniforme.
6.1 Bits e embaralhamentos
Lembramos que, para analisar a distncia em variao total entre Q
t
e , basta
considerar a distncia entre (Q
1
)
t
e , j que, como mostrado na Proposio
3, essas duas distncias coincidem. Obteremos uma cota superior para o tempo
de mistura do embaralhamento de Gilbert-Shannon-Reeds utilizando um evento
fortemente uniforme (EFU) para (Q
t
)
1
mas, para isto, precisamos de uma forma
alternativa para descrever (Q
1
)
t
.
Lembramos que a um lanamento de moedas, associamos o dgito 0 ao re-
sultado coroa e o dgito 1 para o resultado cara. Como vimos na Seo 5.3 o
inverso do embaralhamento de Gilbert-Shannon-Reeds associa a cada carta um
rtulo 0 ou 1 independentemente e depois, posiciona todas as cartas que rece-
beram o rtulo 0 sobre as cartas que receberam o rtulo 1, sem alterar a posio
relativa inicial das cartas que recebem o mesmo rtulo.
Ao analisarmos duas embaralhadas independentes, cada carta ter associada a
si uma das sequncia de dois bits 00, 10, 01 e 11. Assim, todas as cartas rotuladas
com a sequncia 00 caro posicionadas acima daquelas rotuladas com a sequn-
cia 10 que, por sua vez, caro sobre aquelas rotuladas com a sequncia 01 que,
nalmente, caro sobre as rotuladas com a sequncia 11. Cartas rotuladas com
a mesma sequncia de dois dgitos permanecem ordenadas de forma crescente de
cima para baixo.
Do mesmo modo, para um dado tempo t podemos associar a cada carta i [n]
45
46 CHAPTER 6. DOZE EMBARALHADAS BASTAM
a sequncia de bits atribuda a i:
b(i) (b
1
(i), b
2
(i), . . . , b
t
(i)) 0, 1
t
As cartas na pilha so ordenadas segundo a ordem induzida por suas sequncias.
Mais exatamente, a carta i ca acima de j se e somente se ocorre um dos seguintes
casos.
Caso 1 Se b(i) = b(j), ento i est por cima de j se e somente se j estava assim no
incio.
Caso 2 Se b(i) ,= b(j), seja 1 s t o ltimo instante de tempo em que b
s
(i) ,=
b
s
(j) (de modo que b
u
(i) = b
u
(j) se s < u t). Ento i est por cima de j
se e somente se b
s
(i) = 0 e b
s
(i) = 1.
6.2 O evento fortemente uniforme
Lembrando que xamos um t acima, podemos denir o nosso evento fortemente
uniforme E. Ele ocorre se e somente se cada i [n] recebe uma sequncia distinta
de bits.
E 1 i < j n : b(i) ,= b(j)
.
Vamos mostrar que E de fato um EFU. Como cada sequncia de dgitos
gerada por lanamentos independentes de moedas honestas, ento cada uma das
sequncias de t bits tema mesma probabilidade, a saber 1/2
t
. Dentro do evento E,
as sequncias de t dgitos so todas elas distintas, e portanto a posio das cartas
na pilha ca totalmente determinada por essas sequncias, sem levar em conta os
nomes iniciais das cartas. Isto , se trocamos os rtulos iniciais das cartas, isto
no muda a probabilidade P
_
E
(t)
= g
_
para qualquer g S
n
, onde
(t)
descreve o estado da pilha aps t embaralhadas.
Vejamos agora que isto implica que para qualquer g S
n
P
_
E
(t)
= g
_
= P
_
E
(t)
= id
_
. (6.1)
Para isto, imagine que modicamos as posies iniciais das cartas de acordo
com a permutao g. Deste modo, a ordenao no tempo t
(t)
g. Como j vimos
acima, alterar os nomes iniciais das cartas no altera probabilidades em E, logo:
P
_
E
(t)
= g
_
= P
_
E
(t)
g = g
_
Mas
(t)
g = g a mesma coisa que
(t)
= id, logo a Equao (6.1) vlida.
6.3. UMA COTA PARA O TEMPO DE MISTURA 47
Para terminar a prova de que E EFU, observamos que os valores de P
_
E
(t)
= g
_
tm de ser todos iguais. Alm disso, os eventos E
(t)
= g so disjuntos e
sua unio E. Portanto, para qualquer h S
n
n! P
_
E
(t)
= h
_
=
gS
n
P
_
E
(t)
= g
_
= P(E) ,
logo
P
_
E
(t)
= h
_
=
P(E)
n!
.
6.3 Uma cota para o tempo de mistura
Podemos agora obter uma limitao superior para o tempo de mistura do embar-
alhamento de Gilbert-Shannon-Reeds em funo de n, a quantidade de cartas.
Proposio 4. Para o embaralhamento de Gilbert-Shannon-Reeds em uma pilha
de n cartas, o tempo de mistura satisfaz:
t
mix
1 + log
2
(2n(n 1)),
onde o log
2
arredondado para cima (para se tornar inteiro).
Proof. Se E vale ento at o tempo t, diferentes sequncias de dgitos foram
atribudas a cada uma das n cartas. Assim, calcular a probabilidade do evento
E equivalente a resolver o seguinte probema: Suponha que, em algum planeta
do universo, o ano tem durao de 2
t
dias. Qual a probabilidade de que, em um
grupo de n habitantes desse planeta, todos tenham nascido em dias distintos do
ano, supondo que as datas de nascimento sejam uniformes e independentes?
J calculamos esta probabilidade no Exemplo 10, logo podemos escrever:
P(E) =
1
(2
t
)
k
n1
k=0
_
2
t
k + 1
_
=
n1
k=0
_
1
k
2
t
_
.
Portanto, para qualquer t inteiro,
d
vt
(Q
t
, ) 1 P(E) = 1
n1
k=0
_
1
k
2
t
_
.
Observe que
1
n1
k=0
_
1
k
2
t
_
= 1
n2
k=0
_
1
k
2
t
_
+
n 1
2
t
n2
k=0
_
1
k
2
t
_
48 CHAPTER 6. DOZE EMBARALHADAS BASTAM
e que os produtrios acima so menores ou iguais a 1. Logo
d
vt
(Q
t
, ) 1
n2
k=0
_
1
k
2
t
_
+
n 1
2
t
Como temos um termo a menos no produto, podemos iterar a nossa ideia e desco-
brir que
d
vt
(Q
t
, )
n 1
2
t
+
n 2
2
t
+
n 3
2
t
+ +
1
2
t
=
n(n 1)
2
t+1
.
Tomando t = 1 + log
2
(2n(n 1)) (arredondado para cima), vemos que a quanti-
dade do lado direito 1/4.
6.4 Porque doze embaralhadas bastam
Quando n = 52 e t = 12, obtemos a partir dos mesmos clculos acima que
d
vt
(Q
t
, ) 0, 34,
o que aproximadamente o mesmo nvel de preciso atingido por sete embaral-
hadas como mostraremos no prximo captulo (veja a Tabela ??). Por isto dizemos
que 12 embaralhadas bastam!
Chapter 7
Porque sete embaralhadas bastam, e
outros adendos
Nesta seo discutimos brevemente como a prova de Bayer e Diaconis [2] de
que sete embaralhadas bastam. Tambm falaremos da convergncia abrupta para
o equilbrio.
7.1 De doze para sete
A prova de Bayer e Diaconis parte de uma denio do que so sequncias levan-
tadoras que foram denidas na Seo 4.6.
Note que a permutao identidade tem somente uma sequncia levantadora.
Quando fazemos uma embaralhada GSR, ou mantemos as cartas no lugar, ou
criamos uma permutao que tem exatamente duas sequncias levantadoras. A
anlise que zemos no captulo 4 mostra que todas as permutaes com duas se-
quncias levantadoras so igualmente provveis. Portanto,
Depois de uma embarlahada GSR, as probabilidades de cada permu-
tao s dependem do seu nmero de sequncias levantadoras.
Um dos principais resultados intermedirios de Bayer e Diaconis [2, Teorema
3] que esta mesma situao persiste aps um nmero maior de embaralhadas.
De fato, para qualquer t > 0 inteiro, se g S
n
tem r sequncias levantadoras,
Q
t
(g) =
_
2
t
+nr
n
_
2
tn
,
onde usamos o coeciente binomial
_
u
v
_
0 se u < v ou
1
v!
v1
i=0
(u i) para u v.
49
50CHAPTER7. PORQUE SETE EMBARALHADAS BASTAM, E OUTROS ADENDOS
Esta frmula surpreendente resultado de uma discusso longa, em que so anal-
isados embaralhamentos em que se corta a pilha em a partes para um a arbitrrio
(a = 2 no modelo GSR). Alguns argumentos espertos da combinatria de permu-
taes so usados para chegar a este teorema.
A anlise acima j basta para provar que Q
t
(g) 1/n!. De fato, se 2
t
r 0
temos uma frmula explcita
_
2
t
+ n r
n
_
=
2
tn
n!
n1
i=0
_
1 +
n r i
2
tn
_
,
e no difcil mostrar que o produto converge a 1 quando t +.
Cotas para valores de t xos exigem alguns esforos adicionais. O primeiro
usar uma frmula distinta para a d
vt
:
d
vt
(Q
t
, ) =
gS
n
: Q
t
(g)>1/n!
Q
t
(g)
1
n!
.
Alm disso, precisamos de uma frmula ou estimativa para o nmero a
n,r
de
permutaes com r sequncias crescentes, que vem da rea de Combinatria das
permutaes. De posse destes dois ingredientes, podemos escrever:
d
vt
(Q
t
, ) =
1rn:
(
2
t
+nr
n
)
2
tn
>
1
n!
a
n,r
_
_
2
t
+nr
n
_
2
tn

1
n!
_
.
Esta frmula representa um progresso enorme sobre um clculo de fora bruta.
Embora S
n
tenha n! elementos (mais de 2
120
para n = 52), a soma acima tem n
termos, todos fceis de calcular. Isto torna factvel calcular os valores exatos da
distncia de variao total para n = 52 ou qualquer outro nmero razovel de
cartas.
t 1 2 3 4 5 6 7 8 9
d
vt
1.000 1.000 1.000 1.000 0.924 0.614 0.334 0.167 0.085
Table 7.1: Os valores da distncia de variao total como funo do tempo,
calculados at 3 casas decimais, para um baralho de 52 cartas. Valores maiores
de t so considerados em [2].
A tabela ?? contem os valores de d
vt
(Q
t
, ) para 1 t 9. Note que a
distncia praticamente 1 at t = 4 ou 5 e que a partir da ela basicamente
dividida por 2 em cada passo. O resultado de que sete embaralhadas bastam
baseia-se na escolha de 0.3 como o nvel de erro permitido.
7.2. CONVERGNCIA ABRUPTA PARA A DISTRIBUIO UNIFORME 51
7.2 Convergncia abrupta para a distribuio uni-
forme
Tambm possvel cotar a distncia d
vt
(Q
t
, ) para n grande. Neste caso, aparece
um fenmeno surpreendente. Imagine que denimos uma funo que nos d a dis-
tncia para equilbrio depois de andarmos x vezes o tempo de mistura.
f
n
(x) d
vt
(Q
t
, ) onde t ,x t
mix
|.
Note que esta funo depende de n. Bayer e Diaconis mostram que, quando
mandamos n para innito, vemos que f
n
(x) 1 se x < 1 e f
n
(x) 0 se x > 1;
isto , f
n
converge a uma funo-degrau. Isto chamado de efeito corte (cut off
effect em ingls) e nos diz que o esforo feito para chegar um pouquinho perto da
uniformidade no muito menor do que o necessrio para chegar extremamente
perto.
Uma constatao surpreendente que o mesmo fenmeno ocorre com outros
modelos de embaralhamento. Por exemplo:
De-cima-ao-acaso: em cada passo toma-se a carta de cima da pilha e se a
reinsere numa posio escolhida uniformemente [1].
Transposies aleatrias: Em cada passo escolhe-se 1 i, j n indepen-
dentemente e uniformemente ao acaso, fazendo depois a transposio das
cartas nas posies i e j [9].
A anlise destes e de outros exemplos requer tcnicas sosticadas de Anlise,
Teoria de Representaes e Combinatria. Algumas destas conexes acabam indo
nas duas direes. O artigo [3] indica vrias conexes entre tpicos centrais em
lgebra e a anlise de embaralhamentos.
Espera-se que muitos outros passeios aleatrios sobre estruturas nitas tenham
este mesmo efeito de corte. No entanto, a distribuio limite vai depender do
exemplo em questo. Entender esta classe de problemas requer algum estudo
sobre cadeias de Markov, que formalizam a ideia do que passear ao acaso em
um conjunto. O livro de Levin, Peres e Wilmer [15] uma excelente introduo a
esta rea.
52 Referncias
Bibliography
[1] ALDOUS, D. e DIACONIS, P. (1986). Shufing cards and stop-
ping times." The American Mathematical Monthly 93 (5), 333-348
[2] BAYER, D. e DIACONIS, P. (1992). Trailing the Dovetail Shufe
to its Lair". The Annals of Applied Probability 2 (2): 294.
[3] DIACONIS, P. (2003). Mathematical Developments from the
Analysis of Rife-Shufing". Em Groups, Combinatorics and Ge-
ometry, 73-97, World Scientic.
[4] DIACONIS, P. (2008). The Markov Chain Monte Carlo revolu-
tion". Bulletin of the American Mathematical Society 46 (2), 179-
205.
[5] DIACONIS, P. (1988). Group representations in probability and
statistics. Institute for Mathematical Statistics.
[6] DIACONIS, P. e GRAHAM, R. (2011). Magical Mathematics: The
Mathematical Ideas that Animate Great Magic Tricks. Princeton
University Press.
[7] DIACONIS, P., HOLMES, S. e MONTGOMERY, R. (2007). Dy-
namical Bias in the Coin Toss." SIAM Review, 49 (2), 211-235.
[8] DIACONIS, P. e SALOFF-COSTE, L. (1996). Logarithmic
Sobolev inequalities for nite Markov chains". The Annals of Ap-
plied Probability 6 (3), 695-750.
[9] DIACONIS, P. e SHAHSHAHANI, M. (1981) Generating a ran-
dom permutation with random transpositions". Probability Theory
and Related Fields 57 (2), 159-179.
[10] DURRETT, R. (2003). Shufing chromosomes." Journal of The-
oretical Probability 16 (3), 725-750.
53
54 BIBLIOGRAPHY
[11] FELLER, W. (1976). Introduo Teoria das Probabilidade e suas
Aplicaes. Edgard Blcher.
[12] GARCIA, A. e LECQUAIN, I. (2002). Elementos de lgebra. Pro-
jeto Euclides, IMPA-SBM, Rio de Janeiro.
[13] HOANG, V. T., MORRIS, B. e ROGAWAY, P. (2012). An Enci-
phering Scheme Based on a Card Shufe. Nos anais de Advances in
Cryptology - CRYPTO 2012, pginas 1-13. Lecture Notes in Com-
puter Science vol. 7417, Springer.
[14] KOLATA, G. (1990). In Shufing Cards, 7 Is Winning Number. Ar-
tigo do New York Times na edio de 9 de janeiro de 1990.
[15] LEVIN, D., PERES, Y. e WILMER, E. (2008). Markov Chains and
Mixing Times. American Mathematical Society.

Notas Curso Marcelo Hilario

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Notas Curso Marcelo Hilario

Uploaded by

Copyright:

Available Formats

A matemtica de embaralhar cartas

Marcelo Hilrio (UFMG) e Roberto Imbuzeiro Oliveira (IMPA)

. A ideia que isto descreve a seguinte: primeiro

You might also like