You are on page 1of 72

Monogra…a de Teoria da Informação Clássica e

Quântica

,
Current address:,
Resumo.
Sumário

Informação clássica (Salomon) v


1. Alguns elementos da teoria da informação v
2. Propriedades do funcional de Informação xi
Capítulo 1. Operações lógicas clássicas (Salomon) xix
1. Álgebra de Boole xix
2. Operações no computador clássico xx
Capítulo 2. A mecânica quântica no contexto da Física xxxiii
1. Características da Mecânica Quântica xxxiv
Capítulo 3. Cbits, Qbits e seus estados (Salomon,Thiago,Simone) xxxix
1. Operações reversíveis em Qbits xlvi
Capítulo 4. Operações lógicas (Salomon) xlix
1. As operações lógicas quânticas xlix
Capítulo 5. Apêndice A: Estrutura matemática da Mecânica Quântica lvii
1. A. Espaço vetorial linear : lvii
2. B. Produto Interno lix
3. C. O espaço de Hilbert: lxi
4. Vetores “kets” e “bra” lxv
5. Índice de estado, índice de representação e função de onda lxvi
6. Operadores lineares lxvii
7. Operadores adjunto e relações de conjugação lxix
8. Operadores Limitados lxxi
9. Operadores não limitados lxxii

iii
Informação clássica (Salomon)

1. Alguns elementos da teoria da informação


A teoria da informação ocupa-se do tratamento de mensagens: (1) sua for-
malização e quanti…cação, (2) sua codi…cação e transmissão, (3) de métodos de
criptogra…a e decifragem, e (4) geração de algoritmos e programas para operação
em mensagens e para …ns de compactação e de armazenamento e (5) da correção
de erros.
Provavelmente, a primeira fonte de armazenamento, codi…cação e processa-
mento de informação surgiu na natureza junto com os organismos vivos (objetos
que se reproduzem com a transmissão dos seus caracteres a seus descendentes 1 ),
os objetos físicos criados para o armazenamento da informação são as moléculas
gigantes chamadas DNA e RNA (as siglas provêm do inglês, deoxyribonucleic acid
e ribonucleic acid) presentes nas células dos tecidos. São estruturas lineares geral-
mente enoveladas e compactadas, e uma molécula de DNA contém seqüências de
4 tipos de moléculas menores chamadas bases ou nucleotídios, também conhecidas
como pelas siglas A, T, C, G (para adenina, timina, citosina e guanina), que se
ligam aos pares – A-T e C-G – na estrutura de dupla hélice que é a molécula de
DNA, veja a Figura 1.
Nas moléculas de DNA e RNA …ca armazenada a informação necessária que vi-
abiliza a existência e reprodução dos seres vivos, mais especi…camente estâo guarda-
dos os códigos para a a síntese de proteinas nas células. A informação está codi…cada
pelas quatro “letras” A, T, C, G. Um pedaço do DNA, não necessariamente for-
mado por uma única seqüência contínua, mas capaz de constituir uma cadeia de
milhares e até milhões de bases, chamado gene, contêm uma informação especí…ca;
aquela necessária para a produção de uma determinada proteína. Estima-se que
o DNA do Homo sapiens contenha cerca de 25 000 genes (que é o seu genoma) e
a informação necessária para produzir cerca de 100 000 diferentes tipos proteínas.
Cada proteína é constituída de uma cadeia seqüencial de moléculas fundamentais
chamadas aminoácidos (toda a Vida se utiliza não mais do que de 20 diferentes
aminoácidos), assim, um gene tem a informação necessária para que se produza
dentro na célula (nas “fábricas” chamadas ribosomos) onde ele se encontra, a se-
qüência de aminoácidos que constituirá uma determinada proteína.
Cada aminoácido é codi…cado por três das bases de um conjunto de quatro {A,
T, C , G}, essa unidade básica de informação é chamada códon; existem portanto
4 4 4 = 64 códons diferentes (o que constitui o “alfabeto”). Dentre estes, 3
têm a função de sinalizar a parada (chamados stop codons) da síntese, ou seja,
servem de aviso de término de produção da cadeia de aminoácidos que constituirá

1 Há opinião consensual entre os biólogos de que os vírus não são organismos vivos, embora
eles se reproduzem transmitindo parte de suas características e por sofrerem muitas mutações.

v
vi INFORM AÇÃO CLÁSSICA (SALOM ON)

Figura 1. Trecho de uma molécula de DNA, note-se a dupla hélice,


que sustentam as as bases A, T, C, G, que se ligam aos pares: A-T e
C-G.

uma dada proteína. Por conseguinte, existem 61 códons para a codi…cação dos 20
aminoácidos, 8
>
> A T C
>
>
>
> C G G
<
A C G
61 diferentes códons ;
>
> . . .
>
>
>
> . . .
:
. . .
veri…ca-se que diferentes códons podem codi…car um mesmo aminoácido, logo existe
uma redundância na produção dos aminoácidos.
Além da informação intrínseca (contida nos genes), a vida utiliza-se de infor-
mação em outro contexto, é a comunicação intra e inter espécies. Um organismo é
um sistema bastante complexo, para ser viável como
Seres de uma mesma espécie costumam se comunicar (intra-espécie) por uma
variedade muito maior de sinais e códigos do que a comunicação inter espécie. Ani-
mais que vivem em grupos sociais, (gol…nhos, lobos, primatas, etc...) , estabelecem
uma hierarquia de autoridade no grupo, além de transmitir aos descendentes in-
formações necessárias (ensinar) para a sobrevivência. Também existe comunicação
inter espécie, mas ela costuma ser menos diversi…cada (menos informação), pois se
resume essencialmente a avisos de ataque e defesa entre predador e presa, avisos
sobre violação de território de outra espécie, etc....
Acredita-se que as espécies mais evoluídas são aquelas que conseguem se co-
municar da forma mais diversi…cada e e…ciente. Na ponta mais extrema está o
Homem (gênero Homo, espécie sapiens) que, desde o seu surgimento na Terra, de-
senvolveu linguagem gestual, falada e sinais para transmitir informação a longa
distância (por percussão - batidas em troncos ocos de árvores e tambores – sinais
de fumaça, uso de emissários, correios). Também houve preocupação em armazenar
1. ALGUNS ELEM ENTOS DA TEORIA DA INFORM AÇÃO vii

a informação; nesta atividade, o Homem começou a se distinguir pela marcação de


sinais em pedras e rochas e na arte de desenhar nas paredes de cavernas, depois
inventou a escrita (ideogramas, hieróglifos, cunhas, alfabetos). O desenvolvimento
dessas formas de marcar mensagens junto com a preocupação com a sua perpet-
uação para a posteridade, devem tê-lo levado à necessidade de procurar soluções
para o armazenamento e portabilidade. Isso deve ter levado à necessidade de in-
ventar meios materiais su…cientemente leves para transportar mensagens (usando
a e…ciente comunicação escrita) a grandes distâncias, o que levou à invençao do
pergaminho, do papiro, do papel e da imprensa. Posteriormente, a descoberta da
possibilidade de tramsmissão de mensagens codi…cadas por por correntes elétricas
e ondas eletromagnéticas, levou à invenção do telefone, telégrafo, teletipo, radio
televisão, fac-símile, internet... .
Em uma mensagem escrita a informação não será corrompida ao chegar ao seu
destinatário, se o meio que a contiver (pergaminho, papiro, papel) não for violado
por terceira pessoa ou por acidente (a água pode diluir total ou parcialmente a
tinta usada para escrevê-la). Mas a informação transmitida por meio de ondas ou
por sinais elétrico através de cabos pode ser corrompida na fonte ou mesmo em
seu percurso até atingir o receptor, perdendo assim …delidade, devido à inevitável
presença de ruído ou interferência externos. Mas isso pode ser corrigido usando
técnicas desenvolvidas pela teoria de correção de erros. Vale mencionar que isso
também ocorre seja em sistemas biológicos, o DNA é continuamente monitorado
para veri…cação sua integridade; se for encontrado um pedaço dani…cado, ele será
substituído por um pedaço novo e …el ao original, caso contrário se o DNa for
irrecuperável surge uma ordem para a célula de auto-destruir ou “suicidar”, esse
fenômeno é conhecido como apoptose.

1.1. De…nição de Informação. Passemos agora para a quanti…cação da in-


formação e sua mensurabilidade. De acordo com Claude Shannon [1], o pioneiro da
teoria da informação, a quantidade de informação I contida em uma mensagem é
formalmente de…nida como
(1.1) I = k ln P
onde k é uma constante, P é o número de possíveis mensagens que podem ser elab-
oradas a partir de um conjunto de sinais, caracteres ou símbolos e ln é o logaritmo
na base neperiana. A quantidade I é também conhecida como funcional de infor-
mação. Como exemplo do seu signi…cado vamos considerar o seguinte exemplo:
sabemos que no Brasil, para serem identi…cados, os automóveis ganham uma placa
que contêm 3 letras e 4 algarismos; como são utilizadas as 26 letras do alfabeto
latino e a base decimal para os algarismos (0,1,2,3,4,5,6,7,8,9), o número total de
placas diferentes é portanto
P = 26 26 26 10 10 10 10 = 263 104 = 27 54 133 ;
essa última igualdade escreve esse número em fatores de potências de números
primos. Logo,
P = 175 760 000
automóveis (possível número de mensagens) poderão ser emplacados, cada um com
placa diferente, o que supera, em excesso, a frota de automóveis existente no país na
atualidade (2005), podendo atender à expansão da frota para os próximos anos, sem
ser necessário aumentar de mais um símbolo (letra ou dígito) a palavra ou código
viii INFORM AÇÃO CLÁSSICA (SALOM ON)

das placas. Cada placa codi…cada é não ambígua e pode ser considerada como
uma “mensagem”. Portanto, no sistema de codi…cação 3-letras— 4-algarismos, a
informação de mensagens é quanti…cada como (??)
I = k (7 ln 2 + 4 ln 5 + 3 ln 13) ' 18; 985 k
em unidades de k. Agora iremos ver qual é o valor que Shannon atribuiu à constante
adimensional k.
1.2. Código binário, bit e informação para símbolos equiprováveis.
Em uma aritmética binária (2 símbolos distintos apenas, representados por 0 e 1,
ou por, " e #) vamos fazer a seguinte proposição: queremos escrever uma mensagem
com n dígitos utilizando somente os símbolos 0 ou 1, considerados como elementos
equiprováveis
(1.2) 0100110010111:::110001010
| {z }
n dígitos

e cada posição da seqüência (string) acima é de…nida como um bit de informação.


Nesse caso como uma mensagem tem n dígitos, há 2n diferentes seqüências possíveis
(palavras ou símbolos diferentes). Podemos associar uma seqüência de símbolos
binários a um número escrito na base decimal, por exemplo, consideremos o número
binário 110001010, posicionalmente da direita para a esquerda cada um simboliza
o valor que multiplica 2n , com n = 0; 1; 2; indicando a ordem posicional, para o
número de nove algarismos temos
110001010 = 1 28 + 1 27 + 0 26 + 0 25
+0 24 + 1 23 + 0 22 + 1 21 + 0 20
= 256 + 128 + 8 + 2 = 394
Para uma seqüência aleatória de n dígitos binários, que podemos chamar número,
palavra ou sentença, há 2n possibilidades, assim a probabilidade para cada possi-
bilidade ser escolhida ao acaso é 1=2n e o conteúdo informativo dessa escolha foi
de…nido por Shannon como sendo
(1.3) I = k ln 2n = nk ln 2 ,
que é um número proporcional ao ln do inverso da probabilidade, e quanto maior
for esse número maior será a variabilidade de possibilidades distintas. Também
pode-se interpretar (1.3) como a informação faltante, ou seja é a falta de certeza
para uma determinada palavra, neste caso como as 2n possíveis palavras são igual-
mente prováveis, I é máxima, ou seja a ignorância é máxima. Qualquer informação
adicional acerca da palavra procurada tende a diminuir o valor de I. Se há certeza
de que em um dado conjunto de palavras a palavra procurada está presente e mais
nenhuma outra, então a probabilidade de colhê-la é 1 e neste caso I = 0.
Se a informação por dígito ou caractere for tomada como sendo unitária, ou
seja, fazendo I=n = 1 o valor da constante k é
1
(1.4) k= = log2 e
ln 2
Por substituição obtém-se
log2 P
(1.5) I = k ln P = log2 e ln P = log2 e
log2 e
e …nalmente
1. ALGUNS ELEM ENTOS DA TEORIA DA INFORM AÇÃO ix

ln P
(1.6) I= = log2 P:
ln 2

No caso das placas de automóveis, P = 27 54 133 , temos


(1.7) I ' 27; 389;
e, estritamente falando, uma mensagem na linguagem das placas conterá aproxi-
madamente 27; 389 bits de informação para uma seqüência (string) de três letras,
escolhidas de um conjunto de 26, e mais 4 algarismos da base decimal.

1.3. Generalização para N caracteres e G dígitos. A expressão (1.6)


pode ser generalizada para um sistema de N caracteres distintos e um conjunto de
G dígitos (ou posições em uma seqüência, veja a Figura 2, onde os caracteres são
representados por bolinhas de diferentes cores) a serem preenchidos,neste caso a

com bolinhas de cores


diferentes

2 :jpg

Figura 2. G caixas e N caracteres (bolinhas) diferentes. Escolhe-se


uma bolinha para ser colocada em cada caixa. Serão N N ::: N =
N G diferentes con…gurações.

informação é dada por


N é o número de diferentes caracteres
(1.8) I = log2 N G = G log2 N =) :
G é o número de diferentes posições
Como outro exemplo, vamos usar o alfabeto latino na sua versão mais simples,
ele é constituído de 27 símbolos (26 letras e um espaço em branco para separar as
palavras, portanto N = 27) e considerar uma mensagem (sentença) de G posições.
Neste caso a informação média por posição é
I
i== log2 27 ' 4; 76 bits/letra.
G
que é mais precisamente chamado de infobit, ou bit de informação, para não ser
confundido com um bit físico de armazenamento de informação, repbit. Note-se que
27 ' 24;76 , ou 24 < 27 < 25 , constatando-se que o número de infobits está entre 4
e 5, portanto, enquanto 4 repbits não são su…cientes para escrever uma mensagem
x INFORM AÇÃO CLÁSSICA (SALOM ON)

em, digamos, língua inglesa 2 , os 27 símbolos necessitarão de 5 repbits (25 ), mas


sobrarão 5 opções (25 27 = 5) para símbolos binários que …carão ociosos, a menos
que sejam utilizados para armazenamento e transmissão mais racional e econômica
das mensagens.
1.4. Informação para símbolos com diferentes probabilidades de ocor-
rência. Suponhamos que temos m caixas, na caixa 1 há N1 bolas indistinguíveis
entre si (todas de uma mesma cor), na caixa 2 são N2 bolas indistinguíveis entre
si (todas de mesma cor mas diferente da cor da caixa 1), e assim por diante para
todas as caixas. Contudo, bolas pertencentes a diferentes caixas diferem entre si
pela cor, P
ou seja, bolas pertencentes a diferentes caixas são distinguíveis. No total
m
são G = j=1 Nj bolas. Colocando todas as G bolas em linha, podem ser geradas
G! G!
(1.9) P = = Q
m ;
N1 !N2 !:::Nm !
Nj !
j=1

seqüências (strings) distingüíveis uma da outra, veja a Figura 3 duas seqüências


diferentes.A expressão naEq. (1.9) toma essa forma porque o número de possibil-

coloridas

3 :jpg

Figura 3. Duas seqüências diferentes de bolas de três caixas diferentes

idades para o en…leiramento (string) de todas as bolas é G!, sendo o número de


permutações das G bolas. Contudo, devemos dividir pelo número de permutações
N1 !N2 !::: Nm !, para levar em conta a indistingüibilidade de strings quando bolas em
uma dada seqüência, são permutadas. Por exemplo, a troca de posição da primeira
bola e da quinta (cor azul) no primeiro string da Figura 3, não leva a uma nova se-
qüência indistinguível, mas se trocarmos a primeira bola com a segunda, isto levará
a um string distinguível do original, que é a segunda seqüência na mesma …gura.
Então P é o número de combinações distintas (ou mensagens). Dessa forma, cada
uma das P mensagens terá uma informação de valor

! 0 1
m
X
Q
m
(1.10) I = k ln P = k ln G! ln Nj ! = k @ln G! ln Nj !A :
j=1 j=1

Usando a fórmula de Stirling ln Q! Q(ln Q 1) para Q >> 1, a expressão


(1.10) pode ser reescrita como

m
X m
X
Nj Nj
(1.11) I= kG ln = kG pj ln pj
j=1
G G j=1

2 Em português, o alfabeto é constituído de 36 símbolos, as 23 letras usuais (não se faz uso


das letras k, w e y) mais 13 letras acentuadas – ´ a, à, â, ã, ç, ´ e, ê, í, ó, ô, õ, ´ u, ü.
2. PROPRIEDADES DO FUNCIONAL DE INFORM AÇÃO xi

onde pj = Nj =G é a probabilidade de que, escolhida uma bola ao acaso de uma


dada seqüência, ela pertença à j-ésima caixa. E a informação por posição é dada
por

m
X
I
(1.12) i= = k pj ln pj ;
G j=1

ou melhor, a falta de informação por posição. Esta equação é considerada a equação


fundamental da teoria da informação, sua semelhança com a fórmula da entropia
da mecânica estatística é marcante, e não é simplesmente casual.
Em particular, se m = 2 (temos duas caixas apenas), cada uma contendo o
mesmo número de bolas, N1 = N2 = G=2, mas de cores distintas, teríamos

G=2 G=2 G=2 G=2


I = kG ln + ln
G G G G
(1.13) = kG ln 2

que reproduz o resultado da Eq. (1.3) para G = n, número de bit ou dígitos em


uma palavra.

2. Propriedades do funcional de Informação


PM PM
2.1. Desigualdade j=1 pj ln qj j=1 pj ln pj . Sejam fqj g ; fpj g dois
PM
conjuntos de probabilidades associadas a variáveis aleatórias X e Y com j=1
PM PM
pj = j=1 qj = 1 e vamos considerar o funcional J = j=1 pj ln qj , com as proba-
bilidades mescladas. Segue então a desigualdade
X X
(2.1) pj ln qj pj ln pj .
j j

Demonstração. Demonstração: Seja qj = pj + uj = pj (1 + uj =pj ), de


PM
forma que juj =pj j < 1 e j=1 uj = 0. Substituindo qj em J, tem-se
M
X M
X uj
J= pj ln pj + pj ln 1 +
j=1 j=1
pj

que podemos reescrever como Mas, visto que x > ln(1 + x) para qualquer valor de
x tem-se
M
X M
X M
X uj
pj ln qj = pj ln pj + pj ln 1 +
j=1 j=1 j=1
pj
M
X M
X X M
uj
6 pj ln pj + pj = pj ln pj ;
j=1 j=1
pj j=1

disso segue a expressão (2.1).


xii INFORM AÇÃO CLÁSSICA (SALOM ON)

2.2. Iguais probabilidades a priori. A informação I será máxima quando


todas as probabilidades forem iguais,
1
(2.2) pj = ;
M
com a condição de normalização
M
X
(2.3) pk = 1:
k=0

Essa é a situação que usualmente adotamos quando não há nenhum indicativo em


dar preferência a uma escolha em favor, ou em detrimento, de uma outra. A Eq.
(2.2) expressa a hipótese da escolha mais racional.

Demonstração. Demonstração: Em um ponto de extremo a primeira derivada


do funcional (1.11) deve se anular. Sendo assim
"M 1 M
!#
@I @ X X
= kG (pk ln pk ) + 1 pk =0
@pj @pj
k=1 k=1
PM
onde introduzimos a condição de vínculo 1 k=1 pk , logo
M
X
j;k [(ln pk + 1) ] = 0
k=1
(ln pj + 1) = :
.Disso conclui-se que todas as probabilidades pj são iguais veri…cando-se a Eq. (2.2)
1
pj = exp ( 1) :
M
A segunda derivada da informação I é
!
@2I 1
(2.4) = kG = kGM < 0;
@p2j pj pj =1=M
pj =1=M

veri…cando-se que para pj = 1=M a informação possui valor máximo.

2.3. Eventos simultâneos. Se existirem dois conjuntos de variáveis aleatórias


discretas X = fxk ; k = 1; 2; :::; M g e Y = fyl ; l = 1; 2; :::; N g
A probabilidade de se ter conjuntamente X = xi e Y = yj é denotada por
PM PN
Pi;j de forma que i=1 j=1 Pi;j = 1. (Note a existência de uma dependência ou
vínculo entre as variáveis):
Pode-se veri…car que o funcional informação é menor na presença de correlações
entre X e Y do que na ausência.

Demonstração. A probabilidade de se obter, como resultado de uma medição,


X = xi independentemente do valor que Y possa tomar é
N
X
(2.5) pi = Pi;j ;
j=1
2. PROPRIEDADES DO FUNCIONAL DE INFORM AÇÃO xiii

e analogamente, a probabilidade de se ter-se Y = yj independentemente de X é


M
X
(2.6) qj = p (i; j)
i=1

A informação relacionada com as escolhas de valores para X e Y é:


M X
X N
(2.7) I (X; Y ) = k Pi;j ln Pi;j
i=1 j=1

Na escolha de um valor apenas para a variável X (sem importar-se com a variável


Y ), obtém-se
M
X M X
X N
(2.8) I (X) = k pi ln pi = k Pi;j ln pi
i=1 i=1 j=1

e para um valor de Y (não importando o valor de X) a informação é


N
X N X
X M
(2.9) I(Y ) = k qj ln qj = k Pi;j ln qj
j=1 j=1 i=1

Somando as Eqs. (2.8) e (2.9) obtemos

X M
N X N X
X M
I(X) + I(Y ) = k Pi;j ln (pi qj ) k Pi;j ln Pi;j = I(X; Y );
j=1 i=1 j=1 i=1

e onde a última desigualdade decorre da primeira propriedade, portanto

(2.10) I(X) + I(Y ) > I(X; Y );

signi…cando que qualquer correlação que exista entre as variáveis de um problema


envolvendo variáveis aleatórias diminui a ignorância contida em uma mensagem.

2.4. Informação condicional. Designa-se por P (jji) a probabilidade condi-


cional, ou seja, a probabilidade, como previsão, em obter como resultado de uma
medição ou de uma observação, o valor Y = yj quando se sabe com certeza o valor
da variável X = xi . Tem-se então relação

Pi;j
(2.11) P (jji) pi = Pj;i ) P (jji) = :
pi
Analogamente,
Pi;j
(2.12) P (ijj) =
qj
é a outra probabilidade condicional, a de que X = xi sabendo-se com certeza que
Y = yj . Agora, como Pi;j = Pj;i , de (2.11) e (2.12) obtém-se

(2.13) P (jji)pi = P (ijj)qj :


xiv INFORM AÇÃO CLÁSSICA (SALOM ON)

Desse modo, a informação condicional é


M X
X N M X
X N
Pi;j
I(Y jX) = k Pi;j ln P (jji) = k Pi;j ln
i=1 j=1 i=1 j=1
pi
M X
N M
!
X X
= k Pi;j ln Pi;j k pi ln pi
i=1 j=1 i=1
= I(X; Y ) I(X)
ou
(2.14) I(X; Y ) = I(Y jX) + I(X):
Analogamente, temos
(2.15) I(X; Y ) = I(XjY ) + I(Y )
Comparando a (2.10) com as Eqs. (2.14) e (2.15), veri…ca-se que
(2.16) I(Y jX) I(Y )
e também,
(2.17) I(XjY ) I(X) ;
demonstrando, mais uma vez, que qualquer tipo de vínculo entre duas variáveis
aleatórias leva a um decréscimo do funcional informação.

2.5. Bifurcação da informação. Já vimos como Shannon de…niu uma me-


dida chamada informação I, mas que de fato mede a de falta de informação, a
ignorância ou mesmo a “desordem” em um dado sistema. Para conseguirmos gan-
har um melhor entendimento sobre a mesma vamos consideremos duas situações
como visto nos diagramas da Figura 4. Vamos começar com o diagrama (a), consid-
eremos que Beto toma um ônibus no local O que deve partir com destino para uma
certa localidade, ainda incerta: partida com destino indeterminado. O motorista
do ônibus avisa os passageiros que ainda não lhe foi informado o destino exato do
ônibus, contudo, pela história dos trajetos anteriores, o destino será uma das três
as localidades, A, B ou C e as probabilidades estimadas pelo motorista são
(a) 1 (a) 1 (a) 1
(2.18) PA = ; PB = ; PC =
2 3 6
para cada destino. Beto quer fazer uma medida de sua ignorância quanto destino
exato (assim como a do motorista e dos demais passageiros), então para isso ele usa
a de…nição de Shannon
1 1 1 1 1 1
(2.19) I (a) = log2 + log2 + log2 = 1; 459;
2 2 3 3 6 6
número que quanti…ca a ignorância do destino, até o momento em que o motorista
anunciará o destino exato da viagem (localidades A, B ou C), quando então a
ignorância será nula, assim como a função I (a) . Poderímos pensar esta mesma
situação inversamente, Beto está em uma das três localidades, A, B ou C, digamos
A, e ele toma o ônibus para ir até O. Alice está no local O e espera a chegada de
Beto, mas ela não sabe exatamente de qual das três localidades ele está vindo, assim
para Alice quanti…car sua ignorância ela atribui para cada localidade a probablidade
2. PROPRIEDADES DO FUNCIONAL DE INFORM AÇÃO xv

1=3 (iguais probabilidades pois não pode privilegiar nenhuma localidade) e usa a
fórmula de Shannon

1 1
(2.20) Io = 3 log2 = log2 3 = 1; 585
3 3

Problem 1. Por que o valor obtido em (2.20) é maior do que aquele obtido
em (2.19)?

Esta situação encontra uma realização em física nuclear nas séries radioativas,
um radionuclídeo O pode decair por emissão para o nuclídeo A, emissão + para
o nuclídeo B ou por emissão para o nuclídeo C, com diferentes probabilidades
.
Agora vamos considerar a situação quando a incerteza em um dado processo
está sujeito a bifurcações e como o funcional I se expressa neste caso. Como
exemplo vamos considerar o caso da Figura 4-(b), onde vemos que na linha que
leva a OC ocorre uma bifurcação em A0 , ou seja há uma possibilidade de desvio
para o trecho A0 B. De volta ao exemplo do personagem Beto, a incerteza sobre
o seu destino é fragmentado, inicialmente há uma incerteza quanto à partida, as
probabilidades de partir de O e chegar a à localidade A ou à localidade A0 são 50%
a 50%. Chegando a A0 , Beto é obrigado a fazer uma "baldeação"e de novo o seu
destino está incerto, tomando o segundo ônibus, há uma probabilidade 2=3 de chegar
à localidade B e 1=3 de chance de chegar a C. Como …ca a medida da ignorância
do seu destino, ou o funcional I? Em princípio, o valor de I deve ser o mesmao
que aquele em (2.19), uma vez que os destinos não foram mudados e tampouco as
probablidades. Entretanto vamos mostrar que podemos aprender um pouco mais
sobre I olhando com mais cuidado o que ocorre em uma bifurcação; iremos veri…car
que se uma escolha é dividida em duas escolhas com bifurcação, então a informação
total I pode ser considerada como a soma ponderada das informações parciais:
Vamos ilustrar essa propriedade com o exemplo mencionado.
Embora a escolha dos caminhos OB ou OC na Figura 4-(b) não é direta, a probabil-
idade de seguir pelos caminhos OA, OB ou OC permanece a mesma, reescrevemos
(2.18) como

(b) 1 (b) 1 2 1 (b) 1 1 1


PA = ; PB = = ; PC = =
2 2 3 3 2 3 6

Isto também encontra um realização física nas séries radioativas. Para o caso (a)
o cálculo da informação I (a) é direto como em (2.19), enquanto que para o caso
(b) haverá soma de dois termos; I (b1) associado com os caminhos OA e OA0 e I (b2)
associado aos caminhos A0 C e A0 C. Assim, temos:

1 1 1 1
(2.21) I (b1) = log2 + log2
2 2 2 2
2 2 1 1
(2.22) I (b2) = log2 + log2
3 3 3 3
xvi INFORM AÇÃO CLÁSSICA (SALOM ON)

4 :jpg

Figura 4. (a) Escolha direta: partida do local O com destino para


locais A, B e C , com probabilidades 1=2, 1=3 e 1=6 respectivamente;
(b) escolha com bifurcação ou de duas etapas, saída de O com destinos
A e A0, com probabilidades 1=2 e 1=2; a seguir, saída de A0 com destino
para os locais B e C com probabilidades 2=3 e 1=3.

mas podemos reescrever a expressão (1.11) como detalhado abaixo


1 1 1 1 1 1
I (a) = k log2 + log2 + log2
2 2 3 3 6 6
1 1 2 1 2 1 1 1 1 1
= k log2 + : log2 : + : log2 :
2 2 3 2 3 2 2 3 2 3
1 1 1 1 1 1 1 2 2 1 1
= k log2 + log2 + log2 + log2 + log2 ;
2 2 3 2 6 2 2 3 3 3 3
Assim usando as Eqs.(2.21) e (2.22) obtemosa aquivalência
1
(2.23) I (a) = I (b1) + I (b2)
2

e veri…camos que o peso associado à informação I (b1) é 1 enquanto que para I (b2) o
peso é 1=2, a bifurcação leva à soma de dois funcionais. Entretanto, o formalismo
não é exclusivo a bifurcações mas aplica-se também a rami…cações mais complexas,
ou seja do ponto A0 poderiam sair mais de dois caminhos, e cada um poderia
também se abrir em mais rami…cações. Podemos generalizar isso escrevendo para
informação global
XN
(1)
I=I + p~k I (k) ;
k=2
onde N é o número de vértices (tipo A0 ), p~k é a probabilidade associada a uma
linha anterior a um vértice (excetuando-se o primeiro vértice que tem peso 1) e I (k)
são os funcionais informação calculados de um vértice aos vértices seguintes (veja
Figura (2.5)).
2. PROPRIEDADES DO FUNCIONAL DE INFORM AÇÃO xvii
CAPíTULO 1

Operações lógicas clássicas (Salomon)

1. Álgebra de Boole
George Boole, matenático ingles (1815-1864).
Considera-se um conjunto R de elementos e duas operaçoes binárias distintas
que são escritas simbolicamente como + e , e ambas podem ser intercambiadas.
As propriedades da álgebra de boole
B1: Assocciatividade: a + (b + c) = (a + b) + c e a (b c) = (a b) c;
B2: Comutatividade: a + b = b + a e a b = b a
B3: Operação mista: a (b + c) = a b + a c e a + (b c) = (a + b) (a + c)
B4: Existência dos elementos 0 e 1:
a+0 = 0+a=a e a 1=1 a=a
a+a = 1 e a a=0
onde a é o complemento de a, que pode ser considerada como uma operação unária.
Boole escreveu sua álgebra tendo em vista a teoria de conjuntos onde os elementos de
um conjunto seriam subconjuntos, associando + ! [ (união) e ! \ (intersecção):
Consideremos os subconjuntos A, B, C,...de um conjunto S, fA; B; C; :::g S. Não
é difícil se convencer que
B1: A [ (B [ C) = (A [ B) [ C e que A \ (B \ C) = (A \ B) \ C
B2: A [ B = B [ A e A \ B = B \ A
B3: A \ (B [ C) = (A \ B) [ (A \ C) e A [ (B \ C) = (A [ B) \ (A [ C)
B4: Existem os dois conjunto ; (conjunto vazio) e S; tal que
A [ ; = ; [ A = A; e A\S =S\A=S
A [ Ac = S; e A \ Ac = ;.
No caso do conjunto Z2 = f0; 1g, vamos considerar as operaçoes: de "soma"OR = ^
e o "produto"AND = _ :
B1: a ^ (b ^ c) = (a ^ b) ^ c e a _ (b _ c) = (a _ b) _ c
B2: a ^ b = b ^ a e a _ b = b _ a
B3: a _ (b ^ c) = (a _ b) ^ (a _ c) e a ^ (b _ c) = (a ^ b) _ (a ^ c)
B4: Os próprios elementos de Z2
a^0 = 0^a=a e a_1=1_a=a
a^a = 1 e a_a=0
onde a operação complementar a = 1 a é uma operação unária.
B5: Adicionalmente têm as condições de idempotência para as duas operações
a^a = a
a_a = a
xix
Edited by Foxit PDF Editor
Copyright (c) by Foxit Software Company, 2004
For Evaluation Only.

xx 1. OPERAÇÕES LÓGICAS CLÁSSICAS (SALOM ON)

Problem 2. Veri…que as regras B1-B5 para as operações a _ b ! a ab + b e


a ^ b ! ab, com a; b; c; 2 Z2 .

Problem 3. Veri…que as leis de Morgan

a_b = a ^ b;
a^b = a _ b:

2. Operações no computador clássico


Todo computador manipula dados que são introduzidos na forma de correntes
elétricas em um circuito, em seguida eles são transformados de acordo com uma
seqüência …nita de procedimentos especí…cos chamados algoritmos, constituídos de
blocos mais elementares chamados instruções, que …sicamente são constituídos de
certas operações chamadas portas lógicas, cujo signi…cado será visto logo adiante.
Depois de terminadas todas as operações programadas, de acordo com um proced-
imento pré-estabelecido, os resultados são apresentados em forma …nal e todos os
resultados intermediários guardados em registros são substituídos ou são descarta-
dos para dar lugar a novas operações. A forma mais conveniente para manipular a
informação consiste em escrever os dados em um código bináro, que faz uso de dois
símbolos elementares, a variável dicotômica que pode tomar dois valores apenas é
chamada bit (binary digit), um bit pode ser caracterizado por sim ou não, 1 ou 0,
" ou #, etc. A aritmética envolvida é chamada aritmética binária ou booleana. A
unidade bit de informação transmitida é chamado infobit, assim toda mensagem tem
associada a quantidade de informação I, medida em unidades de infobits, e também
pode-se associar o número de infobits por palavra ou string, que pode vir a ter um
valor fracionário. O infobit tem signi…cado diverso do bit para armazenamento de
dados, o repsbit ou também o bit físico, que só pode tomar valores inteiros. Não
há sentido em falar em I fracionário pois as unidades de armazenamento de dados
(memórias RAM, CD’s, discos rígidos, etc.) funcionam com relês microscópicos que
podem tomar posição “ligado” (1) ou “desligado‘” (0). Uma seqüência básica (8,
16 ou 32) de bits forma um byte, não há byte com um número fracionário de bits.
Todo computador deve satisfazer os seguintes requerimentos:
1. Receber e armazenar a informação na forma de uma seqüência de algarismos
1 e 0, os repsbits (que vamos chamar simplesmente de bits).
2. Transformar os bits de acordos com certas seqüências de operações lógicas.
3. O número de operações lógicas deve ser …nito.
4. Deve contar com um método para checar as operações, detectar erros e
eventualmente corrigí-los antes de fornecer resultados intermediários ou …nais.
Uma operação lógica básica é também chamada porta lógica (do inglês, logic
gate), palavra que provém da engenharia de circuitos elétricos. A seguir vamos
apresentar as portas lógicas comumente usadas.
2.0.1. Porta ou operação (lógica) NOT: bits e Cbits (ou Mbits). O desenvolvi-
mento formal para as operações lógicas que faremos a seguir é válido tanto para
a manipulação de Cbits ou Mbits (bits clássicos, bits em representação matricial)
quanto de Qbits (bits quânticos), que veremos a seguir.
Operação NOT: Seja x um bit de entrada de um sinal que pode ser 0 ou 1,
a operação lógica NOT atua de forma a inverter o bit de entrada, tornando-o o bit
Edited by Foxit PDF Editor
Copyright (c) by Foxit Software Company, 2004
For Evaluation Only.

2. OPERAÇÕES NO COM PUTADOR CLÁSSICO xxi

Figura 1. Esquema da operação NOT, como a transformação de um


único bit.

de saída, x ! y, de acordo com o esquema abaixo

1 !0
(2.1) x ! y =) fx; yg 2 Z2 ; Z2 = f0; 1g :
0 !1

A operação NOT é unária, ou seja, um único bit de entrada esté envolvido. For-
malmente, esta operação pode ser representada pela álbegra modular em Z2 :
1 1 = 0 0 = 0 e 0 1 = 1 = 1 , onde a b tem o signi…cado “resto
da divisão de a + b por 2”. Uma outra notação é

(2.2) NOT : y = x 1:

Também podemos escrever todas as operações em Z2 na forma de funções; para a


porta NOT y = fnot (x), com fnot (x) = 1 x, fnot 2 Z2 , ver a Figura 1.Uma outra
formulação consiste no uso do cálculo matricial, associando os algarismos 0 e 1 a
vetores, por exemplo,

0 1
(2.3) 0! e 1!
1 0

respectivamente. Assim a operação NOT escreve-se na forma de uma matriz


quadrada de dimensão 2,

0 1
(2.4) NOT =)X =
1 0

o que pode ser facilmente veri…cado

0 1 0 1 0 1 1 0
(2.5) = e = :
1 0 1 0 1 0 0 1

2.0.2. Negação. Outro símbolo bastante útil é o de negação: Para x 2 Z2 , a


negação de x se é de…nido como x 1 x, com x 2 Z2 também, com propriedades
de soma e multiplicação com x,

(2.6) x + x = 1;
(2.7) xx = 0:

ele permite veri…car algumas relações de simetria, veja a Figura 2.0.2.A negação
pode atuar sobre uma função de várias variáveis, f (x1 ; x2 ; ) = 1 f (x1 ; x2 ; ),
desde que f (x1 ; x2 ; ) 2 Z2 .
xxii 1. OPERAÇÕES LÓGICAS CLÁSSICAS (SALOM ON)

clássicas 01

7 :jpg

2.0.3. Portas lógicas, função de 2 variáveis: x1 , x1 , x2 e x2 . Usando as var-


iáveis x1 , x1 , x2 e x2 como dados de entrada, as possíveis portas de saída são dadas
por somas da forma
y = x1 + x2 + x1 + x2 + x1 x2 + x1 x2 + x1 x2 + #x1 x2 +
e os coe…cientes ; ; ; ; ; ; ; #; são escolhidos de forma que y 2 Z2 .
2.0.4. Porta OR (não invertível). A operação OR é uma operação binária, ela
usa dois bits de entrada, um é de controle e o outro é o alvo, que é aquele que sofre
uma mudança. Ela atua de forma que se os dois bits de entrada forem (0; 0), o bit
de saída será 0, e em qualquer outra situação para os bits de entrada, o bit de saída
tomará o valor 1. Neste caso (x1 ; x2 ) ! y com fx1 ; x2 ; yg 2 Z2 , isso é descrito no
esquema abaixo,
0 1
(0; 0) ! 0
B (0; 1) ! 1 C
(2.8) B C
@ (1; 0) ! 1 A ;
(1; 1) ! 1
funcionalmente a operação pode ser representada por
(2.9) y = x1 x1 x2 + x2
que também podemos escrever em formas alternativas
(2.10) (x1 ; x2 ) ! y = x1 + x2 x1
(2.11) = x2 + x1 x2 .
A operação OR não é invertível pois de (2.8), constatamos que y = 1 pode provir
de três possíveis pares de valores (x1 ; x2 ).
2. OPERAÇÕES NO COM PUTADOR CLÁSSICO xxiii

clássicas
02

8 :jpg

2.0.5. Porta AND (não invertível). A operação AND é também binária pois
envolve dois bits de entrada e um de saída: o primeiro bit é de controle, o bit de
saída toma o valor 1 se e somente se ambos os bits de entrada tiverem valor 1,
segundo o esquema (x1 ; x2 ) ! y com fx1 ; x2 ; yg 2 Z2 , o que é descrito como
0 1
(0; 0) ! 0
B (0; 1) ! 0 C
(2.12) B C
@ (1; 0) ! 0 A
(1; 1) ! 1

funcionalmente tem-se

(2.13) y2 = x1 x2 ;

A operação AND também não é invertível pois de (2.12) constatamos que y = 0


pode provir de três possíveis pares de valores (x1 ; x2 ).
Na Figura 2.0.5 estão apresentadas as portas fundamentais clássicas NOT, AND
e OR
Assim, na lógica clássica não há preocupação em usar portas reversíveis ou
não. O calor dissipado por operação é devido à irreversibilidade do das operações
efetuadas.
2.0.6. Portas de negação NOR e NAND (não invertíveis). A partir das portas
lógicas NOT, OR e AND podemos construir as portas de negação NOR e NAND.
Na porta NOR se os dois bits de entrada forem (0; 0), o bit de saída será 1, e em
qualquer outra situação para os bits de entrada, o bit de saída tomará o valor 0.
xxiv 1. OPERAÇÕES LÓGICAS CLÁSSICAS (SALOM ON)

Aqui também (x1 ; x2 ) ! y com fx1 ; x2 ; yg 2 Z2 , isso é descrito no esquema abaixo,


0 1
(0; 0) ! 1
B (0; 1) ! 0 C
(2.14) B C
@ (1; 0) ! 0 A :
(1; 1) ! 0

Funcionalmente a operação pode ser representada como

(2.15) (x1 ; x2 ) ! y = x1 x2 .

Tampouco a operação NOR é invertível pois constatamos que y = 0 pode provir de


três possíveis diferentes pares de valores (x1 ; x2 ).
A operação NAND também envolve dois bits de entrada e um na saída, o
primeiro bit é de controle, e o bit de saída toma o valor 1 se e somente se os
dois bits de entrada tomarem o valor 1, segundo o esquema (x1 ; x2 ) ! y com
fx1 ; x2 ; yg 2 Z2 , o que é descrito por
0 1
(0; 0) ! 1
B (0; 1) ! 1 C
(2.16) B C
@ (1; 0) ! 1 A ;
(1; 1) ! 0

e funcionalmente isso é representado por

(2.17) (x1 ; x2 ) ! y = x1 + x1 x2 ;

que também não é um,a operação invertível pois constatamos que y = 1 pode
provir de três possíveis diferentes pares de valores (x1 ; x2 ).
As portas NOR e NAND podem ser construídas a partir das portas fundamen-
tais NOT, OR e AND, conforme pode ser visto nas Figuras (2.0.6) e (2.0.6):
2.0.7. Portas DEL e ON. As portas DEL e ON são portas lógicas que “apagam”
o conteúdo de um registro, no primeiro caso, para qualquer valor do bit de entrada
x1 , o bit de saída é 0, e no segundo caso o bit de saída é sempre 1. Como nos out-
ros casos estas portas podem ser construídas a partir das três portas fundamentais,
NOT, OR e AND, isto pode ser visto nos circuitos da Figura 2.0.7
2.0.8. Portas lógicas XOR e XNOR. A porta XOR é binária, são dois bits de
entrada e um de saída, (x1 ; x2 ) ! y = f (x1 ; x2 ), com a tabela verdade
0 1
(0; 0) ! 0
B (0; 1) ! 0 C
(2.18) B C
@ (1; 0) ! 1 A ;
(1; 1) ! 1

formalmente, isto se escreve

y1 = x1 x2 = x1 2x1 x2 + x2
(2.19) = x1 x2 + x1 x2 ;

portanto XOR não é uma operação reversível, os valores y1 = 0 ou y1 = 1 são


ambíguos quanto ao par (x1 ; x2 ) que os originou. Esta porta também pode ser
construída a partir das portas fundamentais conforme visto na Figura 2.0.8
2. OPERAÇÕES NO COM PUTADOR CLÁSSICO xxv

clássicas
03

9 :jpg

clássicas
04

1 0:jpg
xxvi 1. OPERAÇÕES LÓGICAS CLÁSSICAS (SALOM ON)

clássicas
05

1 1:jpg

clássicas
06

1 2:jpg
2. OPERAÇÕES NO COM PUTADOR CLÁSSICO xxvii

clássicas
07

1 3:jpg

A porta XNOR é a negação da XOR, são dois bits de entrada e um de saída,


(x1 ; x2 ) ! y2 = f (x1 ; x2 ) e sua tabela verdade é
0 1
(0; 0) ! 1
B (0; 1) ! 1 C
(2.20) B C
@ (1; 0) ! 0 A ;
(1; 1) ! 0

escrevendo-se
y2 = y1 = x1 x2 x1 x2 :

Também a porta XNOR pode ser escrita em termos das portas fundamentais con-
forme visto na Figura 2.0.8.

2.1. Circuitos clássicos.


2.1.1. Soma de bits. As portas lógicas não são apenas formas de manipular
diagramas, mas tem uma utilidade prática para montar circuitos que efetuem op-
erações aritméticas. Desenha-se o circuitos com as devidas portas de acordo com a
…nalidade escolhida e depois monta-se o circuito com os componentes eletrônicos.
2.1.2. Porta de To¤ oli. A porta de To¤oli envolve três bits de entrada e um de
saída, x1 , x2 e x3 , sendo x1 e x2 os bits de controle e x3 ! y3 é o bit alvo,

(2.21) (x1 ; x2 ; x3 ) ! y3 ;
xxviii 1. OPERAÇÕES LÓGICAS CLÁSSICAS (SALOM ON)

clássicas
08

1 4:jpg

clássicas
09

1 5:jpg
2. OPERAÇÕES NO COM PUTADOR CLÁSSICO xxix

clássicas
10

1 6:jpg

clássicas
11

1 7:jpg
xxx 1. OPERAÇÕES LÓGICAS CLÁSSICAS (SALOM ON)

sua tabela verdade é


x1 x2 x3 x1 x2 y3
0 0 0 0 0
0 0 1 0 1
0 1 0 0 0
(2.22) 0 1 1 0 1
1 0 0 0 0
1 0 1 0 1
1 1 0 1 1
1 1 1 1 0

cuja forma funcional escreve-se

y3 = (x1 x2 ) x3 = (x1 x2 ) 2 (x1 x2 ) x3 + x3


= (x1 x2 ) (x1 x2 ) x3 (x1 x2 ) x3 + x3
= x3 x1 x2 + x1 x2 x3 :

nota-se que a porta To¤oli é uma seqüência de duas operações: AND e XOR,
y2 = x1 x2 , que resulta da operação AND, é o bit de controle enquanto que o bit
alvo é obtido usando a porta XOR, fazendo a substituição x1 ! x1 x2 e x2 ! x3
na Eq. (2.19).
A porta To¤oli não é invertível pois em

(2.23) x1 x2 = y2 ;

se y2 = 1, necessariamente x1 = x2 = 1, mas se y2 = 0, isto pode ser devido a três


situações distintas e indistinguíveis, (x1 ; x2 ) = (0; 0) ; (0; 1) ; (1; 0).
2.1.3. Porta de Fredkin. Assim como a porta de To¤oli, a porta de Fredkin
envolve três bits de entrada, x1 , x2 e x3 , onde agora x3 é o bit de controle e o par
x1 , x2 são os bits alvo, (x1 x2 ) ! (y1 ; y2 )

(x1 ; x2 ; x3 ) ! (y1 ; y2 ) ;

a “tabela verdade” é
x1 x2 x3 y3 y2 y1
0 0 0 0 0 0
0 1 0 0 1 0
1 0 0 0 0 1
(2.24) 1 1 0 0 1 1
0 0 1 1 0 0
0 1 1 1 0 1
1 0 1 1 1 0
1 1 1 1 1 1

possuindo o seguinte signi…cado: se x3 = 0, então y1 = x1 e y2 = x2 , mas se x3 = 1,


então y1 = x2 e y2 = x1 . Funcionamente podemos escrever

(2.25) y1 = x1 x1 x3 + x2 x3 = x1 x3 + x2 x3 ;
(2.26) y2 = x2 x2 x3 + x1 x3 = x2 x3 + x1 x3 :
Edited by Foxit PDF Editor
Copyright (c) by Foxit Software Company, 2004
For Evaluation Only.

2. OPERAÇÕES NO COM PUTADOR CLÁSSICO xxxi

Veri…ca-se: (a) que y2 difere de y1 na troca x1 por x2 , (b) que a porta é


totalmente reversível e simétrica pela troca dos índices 1 e 2.
y1 (1 x3 ) + y2 y3
(2.27) x1 = y1 y1 x3 + y2 x3
2x3 1
e
y2 (1 x3 ) + y1 y3
(2.28) x2 = y2 y2 x3 + y1 x3 :
2x3 1
onde, de novo, os sinais de equivalência funcional valem apenas porque y1 , y2 , y3
2 Z2 .
2.2. Resumo. Em resumo, temos
Porta y2 = f (x1 ; x2 ; :::xN 1 ) invertível
NOT 1 x=x sim
OR x1 x1 x2 + x2 = x1 x2 + x1 x2 não
AND x1 x2 não
NOR x1 x2 não
NAND x1 + x1 x2 não
DEL x1 x1 = 0 não
ON x1 + x1 = 1 não
XOR x1 2x1 x2 + x2 não
XNOR x1 x2 x1 x2 não
y3 = x1 x2 2x1 x2 x3 + x3
TOFFOLI parcialmente
8 = x3 x1 x2 + x1 x2 x3
>
> y1 = x1 x1 x3 + x2 x3
<
= x1 x3 + x2 x3 sim
FREDKIN
>
> y 2 = x2 x 2 x 3 + x1 x3
:
= x2 x3 + x1 x3 sim
CAPíTULO 2

A mecânica quântica no contexto da Física

A invenção da mecânica quântica (MQ) iniciou-se em 1925 e pode-se dizer que


antes de 1930 sua construção estava praticamente terminada quando sua estrutura
lógica e formal …cou completa. Ela recebeu imediata aceitação como novo para-
digma pela maioria dos físicos, e com assaz entusiasmo dos mais jovens. O processo
inventivo MQ se originou em uma crise na física que perdurava por, pelo menos, 25
anos, visto que o aparelho conceitual da física do …nal do século XIX não conseguia
explicar as descobertas de novos fenômenos que não se encaixavam na epistemolo-
gia do velho paradigma, como por exemplo, as raias espectrais na emissão radiativa
dos átomos e o por que da estabilidade do átomo na conceituação de uma estrutura
planetária, como conjecturado a partir das experiências de Ernest Rutherford. Niels
Bohr propôs um modelo teórico provisório (aperfeiçoado por Arnold Sommerfeld)
para explicar a estrutura atômica, este modelo (sabidamente provisório) perdurou
por cerca de dez anos, quando foi então desbancado pelo novo paradigma. Nos
dizeres de Anthony J. Leggett , físico laureado com o prêmio Nobel de Física de
2003: a Mecânica Quântica é muito mais do que apenas uma teoria; é uma forma
totalmente nova de olhar para o mundo, envolvendo uma mudança no paradigma,
talvez mais radical que qualquer outro na história do pensamento humano.
As palavras de Leggett encontram respaldo nas idéias do pesquisador da história
das ciências Thomas Kuhn, que a…rma [?], que contrariamente à crença popular,
uma ciência não se desenvolve e se estabelece apenas pela simples acumulação de
descobertas e de dados em determinada área do conhecimento, mas ela se cristaliza
quando uma comunidade de cientistas desenvolve e partilha um conjunto uni…cado
de conceitos, hipóteses e métodos, que ele chamou paradigma. Estabelecido o para-
digma do momento, os pesquisadores, via de regra, irão trabalhar para, tipicamente,
“ajustar a natureza”ao mesmo. O treinamento em ciência consiste na socialização
em um paradigma, um candidato a cientista será treinado a enxergar, entender e
sondar a natureza através das lentes do último paradigma. Também de acordo com
Kuhn, uma revolução cientí…ca surgirá quando um conjunto de informações, dados
e conclusões decorrentes da pesquisa não puderem ser encaixados no paradigma
existente, e por isso serão chamados anomalias. Um novo paradigma se estabelece
quando, com seu uso, se conseguir ajustar os dados existentes e quando, depois de
se convencerem das di…culdades do velho, um número apreciável de cientistas da
comunidade o aceitar. Então uma revolução cientí…ca poderá estar surgindo.
Via de regra, a maioria dos cientistas tende a ser conservadora, eles continuarão
apegados ao velho paradigma, mesmo sendo ele insustentável diante das evidên-
cias experimentais e lógicas, mas, aos poucos, ele acabará sendo descartado mais
em decorrência da morte dos seus adeptos do que pela acumulação de anomalias.
Embora muitos paradigmas nas ciências sejam incorretos na descrição de alguns
fenômenos, mas, por falta de outras opções, eles serão mantidos até que conceitos e

xxxiii
xxxiv 2. A M ECÂNICA QUÂNTICA NO CONTEXTO DA FíSICA

métodos mais aceitáveis venham a substituí-los. A esse respeito Kuhn argumenta


que, embora necessários, ocasionalmente, eles poderão se constituir em obstáculos
para o conhecimento da natureza.
Nesse sentido, Albert Einstein, ícone da física do século XX, mesmo não encon-
trando qualquer falha ou erro na estrutura formal ou lógica da MQ, acreditava que
se tratava de uma teoria provisória e que, em algum momento, ela seria substituída
por outra mais abrangente1 . Ele via a MQ como uma teoria incompleta que deixava
muitos questionamentos em aberto quanto à interpretação das predições resultantes
no trato dos fenômenos físicos. Embora a MQ continue resistindo obstinadamente
a todos os experimentos empreendidos, com a …nalidade de falseá–la em suas pre-
visões sobre o comportamento da natureza, o embate interpretativo perdura até
nossos dias.
Sem dúvida, a MQ se constituiu em um novo paradigma (ao substituir os
métodos da “velha física”: mecânica e eletrodinâmica clássicas) propiciando uma
nova visão e um entendimendo mais profundo e detalhado dos fenômenos físicos e
químicos, essencialmente a níveis molecular, atômico e subatômico; mostrando-se
valiosa também em certos fenômenos macroscópicos, cuja características quânticas
se manifestam a baixíssimas temperaturas, a exemplo da super‡uidez e da super-
condutividade.
A revolução causada pelo surgimento da MQ como novo saber cientí…co e o seu
uso no desenvolvimento de novas tecnologias, especialmente a partir da segunda
metade do século XX, criou um plano de clivagem entre o pensamento tradicional
da Física (incluindo-se aí a teoria da relatividade) e um novo pensamento; sua in-
terpretação e aceitação exigem um despojamento de conceitos tradicionais como
partícula, trajetória, localização, etc....e a assimilação de novos como amplitude de
probabilidade, não-localidade, superposição e emaranhamento de estados, insepa-
rabilidade, indistinguibilidade de partículas, decoerência e outros mais.

1. Características da Mecânica Quântica


Embora tivesse inovado com novos elementos conceituais, a MQ conservou
muitos da velha mecânica clássica (MC), e também manteve a ortodoxia das leis
de conservação, que foram aumentadas com a introdução de novas quantidades
conservadas como paridade, spin e outras relacionadas às partículas elementares.
Vamos rever os principais elementos na mecânica clássica, para em seguida indicar
os elementos inovadores da MQ.
1.1. Mecânica Clássica. O movimento de um objeto pontual de massa m
(partícula) é caracterizado pela sua posição q e pelo seu momentum linear p (por
simplicidade vamos considerar o movimento unidimensional), cuja equações funda-
mentais são
dq p
(1.1) =
dt m
1 De acordo com suas palavras “Quantum mechanics is a very worthy topic of study, but an
inner voice tells me this is not the true Jacob. The theory yields much, but it hardly brings us
closer to the secrets of the Old one [God]. In any case, I am convinced He does not play dice.” que
poderia ter a seguinte tradução livre, “a Mecânica Quântica é um tópico que merece ser estudado,
contudo uma voz interior me diz que não é o ‘verdadeiro messias’. A teoria explica muita coisa,
mas di…cilmente nos aproxima dos segredos do Velho [Deus]. De qualquer forma, estou convencido
de que Ele não joga dados.”
1. CARACTERíSTICAS DA M ECÂNICA QUÂNTICA xxxv

dp
(1.2) = F (q; t);
dt
onde F (q; t) é a força sentida pela partícula durante o seu movimento, que pode
ter uma dependência explícita no tempo. Assim de…ne-se o espaço de fase pelo par
de coordenadas (q(q0 ; p0 ; t); p(q0 ; p0 ; t)), onde q0 ; p0 são os valores no tempo inicial
t0 . Cada ponto no espaço de fase caracteriza um estado da partícula. Qualquer
outra quantidade física será função de q(q0 ; p0 ; t) e p(q0 ; p0 ; t). Geometricamente,
uma trajetória no espaço de fase (estados da partícula em cada instante de tempo)
é vista como uma seqüência densa do par de pontos (q(q0 ; p0 ; t); p(q0 ; p0 ; t)), ver a
Figura 1.

de fase

1 8:jpg

Figura 1. Trajetória de uma partícula no espaço de fase, as setas


indicam o sentido da evolução temporal.

1.2. Mecânica Quântica. Embora os conceitos de posição e momentum lin-


ear continuam presentes na MQ, a noção de trajetória torna-se enevoado, deixando
de existir como um conceito exato e preciso. Apenas sob condições bastante es-
pecí…cas (partículas com altas energias) uma trajetória pode ser identi…cada. Mas
no caso de se lançar “partículas”sequencialmente, uma após a outra, sobre um an-
teparo com duas fendas próximas, a …gura de interferência formada sobre uma tela
situada do outro lado da fenda, só pode ser explicada com a hipótese que o caráter
ondulatório da “partícula” tenha se manifestado, uma evidência de que o conceito
de trajetória …ca comprometido nesta situação física , pois uma onda não passa por
uma ou por outra fenda, mas pelas duas simultaneamente (ver Figuras 2 e 3).No
átomo os elétrons não são partículas que descrevem órbitas keplerianas em torno
do núcleo, por conseguinte torna-se mais correto falar-se em “nuvem eletrônica”,
pois o elétron perde sua característica de partícula, no sentido clássico, ganhando
uma descrição em termos de funções de onda. Na descrição quântica do movi-
mento livre de uma partícula, embora a posição e o momentum linear possam ser
medidos, eles não podem ter realidade simultânea, ou seja, posição e momentum
não podem ser medidos simultaneamente com precisão arbitrária. Este fato é de
caráter intrínseco à própria natureza, ou pelo menos, como ela se apresenta quando
xxxvi 2. A M ECÂNICA QUÂNTICA NO CONTEXTO DA FíSICA

efetuamos medições. Formalmente, esta característica, embutida no arcabouço da


MQ, se descreve através da propriedade de não-comutatividade de objetos chama-
dos operadores, os operadores são objetos matemáticos que irão representar, no
caso discutido, a posição e o momentum linear, quantidades físicas classi…cadas
na categoria de observáveis. Veja o Apêndice A. Em resumo, a MQ usa uma es-
trututura matemática diversa daquela oriunda da mecânica clássica, apoiando-se,
essencialmente, nos seguintes conceitos:
1. O espaço de vetores que substitui o espaço de fase da MC, um elemento desse
espaço é um vetor j i que representa o estado de uma partícula (o equivalente a
um ponto no espaço de fase). Um vetor, associado a uma representação espacial,
por exemplo, é escrito como uma função (~r) (geralmente complexa) chamada am-
plitude de probabilidade, onde o vetor ~r especi…ca a posição da partícula em algum
2
referencial escolhido por um observador. Seu módulo ao quadrado, j (~r)j ; é in-
terpretado como uma densidade de probabilidade (descoberta feita por Max Born),
ou um elemento de probabilidade P por unidade de volume V . Interpreta-se a
2
quantidade j (~r)j V como sendo a probabilidade em encontrar a partícula em
um pequeno volume (in…nitesimal) V , cujo centro é o vetor ~r.
2. Os observáveis de um nsistema (propriedades
o passíveis de medição) são
^ ^ ^
representados por operadores A; B; C; ::: que atuam no espaço de vetores –
A^ j i = j i – e podem não comutar entre si (não possuir realidade simultânea),
A^B^j i=6 B^ A^ j i.
3. Assim, como existem equações de movimento na MC, na MQ as equações
de movimento descrevem a evolução de um vetor j (t)i

^ (t; t0 ) j (t0 )i ;
j (t; t0 )i = U

- onda e particula

1 9:jpg

Figura 2. À esquerda, interferência devido a uma onda que passa


pelas duas fendas; à direita, distribuição de partículas clássicas quando
atravessam um anteparo com duas fendas, não surge uma …gura de in-
terferência.
1. CARACTERíSTICAS DA M ECÂNICA QUÂNTICA xxxvii

slit

2 0:jpg

Figura 3. Passagem sequencial de partículas por duas fendas e for-


mação do padrão de interfência típica de um fenômeno ondulatório.

onde U ^ (t; t0 ) é chamado operador de evolução temporal, ele evolui o estado inicial
j (t0 )i , no tempo t0 , para um estado j (t)i, em um tempo posterior, t > t0 .
No caso não relativístico a equação de Schrödinger é a equação fundamental que
descreve a evolução temporal do estado de uma ou mais propriedades de um sistema
(partícula),

d j (t; t0 )i p^2
i~ = + V^ j (t; t0 )i
dt 2m

onde p^2 =2m + V^ = H


^ é um operador associado à energia do sistema. No caso de
movimento a energias comparáveis ou maiores às massas de repouso das partículas
estudadas, deve-se usar as chamadas equações relativísticas de Dirac ou de Klein-
Gordon, dependendo de o grau de liberdade spin assumir valor inteiro ou semi-
inteiro de um número ímpar.
^ B;
À semelhança das eqs. (1.1), (1.2), os operadores A; ^ C;
^ :::também têm sua
própria equação de movimento, que é chamada equação de Heisenberg. Por exem-
plo, para um operador A^ que representa uma propriedade de um sistema, tem-se a
equação de movimento

dA^H (t)
i~ = A^H (t) H
^ ^ A^H (t) ;
H onde A^H (t) = U
^ 1
(t; t0 ) A^U
^ (t; t0 ) ;
dt
xxxviii 2. A M ECÂNICA QUÂNTICA NO CONTEXTO DA FíSICA

onde U^ 1 (t; t0 ) é o operador inverso2 de U ^ (t; t0 ). Caso A^ contenha uma dependên-


cia explícita no tempo, A^ (t), então no lado direito da equação deve-se somar o
termo adicional i~U ^ 1 (t; t0 ) @ A^ (t) =@t U^ (t; t0 ).
4. A MQ é uma teoria linear, e em decorrência emerge, quiç̧á, sua propriedade
mais importante, o princípio de superposição de vetores: Se j 1 i e j 2 i são duas
soluções independentes da equação de Schrödinger (podendo representar dois difer-
entes valores de uma propriedade medível) então a superposição,
(1.3) c1 j 1i + c2 j 2i
é também uma solução, com coe…cientes c1 e c2 . Apesar de talvez parecer uma pro-
priedade acessória, a linearidade das equações junto com o princípio de superposição
de vetores são ingredientes essenciais, sendo responsáveis por resultados muito pe-
culiares na teoria da informação e computação quânticas. Na superposição (1.3)
prevalece a sintaxe E e não OU : “a propriedade do sistema está representada pelos
estados j 1 i E j 2 i” e não j 1 i OU j 2 i”.
5. Durante a elaboração e construção da MQ, conceitos inéditos tiveram que ser
incorporados à teoria a …m de explicar e descrever os fenômenos observados, dentre
os mais signi…cativos temos, o grau de liberdade de spin e a indistingüililidade de
partículas idênticas com sua estatística peculiar que permite classi…cá-las em duas
classes: (a) os bósons, que seguem uma certa estatística conhecida como de Bose-
Einstein; e (b) os férmions, que seguem a estatística de Fermi-Dirac. Na qualidade
de bósons existem a partícula alfa (núcleos de átomos de hélio) e outros núcleos e
a´tomos de spin total de valor inteiro, e as partículas de campo como o fóton (na
interação eletromagnética), os mésons (partículas subatômicas e também do campo
nuclear) os glúons (nas interações fortes) e os W e Z 0 (nas interações fracas). E
no caso dos férmions há as partículas que constituem a matéria estável, elétrons,
prótons e nêutrons e os também os elusivos quarks e os furtivos neutrinos.

2U
^ 1 (t; t0 ) U
^ (t; t0 ) = U
^ (t; t0 ) U
^ 1 (t; t0 ) = ^
1
CAPíTULO 3

Cbits, Qbits e seus estados


(Salomon,Thiago,Simone)

De forma semelhante ao computador clássico, o computador quântico – que é


um projeto para o futuro – utiliza-se de bits e de operações lógicas, não obstante
de…nidas no âmbito da MQ. O computador quântico funcionará de forma muito
mais rápida e e…ciente desde que os dispositivos usem as leis e os artifícios da MQ e
por períodos de tempo su…cientemente longos para efetuar toda a seqüência de op-
erações programadas para fornecer os resultados …nais. Os dispositivos disponíveis
atualmente se degradam rapidamente antes do término de cálculos mais rebuscados,
passando a operar como dispositivo clássicos. Esse tipo de degradação é intrínseco
à propria experimentação e chama-se decoerência, que é o equivalente ao calor pro-
duzido por uma máquina que efetua trabalho. Embora calor e decoerência sejam
indesejáveis para as …nalidades práticas, não há como se livrar deles. Atualmente,
trabalha-se avidamente para encontrar meios que possam retardar ou transferir os
efeitos da decoerência. Muitos avanços já foram feitos até o presente momento,
os mais otimistas preveêm que a entrada em operação do computador quântico
comercial poderá ocorrer em um prazo de 10 a 15 anos.
Agora vejamos qual é a diferença fundamental de operação entre um computa-
dor clássico e um quântico. Para a de…nição das operações lógicas a notação conve-
niente é aquela que faz uso dos vetores (ou matrizes coluna) como veremos abaixo
e apresentados com mais detalhes no Apêndice A. Então podemos nos perguntar, o
que diferenciaria a manipulação dos bits no computador clássico do quântico? Na
MQ há alguns ingrediente que não existem no mundo clássico, ou melhor, são con-
ceitos novos, um é chamado superposição de estados, e o outro é o entrelaçamento
ou emaranhamento de estados. Essas são propriedades que, em princípio, permitem
que muitos estados possam ser manipulados simultaneamente ou paralelamente, …-
cando correlacionados de uma forma bem peculiar.Vamos examinar estes conceitos
mais de perto e ver como eles mudam a maneira de operar com bits, assim como a
“…loso…a” de manipulação e da de…nição das operações lógicas fundamentais.
De acordo com a dinâmica de um sistema quântico isolado as equações do
movimentos são reversíveis, assim as operações lógicas deverão manter este caráter
de reversibilidade temporal que implica na invertibilidade das portas lógicas, con-
sequentemente, algumas das portas fundamentais da lógica clássica que são não-
invertíveis, deixarão de ser fundamentais na MQ, sendo substituídas por outras.
A teoria da informação clássica trata do armazenamento, processamento e trans-
missão de informações (letras, palavras, números) através de canais como ondas
eletromagnéticas, cabos coaxiais ou …bras ópticas. Esta informação é codi…cada e
tem como unidade fundamental o bit (do termo em inglês binary digit) e este pode
assumir os valores lógicos 0 ou 1. Os bits podem ser representados …sicamente

xxxix
xl 3. CBITS, QBITS E SEUS ESTADOS (SALOM ON,THIAGO,SIM ONE)

por algum dispositivo com dois estados distingüíveis e não ambiguos, de forma que
com N dispositivos pode-se representar N bits, dando lugar a um número total
de estados (lógicos) igual a 2N . Nos computadores, os bits são representados pela
presença ou não de correntes elétricas em componentes eletrônicos dentro dos chips:
a presença da corrente indica o estado lógico 1 e a sua ausência (ou pelo menos uma
corrente menos intensa) o estado lógico 0. Os vetores representados por matrizes
coluna

0 1
(0.4) j0i = e j1i = ;
1 0
são chamados vetores tipo kets na notação de Dirac e são chamados por Mermin,
na computação quântica, Cbits. O conjunto fj0i ; j1ig é uma base no espaço de
Hilbert bidimensional H2 chamada de base computacional 1 .
O produto direto de dois Cbits (veja o Apêndice A) escreve-se
0 1 0 1
1 0
B 0 C B 1 C
(0.5) j1i1 j1i2 j11i = B C B C
@ 0 A ; j1i1 j0i2 j10i = @ 0 A ;
0 0
0 1 0 1
0 0
B 0 C B 0 C
(0.6) j0i1 j1i2 j01i = B C B C
@ 1 A ; j0i1 j0i2 j00i = @ 0 A ;
0 1
e o conjunto de vetores ortonormalizados fj11i ; j10i ; j01i ; j00ig formam uma base
no espaço de Hilbert de dimensão 4, H4 = H2 H2 . Existe também um espaço,
dito dual, onde os vetores de base transpostos são vetores linha ou do tipo bra
y y
h0j = (j0i) = 0 1 ; e h1j = (j1i) = 1 0
de H2 , e
y
h1j h1j h11j = (j11i) = 1 0 0 0 ;
y
h1j h0j h10j = (j10i) = 0 1 0 0 ;
etc...
são vetores de base de H4 = H2 H2 . Pode-se estender a notação para o
produto direto para múltiplos espaços H2 ; para N Cbits o número de estados
ON
N
de base é 2N , o que é escrito como H2 = H2 (j). Os estados (0.4) podem
j=1
representar os estados de spin de um elétron ou de um átomo de spin 1/2, dois
níveis de energia (selecionados) de um átomo ou os estados de polarização de um
fóton, etc... ou seja, uma variável dicotômica de estados mutuamente excludentes
assim como em relês clássicos.
Em um computador quântico, um relê quântico pode estar nos bits 0 e 1 “si-
multaneamente”, ou seja, diferentemente dos estados clássicos, a MQ admite su-
perposições de estados j1i e j0i chamados Qbits (quantum bits), que são descritos
1 No caso de um spin 1/2 os estados da base recebem uma notação alternativa j0i j#i e
j1i j"i, mas equivalente.
3. CBITS, QBITS E SEUS ESTADOS (SALOM ON,THIAGO,SIM ONE) xli

formalmente como uma superposição coerente de estados. Os exemplos mais comuns


para a representação física de um Qbit são: estados de polarização de um fóton (hor-
izontal ou vertical), elétrons em átomos quando apenas dois estados linearmente
independentes são observados, elétrons em poços quânticos, e spins nucleares. Em
particular,
1 1
(0.7) j!i = p (j1i + j0i) ; j i = p (j1i j0i) ,
2 2
j1i e j0i coexistem com a sintaxe E e não OU. Diz-se que um relê ou uma partícula
p 2
encontra-se no estado j!i (ou j i) coexistindo com igual probabilidade 1= 2 ,
ou “se uma propriedade dicotômica de uma partícula for descrita pelo estado j!i,
então se for feita uma medição sobre a partícula por um aparato de medida que
pode discernir entre os estados de base j1i e j0i, a probabilidade de que o resultado
da medição aponte o estado j1i é 1=2 e a probabilidade de que aponte os estado j0i
é também 1=2. Entretanto, antes de ser feita a medição a informação de a partícula
estar no estado j!i signi…ca que ela está em ambos os estados, j1i e j0i.
De forma mais geral, o estado de um Qbit é descrito por um vetor da forma
(0.8) j i= 0 j0i + 1 j1i ;
onde os números f 0 ; 1 g 2 C (pertencem ao corpo dos complexos) e são chamados
amplitudes de probabilidade, eles satisfazem a condição de normalização
2 2
j 0j +j 1j = 1:
2 2
com jaj e jbj sendo probabilidades.
Existe uma representação geométrica dos Qbit no R3 , constituindo um isomor-
…smo com vetores em H2 : os pontos na superfície de uma esfera de raio unitário,
esta representação no R3 auxilia na visualização e no entendimento das propriedades
gerais dos vetores em H2 . Como os coe…cientes da Eq. (0.8) depende de três
parâmetros, ela pode ser reescrita como
j i = ei cos ( =2) j1i + ei sin ( =2) j0i
sendo , e 2 R . Como o fator de fase ei é global, ele não tem efeito físico
observável, podendo assim ser desconsiderado e o estado (0.8) pode ser escrito como
j i = cos ( =2) j1i + ei sin ( =2) j0i :
Os parâmetros têm domínio compacto 2 [0; ] e 2 [0; 2 ), são ângulos no R3
que localizam um ponto na esfera tridimensional de raio unitário (também chamada
esfera de Poincaré ou de Bloch, conforme pode ser visto na Figura 1). O ângulo
polar está associado com as probabilidades associadas aos estados da base j0i
e j1i, p0 = cos2 ( =2) e p1 = sin2 ( =2). O ângulo azimutal é a fase relativa
entre os estados de base superpostos, o fator de fase ei é responsável por efeitos
de interferência.
Dois sistemas independentes, A e B, representados por estados de um Qbit nos
2 2
espaços de Hilbert HA e HB
a1
j iA = = a1 j1iA + a0 j0iA
a0 A
b1
j'iB = = b1 j1iB + b0 j0iB
b0 B
xlii 3. CBITS, QBITS E SEUS ESTADOS (SALOM ON,THIAGO,SIM ONE)

Figura 1. Esfera de Bloch

ganham uma nova representação como um estado descrito pelo produto tensorial
dos estados, j iA j'iB , que é também chamado produto direto. O estado produto
direto do sistema é expresso como

0 1
a1 b1
a1 b1 Ba1 b0 C
j iAB = j iA j'iB = =B C
@a0 b1 A
a0 A
b0 B
a0 b0 AB
= [a0 j0iA + a1 j1iA ] [b0 j0iB + b1 j1iB ]
= a0 b0 j0iA j0iB + a0 b1 j0iA j1iB
(0.9) +a1 b0 j1iA j0iB + a1 b1 j1iA j1iB

que podemos simpli…car omitindo o símbolo e escrevendo j1iA j0iB j10i:

(0.10) j iAB = a0 b0 j00i + a0 b1 j01i + a1 b0 j10i + a1 b1 j11i


2
O vetor resultante j iAB é um vetor no espaço H2 = H2 H2 gerado pela base

fj00iAB ; j01iAB ; j10iAB ; j11iAB g

pode ser escrito de forma mais compacta como

fj0i ; j1i ; j2i ; j3ig ;

onde j00iAB ! j0i, j01iAB ! j1i, j10iAB ! j2i e j11iAB ! j3i ; que é a base
computacional. Em base nisso, um estado genérico de um sistema composto de n
Qbits pode ser escrito como uma superposição normalizada dos 2n estados da base
computacional
fj0i ; j1i ; :::; j2n 1ig
3. CBITS, QBITS E SEUS ESTADOS (SALOM ON,THIAGO,SIM ONE) xliii

n
do espaço H2 , ou seja,
n
2X 1
n
j i= k jki ;
k=0
com amplitudes de probabilidade k e com a condição de normalização
n
2X1
2
(0.11) j kj = 1:
k=0
Por exemplo, o estado de um sistema de dois Qbits é uma superposição dos estados
da base computacional
(0.12) j i= 0 j0i + 1 j1i + 2 j2i + 3 j3i :
Entretanto, é importante observar que um estado arbitrário de dois (ou mais) Qbits
nem sempre é o produto direto dos estados dos Qbits individuais. Por exemplo, o
estado
1
j i = p (j00i + j11i)
2
22
é um vetor no espaço H , mas que não pode ser escrito como um produto direto
de estados de um Qbit. Quando isso ocorre, o estado é dito estar emaranhado.
0.3. Emaranhamento. O espaço de Hilbert de um sistema composto HA1 A2 :::An
é formado pelo produto tensorial dos espaços de Hilbert dos subsistemas indivíduais,
respectivamente HA1 , HA1 ,...,HAn . Se for possível escrever o estado A1 A2 :::An 2
HA1 A2 :::An como:
A1 A2 :::An = A1 A2 ::: An

então este estado é dito separável, caso contrário, o estado é dito estar emaranhado.

No estudo de sistemas compostos o operador densidade desempenha um impor-


tante papel. Um sistema bipartite AB é descrito pelo operador densidade AB , mas
se desejarmos obter informações somente em relação a um dos subsistemas basta
tomar o traço parcial deste operador densidade,
A AB B AB
= TrB e = TrA :
O emaranhamento pode também ser de…nido em termos do operador densidade:
o estado de um sistema composto é separável (não-emaranhado) se for possível
escrever o operador densidade como:
A1 :::An A1 An
= ::: :
Se um sistema for formado por dois subsistemas este é chamado bipartite. Como
exemplos de sistemas bipatites temos: dois átomos, dois spins, a polatização de 2
fótons. Um único átomo pode constituir um sistema bipartite, desde que cada um
dos dois subsistemas sejam relativos a certos graus de liberdade do átomo, por ex-
emplo, um subsistema refrente ao momentum do átomo e o outro referente ao seu
spin. Para que exista emaranhamento entre sistemas é necessário que estes tenham
interagido em algum momento. Este é um ponto muito importante.

O emaranhamento não indica que existe necessáriamente interação entre os sis-


temas, mas que existe alguma correlação entre eles, sendo que esta correlação é
de caráter quântico e não clássico. Este caráter quântico da correlação que torna
xliv 3. CBITS, QBITS E SEUS ESTADOS (SALOM ON,THIAGO,SIM ONE)

dí…cil sua compreensão.

De um ponto de vista clássico a correlação pode ser compreendida através do


seguinte exemplo: suponha que tenhamos duas bolas de bilhar, uma vermelha e a
outra preta. Colocamos cada bola em uma caixa e entregamos cada caixa a uma
pessoa diferente sem que estas conheçam o conteúdo das caixas, apenas que numa
há uma bola preta e a na outra uma bola vermelha. Se uma das pessoas abrir a sua
caixa e tirar uma bola vermelha (por exemplo) então ela sabe o conteúdo da outra
caixa sem que ela precise ser aberta. As duas observações estão correlacionadas.

Para ilustrar um importante aspecto do emaranhamento considere um estado


emaranhado de um sistema bipartite da forma:
j00i + j11i
(0.13) + = p :
2
A matriz de Pauli X é dada por:
0 1
X= :
1 0
Calculando as médias de XA e XB em relação ao estado (0.13) são obtidos os
seguintes resultados:
h00j + h11j j10i + j01i
hXA i = + XA + = p : p = 0;
2 2
e
hXB i = + XB + = 0;
mas se calcularmos a correlação 2 entre XA e XB , isto é, a média de XA XB , obtemos
o seguinte resultado:
h00j + h11j j11i + j00i
hXA XB i = + XA XB p+ =: p = 1;
2 2
mostrando que existe correlação máxima entre os spins.

Suponha que se faça medidas sobre o qbit A representadas pelos operadores


M0A = j0i h0j e M0A = j1i h1j. A probabilidade de se obter 0 ou 1 é a mesma e igual
a 1/2:
1
p(0) = + M0Ay M0A + = = + M1Ay M1A + = p(1):
2
Supondo que tenhamos medido 0 e como consequência do postulado da medida
o estado em que o sistema irá se encontrar (após a medida) passa a ser:
M0A
j 0i = p + = j00i :
1= 2
Com isso, o estado do qbit B …ca completamente determinado apenas com uma
medida efetuada sobre o qbit A, ainda que nenhuma medida tenha sido realizada
sobre B!

2 O valor da correlação varia de 0 a 1, indicando mínima e máximo correlação,


respectivamente.
3. CBITS, QBITS E SEUS ESTADOS (SALOM ON,THIAGO,SIM ONE) xlv

Até o monento poderimos pensar que estamos presenciando uma correlação de


caráter clássico, como o caso das bolas de bilhar, mas essa conclusão mostra-se falsa
mediante o seguinte problema: Se a medida for realizada em outra base, por exem-
A
plo, M+ = j+i h+j e M A = j i h j ao medir o estado j+i para o qbit A o estado
do sistema composto após a medida é j++i. Assim, o estado do qbit B depende
do tipo de medida realizada sobre o qbit A! Esse fato não pode ser ilustrado usado
o exemplo das bolas de bilhar.

A in‡uência do resultado de uma medida em um qbit sobre o estado de outro


qbit, ainda que localizado remotamente em relação ao primeiro é um exemplo do
que se passou a chamar não-localidade.

Em um in‡uente trabalho de 1935 Albert Einstein, Boris Podolsky e Nathan


Rose apontaram essa estranha propriedade tendo como objetivo demonstrar que a
Mecânica Quântica é uma teoria incompleta. Para esses autores uma teoria é com-
pleta se ela contemplar os elementos de realidade, de…nidos como qualquer grandeza
física cujo seu valor pudesse ser previsto antes que uma medida fosse realizada. Por
exemplo, se realizarmos uma medida do observável X sobre um qbit de um par
emaranhado, ao se encontrar o resultado 0 no outro, o resultado de tal medida se-
ria conhecido antes de ter sido realizada. Logo, o observável X seria um elemento de
realidade. No entanto, antes da medida ter sido realizada no primeiro qbit, apenas
as probabilidades dos resultados de X seriam conhecidas. Nesse sentido a teoria
quântica seria incompleta. Este resultado passou a ser conhecido como paradoxo
de EPR .

Porém, a possibilidade de um este experimental para decidir se a Mecânica


Quântia seria ou não local veio apenas em 1964 no trabalho de John Bell, cujo
resultado …cou conhecido como desigualdade de Bell. A desigualdade de Bell esta-
belece um limite superior para a correlação entre medidas feitas em observáveis de
qbits separados. Se esse limite fosse violado então a Mecânica Quântica seria real-
mente não-local. Em 1982, um grupo francês liderado por Alain Aspect conseguiu
testar a desigualdade de Bell em laboratório e mostrou que esta era violada. Logo,
a Mecânica Quântica é não-local.

Existem diversas medida para determinar e quanti…car o emaranhamento, porém


apenas para sistemas bipartites é possível construir medidas consistentes e e…-
cientes, sendo este um problema em aberto de grande importância. Não irá se
entrar em detalhes dessas medidas nesse texto mas como um exemplo vou apresen-
tar um critério necessário e su…ciente para determinar se um sistema bipartite puro
está emaranhado ou não, chamado de Decomposição de Schmidt.
Lemma 1. Seja j i um estado puro Ede um sistema compostoE AB. Então é
possível encontrar estados ortogonais A i do subsistema A e B
i do subsistema
B tais que:
X E E
A B
(0.14) j i= i i i ;
i
0 P 2
onde os issão números reais não-negativos satisfazendo i i = 1 chamados de
coe…cientes de Schmidt.
xlvi 3. CBITS, QBITS E SEUS ESTADOS (SALOM ON,THIAGO,SIM ONE)

O número de coe…cientes é conhecido como número de Schmidt e é usando para


determinar se o estado puro j i está emaranhado ou não. Assim, um estado puro
é fatorável se, e somente se o número de Schmidt é igual a 1.
Problem 4. Demonstre a Eq. (0.14).

1. Operações reversíveis em Qbits


A evolução temporal de um sistema quântico isolado é descrita por uma trans-
formação linear especial que preserva o módulo dos vetores sobre os quais atua e é
chamada transformação unitária por ser representada por operadores (ou matrizes)
unitários. Um operador unitário U e o seu adjunto Uy têm a propriedade
UUy = Uy U = 1;
sendo que a operação adjunto de uma matriz é constituída de duas operações, a
transposição e a complexo conjugação: Uy ij = (Uji ) . Portanto, Uy = U 1 , um
processo unitário (descrito por uma operação unitária) é reversível, pois a operação
inversa está de…nida. Estas transformações são chamadas de portas de n-Qbit (n-
Qbit gates).
Os operadores ou matrizes de Pauli
0 1 0 i 1 0
(1.1) ^1 = ; ^2 = ; ^3 =
1 0 i 0 0 1
são objetos matemáticos essenciais na informação quântica, pois atuam nos Qbits
modi…cando seu estado. As matrizes (1.1) juntamente com a matriz unidade
1 0
^0 1= ;
0 1
formam a base da álgebra su(2).
Lemma 2. Aqui vamos mostrar que as matrizes de Pauli são linearmente in-
dependentes, i.e.,

3
X
ai ^ i = 0:
i=0

Demonstração. Para demonstrar esta propriedade devemos resolver a equação


para os coe…cientes ai ,
3
X a0 + a3 a1 ia2 0 0
ai ^ i = =
a1 + ia2 a0 a3 0 0
i=0
portanto, 8
>
> a0 + a3 = 0
<
a0 a3 = 0
=)
> 1 + ia2 = 0
> a
:
a1 ia2 = 0
resolvendo obtemos
2a0 = 0 =) a0 = 0 ; 2a3 = 0 =) a3 = 0
2a1 = 0 =) a1 = 0 ; 2ia2 = 0 =) a2 = 0
1. OPERAÇÕES REVERSíVEIS EM QBITS xlvii

De forma que a única solução é ai = 0 para 0 i 3, assim …ca demonstrado que


as quatros matrizes ^ 0 , ^ 1 , ^ 2 e ^ 3 são linearmente independentes.

Lemma 3. Qualquer matriz bidimensional pode ser expandida na base f^ 0 ; ^ 1 ; ^ 2 ; ^ 3 g,

u = u0 ^ 0 + d :
Demonstração. Sendo u0 um número complexo e d um vetor cujas três com-
ponentes são também números complexos. Escrevendo explicitamente temos
u0 + d3 d1 id2
u = u0 ^ 0 +d1 1 +d2 2 +d3 3 = :
d1 + id2 u0 d3
Vamos impor agora que u seja uma matriz unitária (uuy = uy u = 1). Uma vez
que qualquer matriz unitária permanece unitária se for multiplicada por um fator
de fase global ei com real, podemos tomar u0 como sendo um número real e
chegar em uma forma geral (exceto por este fator de fase global)
(1.2) uy = u0 1 + d ~;
onde …zemos uso do fato de que as matrizes de Pauli são hermitianas. Fazendo uso
da relação
(a ~ ) (b ~ ) = a b + i (a b) ~
podemos escrever 1 uy u = 0 explicitamente e obter
(1.3) 1 u20 d d [u0 (d + d ) + i (d d)] = 0:
Como as matrizes 1 e são linearmente independentes, os coe…cientes devem ser
identicamente nulos
(1.4) 1 u20 d d=0 e u0 (d + d ) + i (d d) = 0
Da segunda equação encontramos
2u0 Re d = i (d d)
mas como
d d = 2i Re d Im d
logo
(1.5) u0 Re d = Re d Im d:
Se u0 6= 0, segue de (1.5) que
(1.6) u0 Re d Re d = Re d Im d Re d:
Das propriedades da mistura de produto escalar e vetorial, A (B C) = B
(C A) = C (A B), multiplicando escalarmente a Eq. (1.6) pela direita por
Re d obtemos
u0 Re d Re d = Re d Im d Re d:
= Im d (Re d Re d) = 0
portanto Re d = 0. De forma que o vetor d deve ser i vezes um vetor real v e
podemos escrever a forma geral para um operador unitário bidimensional u como
u = u0 1 + iv
xlviii 3. CBITS, QBITS E SEUS ESTADOS (SALOM ON,THIAGO,SIM ONE)

Da primeira equação em (1.4) teremos


u20 + d d=1
u20 + ( iv) (iv) = 1
u20 + v v = 1:
Esta identidade é assegurada se escrevermos u0 e v em termos de um versor n,
paralelo a v = n sin , e um ângulo real tal que
(1.7) u = 1 cos + i (n ) sin
(1.8) = exp (i n )

Problem 5. Demonstre a relação (1.3).


Problem 6. Demonstre que as duas formas, (1.7) e (1.8), para u são equiva-
lentes.
Uma conexão entre as matrizes unitárias bidimensionais f^ 0 ; ^ 1 ; ^ 2 ; ^ 3 g e ro-
tações tridimensionais ordinárias é dada por
u (~a: ) uy = ~a0 :
tal que
~a0 = R~a;
onde R é uma matriz de rotação no R3 (emerge do fato de que cada uma das 3
matrizes de Pauli tem traço nulo e do fato de que a transformação unitária do
operador ~a: =A ! uAuy preserva o traço de A.)
CAPíTULO 4

Operações lógicas (Salomon)

1. As operações lógicas quânticas


Agora como se representariam as operações lógicas no computador quântico?
A linguagem mais usada atualmente na descrição do processamento quântico da
informação é aquela dos circuitos quânticos. Um circuito quântico é um dispositivo
que consiste de portas lógicas conectadas umas às outras que atuam sobre estados
de Qbits e cujos passos computacionais são sincronizados no tempo, como veremos
a seguir. Dadas duas matrizes (ou operadores), a identidade e a inversão,

1 0 0 1
I= ; X= ;
0 1 1 0

para um estado jxi, x 2 Z2 , veri…cam-se as operações unárias

I jxi = jxi ; e X jxi = jxi :

O operador X é representa a operação ou porta NOT na formulação quântica.


Pode-se também de…nir operações unárias paramétricas, para isso de…ne-se o oper-
ador X (a) que depende de um parâmetro a 2 Z2 ,

a a
(1.1) X (a) = (1 a) I + a X = aI + aX =
a a

onde veri…ca-se que

(1.2) X (a) j0i = a j0i + a j1i = jai


(1.3) X (a) j1i = a j1i + a j0i = jai :

Note-se que o operador X (a) é invertível uma vez que jdet (X (a))j = 1, e como
2
(X (a)) = I, então X 1 (a) = X (a), é o seu próprio inverso.

1.1. Porta CNOT e a reversibilidade da operação. Usando as propriedades


(1.2) e (1.3) para um estado jxi (x 2 Z2 ) veri…ca-se que a operação unária

(1.4) X (a) jxi = jxa + xai = ja 2ax + xi

o rótulo do estado ja 2ax + xi é uma função típica de uma porta XOR (xa+ xa =
a 2ax + x = a x), assim seria conveniente se o parâmetro a puder ser associado a
um segundo Cbit, um Cbit de controle. Com este intuito constrói-se o operador da
porta CNOT como um operador binário, que atua de forma geral sobre dois Qbits,
em particular, atuando sobre dois Cbits ele deve depender de um o operador que
xlix
l 4. OPERAÇÕES LÓGICAS (SALOM ON)

atua sobre um Cbit


X 2 (Z 1 ) jx1 x2 i = X 2 (Z 1 ) jx1 i jx2 i
= jx1 i X 2 (x1 ) jx2 i
= jx1 i jx1 2x1 x2 + x2 i
(1.5) = jx1 ; x1 2x1 x2 + x2 i = jx1 ; x1 x2 i = jx1 ; y2 i ;
onde jx1 i é o Cbit de controle e jx2 i é o Cbit alvo e onde o subíndice 2 em X 2
signi…ca que o operador atua sobre o segundo Cbit jx2 i. Observa-se que houve a
transição jx1 x2 i ! jx1 ; y2 i, sendo portanto uma operação binária dois a dois, onde
o primeiro Cbit jx1 i (de controle) se mantém inalterado no …nal da operação e o
segundo jx2 i, o Cbit alvo, é passível de modi…cação. O operador que caracteriza a
porta lógica CNOT é escrito como
C 12 = X 2 (Z +;1 ) = (I 1 Z +;1 ) I 2 + Z +;1 X2
(1.6) = I 1 I 2 Z +;1 (I 2 X 2 ) ;
os subscritos 1 e 2 identi…cam sobre qual Cbit cada operador atua.
Os operadores hermitianos Z + e Z estão de…nidos por
I +Z I Z
(1.7) Z+ = ; Z = ;
2 2
cuja representação matricial é
1 0 1 0 0 0
Z= ; Z+ = ; Z = ;
0 1 0 0 0 1
eles possuem as propriedades,
2
(1.8) (Z ) = Z ; Z +Z = Z Z + = 0; Z+ + Z =I
e satisfazem as equações de autovalores
Z + jxi = x jxi e Z jxi = x jxi :
Pode-se veri…car que a operação CNOT é reversível, pois o operador associado
C 12 é um operador unitário,
y 2 y 1
(1.9) C 12 = (C 12 ) ; (C 12 ) = I 1 I 2 =) (C 12 ) = (C 12 ) ;
Podemos escrever C 12 como
X1 n
( iT =~) n
(1.10) C 12 (T ) = exp [ iT H 12 =~] = I 1 I2 + (H 12 )
n=1
n!
onde H 12 é um operador hamiltoniano, representando a interação entre dois Qbits,
e T é um tempo de interação. Veri…ca-se que a forma
(1.11) H 12 = ~g (I 2 X 2) Z +;1 ;
onde g é a constante de acoplamento da interação entre os dois qubits, leva a
X1 n X1 n
( iT =~) n ( igT ) n n
(H 12 ) = (I 2 X 2 ) (Z +;1 )
n=1
n! n=1
n!
1
1 X ( igT =2)
n
= 2n 1
(I 2 X 2) Z +;1
2 n=1 n!
igT =2
(1.12) = e 1 (I 2 X 2) Z +;1 :
1. AS OPERAÇÕES LÓGICAS QUÂNTICAS li

Agora podemos descobrir o valor da duração do pulso T para que o operador (1.10)
se torne igual ao operador (1.6)
1
C 12 = I 1 I 2 Z +;1 (I 2 X 2 ) = I 2 I 1 + e igT =2 1 (I 2 X 2 ) Z +;1 ;
2
nota-se que é preciso que gT =2 = , ou T = 2 =g, o que permite identi…car o
hamiltoniano de interação entre dois qubits (??) como aquele que gera uma porta
CNOT. Veja a Figura 1.Uma outra forma de veri…car que a operação CNOT é

Figura 1. Operação lógica CNOT. Apenas o bit de entrada x2 é trans-


formado para y2 , dependendo dos valores dos dois bits de entrada, x1 e
x2 .

invertível, consiste em fazer uma inversão funcional nos rótulos do Cbits na Eq.
(1.5), escrevendo
y1 = x1
y2 = x1 2x1 x2 + x2
a relação inversa é
(1.13) x1 = y1
y 1 y2
(1.14) x2 = y1 2y1 y2 + y2 :
2y1 1
Note-se que apesar de (y1 y2 ) = (2y1 1) ser funcionalmente diferente de y1
2y1 y2 + y2 , eles possuem a mesma imagem em Z2 ; portanto,
(1.15) (y1 ; y2 ) ! (x1 ; x2 ) = (y1 ; y1 2y1 y2 + y2 ) ;
e o bit de controle pode ser escrito com a mesma forma funcional x2 = fcnot (y1 ; y2 ).
1.2. Porta SWAP (operador de permutação P12 ). O operador C 12 , eq.
(1.6) não é simétrico na troca de 1 por 2, C 21 6= C 12 , visto que
(1.16) C 21 = I 1 I2 (I 1 X1 ) Z +;2 ;
pode-se veri…car que
(1.17) C 12 jx1 x2 i = jx1 f (x1 ; x2 )i = jx1 y2 i
(1.18) C 21 jx1 x2 i = jf (x2 ; x1 ) x2 i = jy1 x2 i
onde y2 = f (x1 ; x2 ) e y1 = f (x2 ; x1 ); com f (x1 ; x2 ) = f (x2 ; x1 ) = x1 2x1 x2 +x2 ,
logo
(1.19) C 21 (C 12 jx1 x2 i) = C 21 jx1 y2 i = jf (y2 ; x1 ) y2 i = jz1 y2 i
lii 4. OPERAÇÕES LÓGICAS (SALOM ON)

onde z1 = f (y2 ; x1 ). Aplicando novamente o operador C 12 obtemos


(1.20) C 12 (C 21 (C 12 jx1 x2 i)) = C 12 jz1 y2 i
(1.21) = jz1 f (z1 ; y2 )i = jz1 z2 i ;
com z2 = f (z1 ; y2 ). Os valores dos rótulos z1 e z2 são
(1.22) z1 = f (f (x1 ; x2 ) ; x1 ) = x2
(1.23) z2 = f (z1 ; f (x1 ; x2 )) = f (x2 ; f (x1 ; x2 )) = x1 :
Portanto, veri…ca-se que a porta SWAP, representada pelo operador P 12 é decom-
posta como
(1.24) C 12 C 21 C 12 jx1 x2 i = jx2 x1 i = P 12 jx1 x2 i
ou
(1.25) C 12 C 21 C 12 = P 12 :
Fazendo os devidos cálculos obtém-se
P 12 = I 1 I2 Z +;1 I2 I1 Z +;2 + 2Z +;1 Z +;2 + ;1 +;2 + +;1 ;2 ;

onde
0 0 0 1
(1.26) = ; + = :
1 0 0 0
Analogamente, podemos determinar P 23 e P 31 fazendo uma mudança de índices
(12 ! 23, 12 ! 31), e como
P 123 = P 12 P 23 ; P 132 = P 12 P 31
podemos obter todos os elementos do grupo de permutações S3 : {I, P12 , P23 , P31 ,
P123 , P132 }, usando a operação C ij .
1.3. Porta To¤oli. Torna-se imediato obter o operador para a To¤oli, que é
também reversível, que envolva a ação sobre três Cbits: temos
T (12)3 = C (12)3 = X 3 (Z +;2 Z +;1 ) jx1 x2 x3 i = jx1 x2 i X 3 (x1 x2 ) jx3 i
(1.27) = jx1 x2 i j(x1 x2 ) 2 (x1 x2 ) x3 + x3 i
vamos escrever
T (12)3 = X 3 (Z +;2 Z +;1 ) = I 3 (I 1 I2 Z +;2 Z +;1 ) + X 3 Z +;2 Z +;1
(1.28) = I3 I2 I1 (I 3 X 3) Z +;2 Z +;1 ;
e analogamente, o operador hamiltoniano para a porta de To¤oli escreve-se
H 123 = ~g (I 3 X 3) Z +;2 Z +;1 :
A porta To¤oli é reversível quanto à operação CNOT, isto pode ser constatado
fazendo uma análise dos rótulos, como foi feito no caso da porta CNOT
y2 y3
(1.29) x3 = = y2 2y2 y3 + y3 ;
2y2 1
(a segunda igualdade é verdadeira apenas para y2 ; y3 2 Z2 ) mas é irreversível quanto
à operação AND, pois em
(1.30) x1 x2 = y2 ;
se y2 = 1, necessariamente x1 = x2 = 1, mas se y2 = 0, isto pode ser devido a três
situações distintas e indistinguíveis, (x1 ; x2 ) = (0; 0) ; (0; 1) ; (1; 0).
1. AS OPERAÇÕES LÓGICAS QUÂNTICAS liii

1.4. Porta OR (não invertível). Para obter o operador associado com a


porta OR introduzimos o operador unário parametrizado
M + (a) = aI + a ( + + Z +)
(veja a Eq. (1.26)) e veri…camos que
M + (a) j0i = [aI + a ( + + Z + )] j0i = a j0i + a j1i = jai
M + (a) j1i = [aI + a ( + + Z + )] j1i = j1i ;

que reescrevemos como


M + (0) jxi = jxi
M + (1) jxi = j1i
ou ou forma mais geral
M + (a) jxi = jx ax + ai ;
assim reconhecemos o rótulo x ax+a como função típica de uma operação clássica
OR para dois bits (a; x). Considerando a atuação sobre dois Cbits, onde o primeiro
é o de controle podemos escrever o operador,
OR12 = M + (Z+;1 ) = (I 1 Z +;1 ) I 2 + Z +;1 ( +;2 + Z +;2 ) ;
de forma que temos
OR12 jx1 x2 i = jx1 i [(1 x1 ) I 2 + x1 ( +;2 + Z +;2 )] jx2 i
= jx1 ; x2 x1 x2 + x1 i :
Em suma, constatamos que é possível embutir as operações lógicas com bits no es-
paço de Hilbert, como rótulos de bras e kets, e existem operações de transformação,
do tipo OR12 , que atuam nos vetores do espaço de Hilbert e que criam os qubits
associados às operações lógicas.
Podemos veri…car que M + (a) não é invertível: nota-se que
2
(M + (a)) jxi = jx ax + ai
2
logo (M + (a)) = M + (a), assim pode ser veri…cado por absurdo que M + (a) não
tem operação reversa: se um operador M +1 (a) existir, teríamos
2
M +1 (a) (M + (a)) = M +1 (a)M + (a)
o que implicaria
M + (a) = I
que é absurdo.
1.5. Operação AND. Comparando as matrizes (??), (??) e (??), vemos que
as diferenças nas duas operações lógicas estão nas diferentes posições na matriz do
algarismo 1. Assim como no caso (??) de…nimos o operador unário parametrizado
M (a) = aI + a ( +Z )
e veri…camos que
M (a) j0i = [aI + a ( + Z )] j0i = a j0i + a j0i = j0i
M (a) j1i = [aI + a ( + Z )] j1i = a j1i + a j0i = jai ;
e reescrevemos M (0) jxi = j0i, M (1) jxi = jxi ou de forma mais geral
M (a) jxi = jaxi :
liv 4. OPERAÇÕES LÓGICAS (SALOM ON)

Notamos que
2
(M (a)) jxi = jaxi
o rótulo é resultado de uma operação clássica AND se o parâmetro a for associado
a um bit de controle. Repetindo os mesmos passos como no caso da porta OR, o
operador associado á porta AND escreve-se,
AN D 12 = M (Z +;1 ) = Z +;1 I 2 + (I 1 Z +;1 ) ( ;2 +Z ;2 ) ;

que atua sobre dois Cbits, o primeiro de controle e o segundo como sendo o Cbit
alvo,
AN D 12 jx1 ; x2 i = jx1 i [x1 I 2 + (1 x1 ) ( ;2 +Z ;2 )] jx2 i = jx1 ; x1 x2 i :
2
Também neste caso constata-s a porta AND não é invertível pois (M (a)) =
M (a).
1.6. Porta de Fredkin.
1.7. Porta Hadamard (unária). Uma outra porta de 1 Qbit, largamente
utilizada, é a porta Hadamard H, de…nida pelo operador unário
1 1 1
(1.31) H=p
2 1 1
É um uma operação reversível que transforma um Cbit em um Qbit e vice-versa.
Aplicando H nos vetores na base computacional obtém-se (aqui usa-se a convenção
j0i = 10 e j1i = 01 ) (???????????????)
1
(1.32) H j0i = p (j0i + j1i);
2

1
(1.33) H j1i = p (j0i j1i);
2
que é uma superposição dos estados j0i e j1i, e isto pode ser escrito de forma
genérica como
1 x
H jxi = p (( 1) jxi + jxi)
2
Aplicando o operador H em cada Qbit de um registrador com 2 Qbits, inicialmente
no estado j00i, ele é transformado

2
j00i = H j0i H j0i
H
1 1
(1.34) = p (j0i + j1i) p (j0i + j1i)
2 2
1
(1.35) = (j00i + j01i + j10i + j11i):
2
Generalizando para estados com n Qbit, obtemos:

n 1
1 X
n
n n 1
(1.36) H j0 0i = (H j0i) = p (j0i + j1i) =p jii
2 2n i=0
Aplicando H em um estado de superposição arbitrário j i = j0i + j1i ;
obtém-se a superposição
1. AS OPERAÇÕES LÓGICAS QUÂNTICAS lv

(1.37) H j i = p (j0i + j1i) + p (j0i j1i);


2 2

ou então em j i = jxi + jxi

1 1
Hj i = p (( 1)x jxi + jxi) + p (( 1)x jxi + jxi)
2 2
1 1
(1.38) = p (( 1)x + ) jxi + p x
+ ( 1) jxi ;
2 2

note-se que neste caso os coe…cinetes de jxi e jxi são modi…cados.

1.8. Porta S. A matriz unitária associada à porta S é

1 0
(1.39) S=
0 i

é também uma operação unária. Aplicando S em um estado genérico j i = j0i +


j1i obtém-se

(1.40) Sj i= j0i + i j1i ;

que introduz uma diferença de fase =2 na superposição. Note que, diferentemente


do que acontece com a porta de Hadamard, se for feita uma medida do estado S j i,
as probabilidades de se obter os estados j0i ou j1i serão as mesmas que aquelas para
o estado j i. De forma genérica, para j i = jxi + jxi

Sj i= jxi + i jxi :

1.9. Porta T. A matriz unitária associada à porta T é

1 0
(1.41) T =
0 ei =4

Aqui também, aplicando T a um estado genérico j i = j0i + j1i, obtém-se

(1.42) Tj i= j0i + ei =4
j1i ;

que introduz uma fase =4 entre os estados da superposição. As probabilidades


de se obter os estados j0i ou j1i serão as mesmas, quando comparadas com uma
medição realizada sobre o j i. De forma genérica, para j i = jxi + jxi

Tj i= jxi + ei =4
jxi :
lvi 4. OPERAÇÕES LÓGICAS (SALOM ON)

1.10. Resumo. Em resumo, temos


Porta y2 = f (x1 ; x2 ; :::xN 1) invertível?
NOT 1 x sim
CNOT x1 2x1 x2 + x2 sim
SWAP sim
TOFFOLI x1 x2 2x1 x2 x3 + x3 parcialmente
OR x1 x1 x2 + x2 não
(1.43)
AND x1 x2 não
y1 = x1 x1 x3 + x2 x3 sim
FREDKIN
y2 = x2 x2 x3 + x1 x3 sim
HADAMARD sim*
S sim*
T sim*
(1.44) *Não há equivalente em em portas lógicas clássicas.
Veri…camosque é possível inserir todas as operações lógicas clássicas como op-
eradores atuando no espaço de Hilbert, como rótulos de bras e kets,e existem op-
eradores de transformação que atuam nos vetores do espaço de Hilbert que criam
nos Cbits os bits (rótulos) associados às operações lógicas clássicas, entretanto as
portas Hadamard, S e T não possem equivalente clássico.
Edited by Foxit PDF Editor
Copyright (c) by Foxit Software Company, 2004
For Evaluation Only.

CAPíTULO 5

Apêndice A: Estrutura matemática da Mecânica


Quântica

Aqui iremos apresentar os rudimentos da formulação matemática necessária


para a manipulação formal da mecânica quântica.

1. A. Espaço vetorial linear :


É um conjunto de elementos, vetores, as seguintes propriedades: Sejam ; e
x elementos deste conjunto, então,
i) + = +
ii) + ( + x) = ( + ) + x
iii) + 0 = 0 + =
iv) a( + ) = a + a
v) (a + b) = a + b
vi) a(b ) = (ab)
vii) 1 = 1=
viii) 0 = 0=0
Onde a; b, são números, ou escalares. O espaço vetorial é real ou complexo
dependendose os escalares são reais ou complexos.

Definition 1. O espaço euclidiano n-dimensional, onde:


= (x1 ; x2 ; :::; xn )
= (y1 ; y2 ; :::; yn )
Onde os xi e yi são números, com
+ = (x1 + y1 ; x2 + y2 ; :::; xn + yn )
e
a = (ax1 ; ax2 ; :::; axn )

Definition 2. O espaço l2 : O elementos são as seqüências in…nitas


(x1 ; x2 ; :::; xn ) tal que:
1
X 2
jxk j < 1
k=1

Example 1. As regras de soma e multiplicação são as mesmas do caso anterior.

lvii
lviii 5. APÊNDICE A: ESTRUTURA M ATEM ÁTICA DA M ECÂNICA QUÂNTICA

Definition 3. O conjunto de todas as funções cintínuas de uma var-


iável com soma e multiplicação de…nidas por:
( + )(x) = (x) + (x)
(a )(x) = a (x)
Definition 4. O espaço L2 : seus elementos todas as funções de variável real
x para as quais: Z
2
j (x)j dx < 1
D

com as propriedades de multiplicação e soma de…nidas como no exemplo ante-


rior: D é o domínio de x.
O espaço L2 : as funções vetoriais podem ser reais ou complexas dependendo
dos números ou.......das funções serem reais ou complexas.
Definition 5. De…nição 1: Uma seqüência de vetores 1; 2 ; :::; n é dita ser
linearmente independente se:
n
X
an n = 0
k=1
é possível se e somente se a1 = a2 = = an = 0
(1)
Definition 6. De…nição 2: Uma seqüência in…nita de vetores é lin-
earmente independente se cada subconjunto da seqüência for linearmente
independente.
Definition 7. De…nição 3: um espaço vetorial linar é de dimensão n
se contiver n vetores lenearmente independentes
De…nição 4: Diz-se que um conjunto de vetores 1 ; 2 ; :::; k varre
um espaço linear se cada vetor do espaço pode ser escrito como:
a1 1 + a2 2 + ::: + ak k

Definition 8. De…nição 5: Um conjunto de vetores 1 ; 2 ; :::; k é


uma base para um espaço linear se for linearmente independente e varre
o espaço.
Theorem 1. Teorema 1: Um espaço linear é de dimensão n se e
somente se tem uma base de n vetores.
Example 2. Exemplos:
i) o espaço euclidiano citado acima, os n vetores
1 = (1; 0; 0; :::; 0)
2 = (0; 1; 0; :::; 0)
..
.
n = (0; 0; 0; :::; 1)
fornece uma base
Example 3. ii) Os outros exemplos acima são espaços de dimensão in…nita.
2. B. PRODUTO INTERNO lix

1.0.1. Correspondências uma a uma entre um dado espaço de dimensão n e um


espaço euclidiano de dimensão n. Seja 1 ; 2 ; :::; n a base do espaço de dimensão
n. Então: um vetor deste espaço pode ser escrito com:
X
= ak k :
k

O conjunto de coe…cientes (a1 ; a2 ; :::; an ) é um vetor no espaço Euclidiano de di-


mensão n .Portanto existe uma correspondência entre os dois espaços, dado um
outro vetor X
= ck k ;
k
então somando os dois obtemos
X
+ = (ak + ck ) k
k

leva a um novo vetor no espaço Euclidiano


(a1 + c1 ; a2 + c2 ; :::; an + cn )
e X
b = bak k
k
leva ao vetor
(ba1 ; ba2 ; :::; ban )

2. B. Produto Interno

Definition 9. De…nição 1: Produto interno ou produto escalar para


um espaço linear é a atribuição de um escalar ( ; ) a cada par de vetores
; com as propriedades:
i) ( ; + x) = ( ; ) + ( ; x)
ii) ( ; a ) = a( ; )
iii) ( ; ) = ( ; )
iv) ( ; ) 0

Definition 10. De…nição 2: A norma ou comprimento do vetor é


de…nido por:
p
k k= ( ; )
Definition 11. De…nição 3: Dois vetores são ditos ortogonais se o
seu produto interno for nulo:
( ; )=0
Example 4. Exemplos: i) Para o espaço Euclidiano de dimensão n
o produto interno é:
n
X
( ; )= xk yk
k=1
lx 5. APÊNDICE A: ESTRUTURA M ATEM ÁTICA DA M ECÂNICA QUÂNTICA

para:
= (x1 ; x2 ; :::; xn )
= (y1 ; y2 ; :::; yn )
Example 5. ii) Para o espaço l2 o produto interno é dado por
1
X
( ; )= xk yk
k=1
e a exigência de que
1
X 2
jxk j < 1
k=1
que signi…ca que a norma k k seja …nita
Example 6. iii) Para o espaço L2 o produto interno é de…nido por
Z
( ; )= (x) (x)dx

e a exigência de que Z
2
j (x)j dx < 1
corresponde a uma norma …nita k k < 1:
Se Z
2
j (x) (x)j dx = 0
então (x) = (x):

Theorem 2. Teorema (desigualdade de Schwartz) O produto interno


de um espaço linear tem a propriedade:
j( ; )j k k k k
a igualdade vale se e forem linearmente dependentes: = :
Propriedades da norma:
i) k k 0 k k = 0 se =0
ii) ka k = jaj k k
iii)k + k k k + k k (desigualdade triangular)

Definition 12. De…nição: Vetores mutuamente ortogonais de norma


1, são ditos ortonormais. Seja o conjunto de vetores:
( 1; 2 ; :::; k ; :::)

este conjunto é ortogonal se:


( j; k) = jk
P
Quando um vetor é expandido numa base ortonormal,
P = k ak k os
coe…cientes são dados por: ak = ( k ; ) e = k ( k ; ) .
Um conjunto de vetores 1 ; 2 ; :::; n são não nulos e mutuamente ortog-
onais então eles são linearmente independentes:
3. C. O ESPAÇO DE HILBERT: lxi

Segue os escalares a1 ; a2 ; :::; an tal que:


Xn
ak k = 0
k=1
então
n
X
ak ( k; j) = (0; j) =0
k=1
n
X
0= ak kj = aj
k=1
onde todos os números aj são nulos.
Sejam:
X
= ak k
k
n
X
= bk k
k=1
X X X
( ; ) = ak bj ( k; j) = ak bj ij = ak bk
k k k

3. C. O espaço de Hilbert:

Definition 13. De…nição 1: Um conjunto de vetores é fechado se


para uma seqüência de vetores deste conjunto n ! (k nk ! 0
quando n ! 1), o vetor limite também está no conjunto.
Definition 14. De…nição 2: seqüência de Canchy: Uma seqüência
de vetores n é uma seqüência de Cauchy se k n m k quando m; n !
1. Toda seqüência de vetores que converge a um vetor limite é uma
seqüência de Cauchy: Se n ! então
k n mk = k( n ) ( m )k k n k+k m k!0
Definition 15. De…nição 3: Um espaço é dito completo se toda se-
qüência ou Cauchy de vetores converge a um vetor limite do espaço (as
seqüências são de Cauchy e o espaço é fechado):
lim k n mk =0
m;n!1

de…ne um vetor limite único do espaço tal que:


lim k n k=0
n!1

Definition 16. De…nição 4: Se um espaço linear tem de…nido um


produto e é compleo então é chamado espaço de Hilbert
Definition 17. De…nição 5: Um espaço de Hilbert é separável se
tiver uma base ortonormal que consiste de números de vetores (…nito ou
in…nito) contável, 1 ; 2 ; ::: (então toda base ortonormal é contável)
OBS: todo espaço de dimensão …nita é completo, vejamos:
lxii 5. APÊNDICE A: ESTRUTURA M ATEM ÁTICA DA M ECÂNICA QUÂNTICA

Seja 1; 2 ; :::; n a base do espaço de dimensão n, se a seqüência


n
X
am
k k
k=1

é de Cauchy, então
n
X
2 2
lim k m lk = am
k alk !0
m;l!1
k=1

logo cada seqüência de escalares am


k é de Cauchy pois

lim am
k alk = 0
m;l!1

para todo k .
Como o conjunto dos números complexos ou reais é completo cada seqüência
m
a
Pk tem um número limite ak . Portanto a seqüência n converge ao limite =
n n
k=1 ak k pois ak ! ak . Logo o espaço é completo:
Conclusion 1. Todo espaço de dimensão …nita é um espaço de Hilbert
separável.
Example 7. O espaço l2 é um espaço de Hilbert de dimensão in…nita
P1
a) k=1 jxk j < 1
b) O espaço é completo
lim k(xm
1 xn1 ; xm
2 xn2 ; :::)k ! 0
m;n!1

e
lim (xm m
1 ; x2 ; :::) = (x1 ; x2 ; :::) 2 l2
m!1

c) O espaço é separável, seus vetores de base (ortonormais) são

1 = (1; 0; 0; :::)
2 = (0; 1; 0; :::)
..
.
d) Cada vetor de l2 é uma continuação linear dos i;
1
X
= (x1 ; x2 ; :::) = xk k
k=n+1

e) A seqüência das somas parciais


n
X
n = xk k !
k=1

pois
1
X
n = xk k
k=n+1
Edited by Foxit PDF Editor
Copyright (c) by Foxit Software Company, 2004
For Evaluation Only.

3. C. O ESPAÇO DE HILBERT: lxiii

e
1
X 2
k nk = jxk j
k=n+1
1
X 2
lim k nk = lim jxk j ! 0
n!1 n!1
k=n+1
pois
1
X 2
jxk j < 1
k=n+1

Theorem 3. Teorema: qualquer espaço de Hilbert separável de di-


mensão in…nita pode ser identi…cado como l2.
Demonstração. Demonstração: Para cada vetor (x1 ; x2 ; :::) 2 l2 há
um vetor
X1
= xk k
k=1
do espaço de Hilbert separável varrido pelo vetor de base k, pois o espaço
de Hilbert é completo. A seqüência de somas
Xn
xn = xk k
k=1
é de Cauchy pois para m < n
n
X 2
lim kxn xm k = lim jxk j = 0
m;n!1 m;n!1
k=m+1
pois
1
X 2
jxk j < 1
k=1
Como o espaço é completo, a seqüência de Canchy
1
X
xn ! x = xk k
k=1

Example 8. ii) O espaço L2 de funções quadraticamente integráveis


é um espaço de Hilbert separável. Por exemplo, tomemos uma base orto-
normal em L2 (0; 1) com (0 x 1) formada pelo conjunto de funções:
1; cos 2 kx; sin 2 kx com k = 1; 2; 3; :::
De acordo com a teoria de Fourier se
Z 1
2
j (x)j dx < 1
0
então
1 1
p X p X
(x) = a0 + 2 ak cos 2 kx + 2 bk sin 2 kx
k=1 k=1
lxiv 5. APÊNDICE A: ESTRUTURA M ATEM ÁTICA DA M ECÂNICA QUÂNTICA

com
Z 1
a0 = (x)dx
0
p Z 1
ak = 2 cos 2 kx (x)dx
0
p Z 1
bk = 2 sin 2 kx (x)dx
0
a seqüência de…nida por
n n
p X p X
n (x) = a0 + 2 ax cos 2 kx + 2 bx sin 2 kx
k=1 k=1

consegue para :
Z 1
2
lim k n k = lim j (x) n (x)j dx = 0
n!1 n!1 0

Theorem 4. Teorema: Um subespaço de um espaço de Hilbert sepa-


rável é um espaço de Hilbert separável
Definition 18. De…nição 1: seja M um subespaço de um espaço
de Hilbert separável. O conjunto de todos os vetores que são ortogonais a
cada vetor em M é chamado complemento ortogonal M? de M. Se ;
2 M? , 2 M e a é um escalar, então:
( ; + ) = ( ; )+( ; )=0
( ; a ) = a( ; ) = 0
M? é um subespaço.
Se uma seqüência n de M? converge a , então para qualquer 2M
temos
( ; ) = lim ( n; )=0
n!1
portanto
2 M?
Seja 1 ; 2 ; :::; k ; ::: uma base ortonormal de M, então para qualquer
do espaço de Hilbert
X 2 2
j( k ; )j k k
k

é …lnito pois k k < 1. Como M é completo, então


X
M = ( k; ) k 2 M
k

Definition 19. De…nição 2: Seja o vetor M? = M , com


( k ; M? ) = 0 para os vetores da base ortonormal, k 2 M, Logo, =
?
M? + M ( M 2 M e M? 2 M ), segue então que
( k; )=( k; M)

para todo k e M é chamado de projeção de em M.


4. VETORES “KETS” E “BRA” lxv

Example 9. Exemplo: Considere o conjunto de vetores 0 ; 1 ; 2 ; :::;


1 ; 2 ; :::que formam uma base ortonormal no espaço de Hilbert separável.
Para o L2 (0; 1) isto corresponde a

0 (x) = 1
p
k (x) = 2 cos 2 kx
p
k (x) = 2 sin 2 kx

M é o espaço de todas as aplicações lineares


1
X
ak k
k=1

M? é o espaço de todas as aplicações lineares


1
X
bk k
k=1

Definition 20. De…nição 3: Dois subespaços M e N são ditos or-


togonais entre si se cada vetor em M é ortogonal em N .

Definition 21. De…nição 4: Sejam M1 ; M2 ; :::; Mk ; ::: subespaços


do espaços de Hilbert H.
PDizemos que H é soma direta destes subespaços,
H = M1 M2 ::: = k Mk se os subespaços são mutuamente ortogo-
nais e cada vetor de H é igual a soma de suas projeções nestes subespaços.

4. Vetores “kets” e “bra”

Definition 22. De…nição 1: Em HQ os vetores de um espaço vetorial


linear E são chamados “ket” e denotados por jui

Definition 23. De…nição 2: A todo espaço vetorial E pode-se asso-


ciar um espaço dual E x e os vetores deste espaço serão chamados de “bra”
e denotados por h j

O produto interno é denotado por h jui


A operação “y” leve um vetor do espaço E para o espaço E x e vice-versa
(correspondência isomór…ca)

(jui)y = huj ; (hvj)y = jvi

A dimensão do espaço dual E + é a mesma que a dimensão do espaço E.


A corresnpondência isomór…ca é antilinear: se jvi 2 E e

jvi = 1 ju1 i + 2 ju2 i

então
(jvi)y = hvj = 1 hu1 j + 2 hu2 j :
lxvi 5. APÊNDICE A: ESTRUTURA M ATEM ÁTICA DA M ECÂNICA QUÂNTICA

5. Índice de estado, índice de representação e função de onda


As funçoes de onda podem ser representadas em termos de preodutos de “bras”
e “kets”. Vamos diferenciar com rótulos de letras latinas os vetores de estado: j a i
jai e por rótulos de letras gregas os vetores de representação: h j i h jai
a ( ). Os vetores de representação j i de índice contínuo (espectro contíno) tem
norma in…nita não pertencedo ao espaço de Hilbert, mas a “auto diferencial”
Z +
1
0
j ; i =( ) 2 d 0

possui uma norma postiva de…nida:


Z + Z +
1 0 00 0 00
; j ; = d d j
0 00 0 00
mas j = ( ) logo
Z + 0
00 0 00 1 se < < +
d ( ) = 0
0 se não pertence ao intervalo
logo é necesário que = ;eé
1
; j ; = 1;
= 1;

nesta de…nição podemos considerar o lim !0 e a norma continua …nita:


lim kj ; ik < 1
!0

No caso mais geral, temos:


Z 2
j i = ( )j id
1

que pertence ao espaço de Hilbert.

5.1. Ortonormalidade e completeza.


Índice discreto: Vamos considerar um estado de base do espaço de Hilbert
espici…cado por seu conjunto de índices discretos: jn1 ; n2 ; :::i ,a condição
de ortonormalidade é dado por
hn1 ; n2 ; :::jn01 ; n02 ; :::i = n1 ;n01 n2 ;n02 :::

e a condição de completeza é dada por


X
^
1= jn1 ; n2 ; :::i hn1 ; n2 ; :::j
n1 ;n2 ;:::

Índice contínuo: Um estado da base é dado por j 1 ; 2 ; :::i. A condição de


ortonormalidade é:
0 0 0 0
1 ; 2 ; :::j 1 ; 2 ; ::: = ( 1 1) ( 2 2 ):::

e a relação de completeza é dada por


Z
^
1 = d 1 ; d 2 ; ::: j 1 ; 2 ; :::i h 1 ; 2 ; :::j
6. OPERADORES LINEARES lxvii

Example 10. Exemplo: Na representção das con…gurações j i o es-


pectro é contínuo: O operador posição é um observável, logo isto permite
escrever uma equação de autovalores.
^j i = j i
Q
Nesta representção o estado j i leva a um a f de onda h j i = ( ) e
^ j i = h j i = ( ). O operador posição é um número.
h jQ
Na representção da energia de estados ligados, os índices são discretos:
^ isto
jEn i : O observável físico é a energia representada pelo operador H,
permite escrever:
^ jEn i = En jEn i
H
nesta representação o estado j i leva as funções
hEn j i = (En ) = Cn
e

^ j i = En hEn j i = En (En ) = En Cn
hEn j H
É possível passar de uma representação a outra por uma transformação
X X
( )=h j i = h jEn i hEn j i = Cn h jEn i ;
n n

onde h jEm i é o produto escalar das duas repreentções, que pode ser
denotado por
h jEm i = 'Em ( )
Seja jpi a representação do momentum linear (contínua) que é observável,
logo:
P^ jpi = p jpi
hpj P^ j i = p hpj i = p (p)
A transformação de uma representação a outra é dada por:
Z Z
( ) = h j i = dp h jpi > hpj i = Cp 'p ( )dp
| {z }
=Cp

com 'p ( ) = h jpi e


1
'p ( ) = 1=2
eip =~
:
(2 ~)

6. Operadores lineares
6.1. Representação espectral de operadores.
Z
^
Q = j i h jd ;
X
H^ = jEm i Em hEm j ;
m
Z
P^ = dp jpi p hpj ;
lxviii 5. APÊNDICE A: ESTRUTURA M ATEM ÁTICA DA M ECÂNICA QUÂNTICA

Seja um vetor genérico jui 2 E, onde E é um espaço vetorial linear. O operador


é um ente matemático, que agindo sobre o vetor jui transforma-o num outro vetor
jvi 2 E
jvi = A^ jui :
A^ será um operador linear se:
1)
^ jui) = A^ jui
A(
sendo um número complexo, e
2)
^
A(jui + jvi) = A^ jui + A^ jvi
Se jui 6= 0 e jvi = 0 logo A^ = 0. Para A^ = 0 é necessário e su…ciente que:
huj A^ jui = 0
Dois operadores, A^ e B
^ são iguais se e só se para qualquer jui 2 E

huj A^ jui = huj B


^ jui :

Geralmente o produto de dois vetores não é comutativo:


^B
A( ^ jui) 6= B(
^ A^ jui)

e se a correspondência entre os vetores jui e jvi é recíproca:


jvi = A^ jui e ^ jvi
jui = B
então A^ e B
^ são um o inverso do outro:
^ = A^
B 1
ou A^ = B
^ 1

e satisfazem as equações
A^B
^ = ^1, ^ A^ = ^1
B
onde ^1 é o operador unidade.
O inverso do operador A^ (se existir) é denotado por A^ 1 e se os operadores A^ e
B^ possuem um inverso, o operador produto A^B ^ também possui um inverso (A^B)^ 1
com
(A^B)
^ 1=B ^ 1 A^ 1
pois (A^B)(
^ A^B)
^ 1
=^
1e
(A^B)(
^ A^B)
^ 1
= (A^B)
^ A^ 1 ^
B 1 ^B
= A( ^B
^ 1
)A^ 1
= (A^A^ 1
) = ^1:
Note-se que huj (A^ jvi) = (huj A)
^ jvi = huj A^ jvi são notações equivalentes, chamadas
elementos de matriz se jui e jvi são elementos de uma seqüência cmpleta de vetores.
Algumas propriedades dos bras e kets:
^ = (huj A)C
huj (C A) ^ = C huj A^ , onde C é um número complexo
hCuj A^ = C huj A^
Se S^ = A^ + B
^

S^ jui = A^ jui + B^ jui


huj S^ = huj A^ + huj B^
7. OPERADORES ADJUNTO E RELAÇÕES DE CONJUGAÇÃO lxix

(A^B)
^ jui = A(
^B ^ jui)
^ A)
huj (B ^ = (huj A)
^B ^

um tipo especial de operador é

A^ = jvi hwj
A^ jui = jvi hwjui
^
huj A = hujvi hwj
onde hwjui e hujvi são números complexos

7. Operadores adjunto e relações de conjugação

jui ! (jui)y = huj


A^ jui = jvi ! (jvi)y = (A^ jui)y
ou
hvj = huj A^y
O operador A^y é chamado conjugado hermitiano ou adjunto de A.
^ Se

A^y = 0 =) A^ = 0 e vice e versa


Propriedades:
a) huj Ay jvi = hvj A jui
b) (Ay )y = A
c) (cAy )y = cy A
d) (A + B)y = Ay + B y
e) (AB)y = B y Ay
f) (jui hvj)y = jvi huj
Demonstração da propriedade (e): De (a) temos huj (AB)y jvi = hvj AB jui =
(hvj A(B jui)
Agora chamemos B jui = jwi (hwj = huj B y ), assim temos de (a) que:
hvj A jui = hvj Ay jui = huj B y Ay jvi, logo (AB)y = B y Ay
Example 11. Exemplos:

(AB jui hvj C) ^ y = C y jvi huj (AB)y = C y jvi huj B y Ay


(A^B^ jui hvj C^ jwi)y = hwj C^ y jvi huj (AB)y = hwj C^ jvi huj B y Ay
(htj A^B
^ jui hvj C^ jwi)y = hwj C^ y jvi huj B y Ay jti :

7.1. Operadores auto adjunto ou hermitianos.

7.2. Operadores positivos-de…nidos.

7.3. Operadores unitários.


lxx 5. APÊNDICE A: ESTRUTURA M ATEM ÁTICA DA M ECÂNICA QUÂNTICA

^ é hermitiano se:
7.4. Operadores limitados (bounded). Um operador H
^ =H
H ^y

e um operador I^ é ant-hermitiano se

I^ = I^y

Qualquer operador A^ pode ser decomposto numa parte hermitiana e outra


anti-hermitiana
A^ = H
^ A + I^A

onde
^ ^y A^ A^y
H^A = A + A e I^A =
2 2
O produto de dois operadores hermitianos não é necessariamente hermitiano:
^ =H
Seja H ^+ e K
^ =K ^ + , logo (H
^ K)
^ +=K ^ +H^ + = KH que não é igul a HK,
a menos que H e K comutam entre si: [H; K] = 0, neste caso (HK)+ = HK:
O comutador [H; K] é anti-hermitiano, logo podem escrever
n o
H^K ^ = 1 H; ^ K^ + 1 [H; K]
2 2
n o
Onde H; ^ K^ =2 H^K ^ +K ^H^ =2 é a parte hermitiana [H; K]=2 a parte
anti-hermitiana.
O operador jai haj é hermitiano.
Os operadores jai haj e jbi hbj são hermitianos mas o produto jai haj jbi hbj não
é.
O operador hermitiano H ^ é positivo de…nido se huj H^ jui > 0 para qualquer
jui.
Por exemplo o operador jai haj é positivo de…nido.
O operador U ^ é unitário sekU j ik = k k para qualquer j i do espaço de
Hilbert:
p p
h j U y U j i = h j i logo U y U = ^1 =) U y = U 1 =) U ^ = ^1
A propriedade U U y = U y U = ^1 caracteriza o operador unitário.
Propriedades:
a) O produto de dois operadores unitários é um operador unitário:

W = UV
1 1 1 1
W = (U V ) = (V U ) = V y U y = (U V )y = W y

b) Os operadores unitários não modi…cam a norma de um vetor:

kjuik = kU juik

Demonstração. Demonstração:
q p p
U^ jui = huj U y U jui = huj U 1U jui = hujui = kjuik
8. OPERADORES LIM ITADOS lxxi

8. Operadores Limitados
De…nição 1: Um operador linear A^ é contínuo se A^ j n i ! A^ j i para
qualquer seqüência j n i que converge a um vetor limite j i
De…nição 2: Um operador linear A^ é limitado se existe um número positivo
b tal que A^ j i b k k para todo vetor j i :
Theorem 5. Teorema 1: Um operador linear é contínuo se e só se
for limitado.
Demonstração. Demonstração: Se A^ um operador limitado e n
uma seqüência tal que n ! , logo
A^ A^ n
^
= A( n) A^ k nk !0

Se A^ e B
^ são dois operadores limitados, então:
i) A^ + B^ kAk + kBk
ii) QA^ = jQj kAk
iii) A^B
^ kAk kBk

8.1. Operadores Inversos.

Definition 24. De…nição 1: Se diz que o operador linear A^ tem um


^ tal que B
operador inverso se existe um operador linear B ^ A^ = A^B
^ = ^1:
Theorem 6. Nenhum operador possui mais de um operador inverso.
Demonstração. Demonstração: Se B ^ e C^ são operadores inversos
^ (A^B
de A; ^ = A^C^ = ^1) então B^ C^ = B
^ A(
^B ^ C)^ = 0: Denota-se o
^ ^ 1
operador inverso de A por A :
Theorem 7. Teorema: Um operador linear tem um inverso se e só
se para cada vetor j i há um e somente um vetor j i tal que j i = A^ j i :
8.2. Operadores unitários.

Definition 25. De…nição 1: um operador linear U é unitário se pos-


sui um inverso e se kU j ik = kj ik para todo vetor j i
Todo operador unitárioé limitado e sua norma é 1
q p
kU j ik = h j U y U j i = h j i
Logo U y = U 1

Theorem 8. Teorema: Se U ^ é um operador unitário, o produto es-


calar é invariantepor transformações unitárias:
hU jU i = U yU >= U 1
U =h j i
Theorem 9. Teorema: Se U ^ é um operador unitário e o o conjunto
de vetores 1 ; 2 ; ::: é uma base ortonormal, o conjunto U 1 ; U 2 ; ::: é
também uma base ortonormal.
lxxii 5. APÊNDICE A: ESTRUTURA M ATEM ÁTICA DA M ECÂNICA QUÂNTICA

8.3. Operadores adjuntos e hermitianos.

Definition 26. De…nição 1: O adjunto Ay de um operador linear


limitado é de…niddo por
Ay = hA j i = h jA i
para todos os vetores j i e j i :
Theorem 10. Teorema: Se A^ é um operador linear limitado, Ay tam-
bém é limitado e Ay = kAk
Propriedades:
i) (Ay )y = A
ii) (A + B)y = Ay + B y
iii) (aA)+ = a Ay
iv) (AB)y = Ay B y
Para qualquer operador A e B limitados e um escalar a
Definition 27. De…nição 2: Um operador linear A é dito auto ad-
junto ou hermitiano se Ay = A :
h jAj i = hA j i = h jAj i
Theorem 11. Teorema: Se A é um operador linear limitado que tem
um inverso limitado, então Ay tem um inverso: (Ay ) 1 = (A 1 )y .
Theorem 12. Teorema: Um operador linear U é unitário se e so-
mente se U y U = ^
1 = UUy

9. Operadores não limitados


Em geral na mecânica quântica trabalha-se com operadores não limitados.
Example 12. Ex: no espaço L2 ( 1; 1) o operador ^ ^ )(x) = x (x) é
R1 D Q, (QE
^j i=
hermitiano se a integral h j Q (x)x (x)dx = Q ^ j converge e não é
1
2 R R
limitada pois Q^ j i = 1 jx (x)j2 dx pode ser maior que k k2 = 1 j (x)j2 dx.
1 1
R1 2
^
Há certos vetores para os quais Q não está de…nido, caso em que a integral 1 jx (x)j dx
diverge.
Theorem 13. Teorema: Se um operador A^ é de…nido para todos os vetores e se
( ; A ) = (A^ ; ) para todos os vetores j i e j i, então A^ é um operador limitado.
^

You might also like