Professional Documents
Culture Documents
Tese de Doutorado
Rio de Janeiro
Agosto de 2012
Julio Csar lvarez Iglesias
Ficha Catalogrfica
lvarez Iglesias, Julio Csar
Inclui bibliografia
CDD: 620.11
Agradecimentos
Palavras-chave
Minrio de Ferro; Cristais de Hematita; Microscopia Digital;
Anlise de Imagens; Classificao; Microscopia de Luz Polarizada.
Abstract
Keywords
Iron Ore; Hematite Crystals; Digital Microscopy; Image Analysis;
Classification; Polarized Light Microscopy.
Sumrio
1 Introduo 12
2 Reviso Bibliogrfica 16
2.1 Minrio de Ferro 16
2.1.1 Hematita 20
2.2 Microscopia Digital 23
2.2.1 Polarizao da Luz 25
2.3 Processamento e Anlise Digital de Imagens 31
2.3.1 Pr-processamento 32
2.3.1.1 Registro de imagem 32
2.3.1.2 Delineao 35
2.3.1.3 Filtro Mediana 37
2.3.2 Tcnicas de segmentao 39
2.3.2.1 Limiarizao 40
2.3.2.2 Segmentao por Contornos 42
2.3.2.3 Crescimento de Regies 43
2.3.3 Ps-processamento 45
2.3.3.1 Operaes Lgicas 45
2.3.3.2 Operaes Morfolgicas 48
2.3.4 Extrao de Atributos 55
2.3.5 Reconhecimento e Classificao 61
2.3.5.1 Conjunto de treinamento 64
2.3.5.2 Conjunto de caractersticas 64
2.3.5.3 Classificadores 65
Referncias bibliogrficas 72
2.1
Minrio de Ferro
O ferro um dos elementos mais abundantes da crosta terrestre (o
segundo metal, com aproximadamente 4,2%) e matria-prima fundamental
para a indstria.
O maior desenvolvimento de formao ferrfera ocorreu no perodo Pr-
cambriano tardio da era Proterozica. Estas formaes ocorreram nas rochas
sedimentares do tipo Formaes Ferrferas Bandadas (BIF - Banded Iron
Formation).(15, 16) As BIF esto compostas por grandes depsitos de camadas
ricas em ferro, alternando com camadas ricas em silcio. Elas representam os
maiores depsitos de minrio de ferro do planeta.(17)
Os maiores depsitos de minrio de ferro, no Brasil, so praticamente
todos do tipo hemattico, com altos teores de ferro.(18) As reservas medidas
e indicadas de minrio de ferro no Brasil alcanam 29 bilhes de toneladas
(Tabela 2.1), situando o pas em segundo lugar em relao s reservas mundiais,
de 166 bilhes de toneladas.(19)
Entretanto, em termos de ferro contido, as reservas brasileiras tm teor
mdio muito alto (aproximadamente 55%) e, embora continue em segundo, fica
muito mais prximo do primeiro lugar internacional. Esse fato ocorre devido ao
alto teor de ferro encontrado nas hematitas (60% a 67% de ferro), predominante
no Par, e itabirito (50% a 60% de ferro), predominante em Minas Gerais.(20)
Se tambm so consideradas as reservas inferidas, o Brasil aumenta
significativamente o seu potencial, totalizando 73,7 bilhes de toneladas de
minrio de ferro.(21) Por sua vez, se for considerado que a geologia do territrio
brasileiro pouco conhecida, quando comparada com a quantidade e qualidade
dos estudos geolgicos de outros pases com tradio mineral como o Canad,
Captulo 2. Reviso Bibliogrfica 17
Tabela 2.1: Reservas mundiais de minrio de ferro no ano 2011 (106 t).(19)
Pases RM RM [%] RC RC [%]
PM 1060 1060 1080 1060 1340 1540 1712 1900 2200 2240 2400
PB 212 237 214 264 262 278 317 350 351 331 372
PB [%] 20,0 22,0 19,8 22,7 19,5 18,0 18,5 18,4 15,9 14,8 15,5
CM 2 2 2 2 2 2 2 2 2 2 2
EB 157 156 167 175 211 224 242 269 282 266 311
EB [%] 74,0 65,8 78,0 66,3 80,5 80,6 76,3 76,8 80,3 80,4 83,6
PM: Produo Mundial; PB: Produo Brasileira; CM: Colocao Mundial; EB: Exportao Brasileira
2.1.1
Hematita
A hematita o mineral de ferro mais importante devido a sua alta
ocorrncia em vrios tipos de rochas e suas origens diversas.(30) A composio
qumica deste mineral Fe2 O3 , com uma frao mssica em ferro de 69,9% e
uma frao mssica em oxignio de 30,1%.(31)
Este mineral pode ser encontrado com diferentes morfologias (Ta-
bela 2.4), como, por exemplo, microcristalina, lobular, granular ou lamelar.
A hematita tambm pode ser encontrada com hbito de magnetita formando
uma fase mista chamada de martita.(2, 14) Estas morfologias esto relaciona-
das a uma condio de cristalizao diferenciada, que poder ter influncia no
seu processamento.(26)
O nome hematita vem do grego haima que significa sangue. Como pode
ser observado na Figura 2.2a e Figura 2.2b a cor da hematita varia do vermelho-
sangue at o preto com forte brilho metlico. Por sua vez, na Figura 2.2c,
pode ser observado que seu arranjo atmico trigonal-hexagonal (32/m), com
parmetros de a = 5, 034 e de c = 13, 752 e grupo espacial R3c.(4, 31) Esta
estrutura hexagonal pode ser observada facilmente no mineral como mostra a
Figura 2.2b.
A hematita tambm pode ser indexada no sistema rombodrico, cuja
cela unitria seria atr = 5, 427 e = 55, 3 , de tal forma que existem
camadas de oxignio rodeando tomos de ferro formando octaedros ligados
pelas faces, conforme mostrado na Figura 2.2d. Esta estrutura consiste de
um empacotamento denso de planos de oxignio empilhados na repetio
ABAB ao longo da direo [001] (planos de ons paralelos ao plano (001))
com os tomos de Fe ocupando as posies octadricas. Dois teros dos stios
octaedrais esto ocupados por ons F e3+ que so arranjados regularmente com
dois stios preenchidos seguidos por um stio vacante na direo [001] formando
anis sxtuplos.(4, 32)
O arranjo de ctions produz pares de octaedros F e(O)6 . Cada octaedro
compartilha uma face com um octaedro da camada adjacente. Assim, a
estrutura real de hematita distorcida devido repulso dos tomos de Fe
presentes nos octaedros que partilham a face. Os tomos de Fe, ento, se
situam mais prximos das faces no partilhadas (Figura 2.2d). A estrutura
tripla F e O3 F e influencia as propriedades magnticas da hematita que,
diferente da magnetita, um xido fracamente ferromagntico temperatura
Captulo 2. Reviso Bibliogrfica 21
Figura 2.2: Hematita: (a) e (b) Imagens de fragmentos do mineral; (c) Estru-
tura trigonal-hexagonal visualizando os planos; (d) Modelo de bolas e varetas
da cela unitria.(4, 31)
ambiente.(4, 33)
Existem relacionamentos estruturais entre certos planos na estrutura da
hematita e planos em outros xidos de ferro, especialmente com a magnetita
e a goethita (Tabela 2.5). H, por exemplo, um relacionamento entre o plano
(111) da magnetita e o plano (001) da hematita. Com isso algumas vezes pode-
se observar nucleao e crescimento de magnetita no plano (001) da hematita.
Do mesmo modo, como resultado da afinidade estrutural entre os planos (100)
da goethita e o plano (003) da hematita, pode ocorrer um crescimento epitaxial
de goethita na hematita.(4)
A hematita um material opaco no MLR, porm em lamelas muito finas
e em luz transmitida vermelha sangunea escura, e pode apresentar dicrosmo
de vermelho acastanhado a vermelho amarelado. Este mineral tem um coefi-
ciente de reflexo mdio de 25%-32% no ar.(34) Contudo, a propriedade tica
mais importante deste mineral para o presente trabalho sua birrefletncia
devido forte anisotropia que ele apresenta. Assim, sua reflexo e, conse-
quentemente, o seu brilho na imagem mudam com diferentes orientaes dos
cristais com relao ao plano de incidncia da luz.(5) Este efeito ainda pode
ser ampliado quando usada luz polarizada no MLR.
Captulo 2. Reviso Bibliogrfica 23
2.2
Microscopia Digital
Podemos definir a MD como a integrao entre o microscpio e o
computador, oferecendo automao do microscpio, aquisio e anlise digital
de imagens. Esta rea, alm de permitir a automao, fornece novos recursos
para a caracterizao microestrutural.(35)
Alguns sistemas totalmente controlados por software e com ambiente de
programao permitem uma automao completa.(36) Exemplos disto so:
. Troca de lentes;
. Autofoco;(40, 41)
Figura 2.3: Variao de brilho entre dois cristais adjacentes: (a) Imagem em
campo claro; (b) Imagem com polarizao de um mesmo campo.(65)
quase no pode ser observada uma diferena de brilho, embora na imagem com
polarizao a diferena de brilho entre esses mesmos cristais seja muito alta.
Assim, fica evidente a importncia da luz polarizada, no mbito da microsco-
pia tica da luz refletida, para identificar cristais de hematita em minrios de
ferro.
2.2.1
Polarizao da Luz
A luz pode ser tratada como uma onda eletromagntica transversal, ou
seja, os vetores intensidade do campo eltrico (E) ~ e intensidade do campo
magntico (H)
~ so ortogonais entre si. A luz vibra no s num plano, mas em
todos os planos simultaneamente, portanto h planos de ondas em todos os
ngulos (Figura 2.4). Este tipo de luz conhecida como luz natural ou luz no
polarizada.(66)
A luz polarizada, diferente da luz natural, vibra num plano s (plano
de polarizao) e o os vetores E ~ e H~ so normais direo de propagao
como mostra a Figura 2.5. Isto pode ser demostrado atravs das equaes de
Maxwell onde, aps algumas consideraes e simplificaes, pode-se chegar s
seguintes equaes de ondas:
~ = 0 0 2 ~
2 E E (2-1)
t2
2
~ = 0 0 H
2 H ~ (2-2)
t2
~ =E
E ~x + E
~y (2-3)
~ =H
H ~x + H~y (2-4)
~ = E0x x exp[i(~k~z wt)] + E0y y exp[i(~k~z wt)]
E (2-5)
~ = H0x x exp[i(~k~z wt)] + H0y y exp[i(~k~z wt)]
H (2-6)
~ = (E0x x + E0y y) exp[i(~k~z wt)]
E (2-7)
onde w
k
=c= 1
0 0
(c a velocidade da luz no vcuo, k o mdulo do vetor
Captulo 2. Reviso Bibliogrfica 27
Figura 2.6: Propagao de uma onda com polarizao circular. Neste caso s foi
representada a intensidade do campo eltrico para facilitar a visualizao.(69)
~ =E
E ~x + E
~y (2-12)
~ =H
H ~x + H~y (2-13)
~ = E0 x exp[i(~k~z wt)] + E0 y exp[i(~k~z wt + /2)]
E (2-14)
~ = H0 x exp[i(~k~z wt)] + H0 y exp[i(~k~z wt + /2)]
H (2-15)
Figura 2.7: Variao de brilho entre cristais adjacentes: (a) Imagem em campo
claro; (b) Imagem com polarizao linear; (c) Imagem com polarizao circular,
de um mesmo campo.
2.3
Processamento e Anlise Digital de Imagens
O Processamento Digital de Imagens (PDI) uma tcnica que utiliza
operaes matemticas para alterar os valores dos pixels de uma imagem di-
gital, modificando-a para facilitar sua visualizao e anlise. Por sua vez, a
Anlise Digital de Imagens (ADI) consiste na extrao e tratamento de dados
quantitativos de imagens digitais. Deste modo, utiliza-se o termo Processa-
mento e Anlise Digital de Imagens (PADI) para englobar as duas tcnicas
anteriores.(72)
A Figura 2.8 apresenta a sequncia padro de PADI.(35, 52, 72, 73) Esta
sequncia est dividida em trs blocos bsicos:
2.3.1
Pr-processamento
A etapa de pr-processamento o primeiro passo depois da aquisio da
imagem. Esta etapa tem como objetivo melhorar a qualidade da imagem, seja
corrigindo defeitos gerados durante a aquisio ou seja realando detalhes de
interesse especfico.
2.3.1.1
Registro de imagem
A primeira coisa a se fazer quando vrias imagens de um mesmo campo
so capturadas com diferentes sensores ou com um mesmo sensor, porm sob
diferentes condies de captura, um registro espacial das mesmas.(75) O
registro um importante passo, no pr-processamento, a fim de criar imagens
geometricamente iguais com uma coerncia pixel a pixel.
O registro de imagem normalmente utilizado em sensoriamento remoto,
na medicina, na cartografia, em processamento digital de imagens, entre outras.
Durante as ltimas dcadas, os dispositivos de aquisio de imagens passaram
por um rpido desenvolvimento. Assim, uma crescente e diversa quantidade de
imagens estavam sendo obtidas, invocando pesquisas sobre registro automtico
Captulo 2. Reviso Bibliogrfica 33
. Translao;
. Rotao;
. Escala;
. Paralelismo;
. Projeo e;
2.3.1.2
Delineao
Outra operao comum de pr-processamento a delineao. Imagens
obtidas por microscopia tica apresentam valores de tonalidades intermedi-
rios nas bordas dos objetos, devido a restries de resoluo do sistema de
formao da imagem. Assim, as fronteiras dos objetos em lugar de serem uma
linha de transio abrupta passam a ser uma faixa de transio suave entre
as tonalidades vizinhas.(87) Isto traz como consequncia que, na hora de seg-
mentar os objetos, seja gerada uma fase espria em forma de "halo"ao redor
dos objetos. Este fenmeno conhecido como "efeito halo"e dificulta o correto
reconhecimento de regies numa imagem.(52)
Este problema comumente reduzido utilizando uma tcnica de deline-
ao. A delineao no mais que um filtro inteligente que varre a imagem
Captulo 2. Reviso Bibliogrfica 36
Figura 2.11: Funo de transformao para o realce do brilho nas bordas dos
objetos.(88)
Figura 2.12: Delineao: (a) Imagem original, seu histograma e uma viso
ampliada da regio demarcada em vermelho; (b) Imagem delineada, seu
histograma e a ampliao da mesma regio demarcada em vermelho.(74)
2.3.1.3
Filtro Mediana
Os rudos aleatrios aparecem com muita frequncia nas imagens. Estes
rudos podem ser gerados por mal funcionamento dos dispositivos de captura
ou por falta de iluminao.(89) Os pixels corrompidos ou so alterados para
o valor mximo da tonalidade, ou tm s alguns bits alterados, causando uma
diferena brusca de tons entre estes pixels e seus vizinhos. Quando os pixels
so alternadamente modificados para 0 ou o mximo (255 em imagens de 8
bit), este rudo chamado de rudo sal-e-pimenta, devido a sua aparncia.
Para este tipo de rudo o filtro mais eficiente o filtro mediana.(90) A
mediana, alm de eliminar eficientemente o rudo aleatrio, preserva o contorno
dos objetos da imagem.(91) Portanto, este filtro de grande importncia
na etapa de pr-processamento ao eliminar defeitos da adquisio e assim
ajudando na segmentao.
Captulo 2. Reviso Bibliogrfica 38
Figura 2.14: Uso do filtro mediana: (a) Imagem esquemtica com rudo sal-e-
pimenta; (b) Imagem esquemtica com rudo reduzido pelo filtro mediana de
tamanho 3x3.(78)
Captulo 2. Reviso Bibliogrfica 39
2.3.2
Tcnicas de segmentao
Alguns psiclogos alemes no inicio do sculo XX, Khler, Wertheimer
e Kofftka, introduziram o princpio da segmentao. Eles mostraram que o
ser humano, no nvel da viso, efetua agrupamentos sobre o que ele percebe,
baseados na proximidade, similaridade, e continuidade.(93) Entende-se por
segmentao o processo de diviso de uma imagem em suas partes ou objetos
constituintes, sendo uma das tarefas mais difceis na anlise de imagens.(94)
A segmentao uma tarefa bsica no processo de anlise de imagens,
mas no fcil traduzir para o computador o sofisticado processo de seleo e
agrupamento realizado pela viso humana na identificao de regies semelhan-
tes. Vrias dificuldades esto presentes nesse processo como a complexidade
da textura, a irregularidade da iluminao e as imprecises das regies das
bordas. O problema de segmentao torna-se particularmente difcil devido
textura da imagem. Mtodos de agrupamento baseados na cor podem alcanar
resultados satisfatrios quando as regies que se deseja segmentar so homo-
gneas. Porm, cenas naturais so complexas pela riqueza de variaes tonais
e texturas presentes.(95)
A segmentao de imagens tem sido um problema amplamente discu-
tido no campo de anlise de imagens digitais. Existem diversas tcnicas de
segmentao, dentre as quais se encontram:
(iv) Entre outras, tais como watershed, segmentao por textura, segmenta-
o por entropia, etc.(103, 104, 105, 106, 107)
2.3.2.1
Limiarizao
A tcnica de segmentao mais simples e a mais utilizada a segmentao
por faixa tonal, tambm chamada limiarizao ou thresholding. A limiarizao
usa o tom dos pixels para separar objetos (regies de pixels contguos com tons
dentro de uma faixa tonal delimitada) de outros usando um limiar ou tom de
corte.(72) Este mtodo implementado de forma interativa na maior parte das
vezes, porm alguns autores tem se esforado por criar inovadores mtodos de
limiarizao automtica.(98, 108)
No caso de diferenar objetos de um fundo, utiliza-se a limiarizao
bimodal, a qual discrimina duas fases na imagem, o fundo e os objetos. Esta
segmentao parte da hiptese de que a imagem apresenta um histograma
bimodal e, portanto, que os objetos podem ser separados do fundo por uma
simples operao que compara o tom dos pixels da imagem com um valor
de limiar (L). Supondo que a imagem f (x, y) corresponda a um histograma
bimodal, ento a imagem segmentada g(x, y) seria definida como:
1 se (x, y) > L
g(x, y) = (2-26)
0 se (x, y) L
1 se Li < (x, y) Li+1
gi (x, y) = (2-27)
0 se L (x, y) > L
i i+1
i=1
2.3.2.2
Segmentao por Contornos
Um contorno uma mudana brusca da tonalidade entre duas regies
relativamente homogneas. Ele pode aparecer como uma sequncia de pontos,
uma linha, um segmento, uma curva ou uma forte variao do nvel de cinza
mdio.(88)
Uma das tcnicas de deteco de bordas mais usadas consiste no proces-
samento de uma imagem a partir de um operador de derivada local. Exemplos
destes operadores so o gradiente e o laplaciano, operadores de derivada de
primeira e segunda ordem, frequentemente utilizados nas tcnicas de deteco
de bordas.(88)
A segmentao por contornos simula o funcionamento da viso humana.
Ela detecta as bordas dos objetos, a partir das quais constri seus contornos,
considerando como objeto a regio dentro do contorno.(72)
Entre as tcnicas de segmentao por contornos, uma das mais conhecidas
a proposta por Canny.(100) Este autor desenvolveu um processo de deteco
de bordas a partir de critrios de quantificao de desempenho de operadores
de bordas conhecidos como os critrios de deteco e de localizao. Estes
critrios de desempenho ainda esto sujeitos ao critrio de resposta mltipla,
que corresponde ao fato de que deve existir, na sada do operador, uma nica
Captulo 2. Reviso Bibliogrfica 43
resposta para uma nica borda. Para que os critrios sejam aproximadamente
atendidos, Canny aproxima o operador timo, obtido a partir dos trs critrios
de desempenho, pela primeira derivada da funo Gaussiana. Em complemento
a este operador foram propostos dois processos conhecidos como:
2.3.2.3
Crescimento de Regies
Algoritmos de segmentao por crescimento de regies agrupam pixels
ou sub-regies em regies maiores, partindo de um conjunto de pontos iniciais
(sementes) que crescem anexando pixels ou regies adjacentes que possuam
propriedades similares, como, por exemplo, tom de cinza, textura ou cor.(110)
Porm, o que define o tipo de crescimento de regies o critrio de parada
Captulo 2. Reviso Bibliogrfica 44
n
I= (2-29)
[
Ri
i=1
critrios como intensidade dos tons de cinza, textura, cor, etc. Aqui, utilizada
a intensidade dos tons de cinza como exemplo. Ento pode-se dizer que:
2.3.3
Ps-processamento
Frequentemente o resultado da segmentao no to bom quanto
esperado, sendo necessrio aplicar rotinas de ps-processamento para corrigir
os defeitos recorrentes da segmentao. Estas rotinas generalmente se baseiam
na implementao de operaes lgicas e morfolgicas.
2.3.3.1
Operaes Lgicas
Na segmentao a imagem binarizada, ou seja, cada pixel que compe
a imagem ou bem branco (com valor 1 ou 255 dependendo do software), ou
bem preto (com valor 0). Assim, resulta fcil imaginar que operaes lgicas
Captulo 2. Reviso Bibliogrfica 46
AB=C (2-37)
Na Figura 2.21 pode ser observado como a operao XOR gera uma
imagem de sada onde unicamente so brancos aqueles pixels que eram brancos
em somente uma das imagens de entrada. Na prtica, o operador XOR calcula
a diferena entre as duas imagens binrias (no confundir com a operao de
subtrao).
Captulo 2. Reviso Bibliogrfica 48
2.3.3.2
Operaes Morfolgicas
A morfologia matemtica concentra seus esforos no estudo das estru-
turas geomtricas das entidades presentes numa imagem.(111) As operaes
morfolgicas podem ser aplicadas em vrias reas de processamento e anlise
de imagens, com objetivos to distintos como realce, filtragem, segmentao,
Captulo 2. Reviso Bibliogrfica 49
Ax = {c; c = a + x a A} (2-39)
B = {c; c = b b B} (2-40)
O complemento de A (Ac ):
Ac = {c; c
/ A} (2-41)
A B = {c; Bx A} (2-42)
contido em A.
Finalmente a dilatao de A por B (A B):
n h i o
A B = c; (B)x A A (2-43)
A B = (A B) B (2-44)
A B = (A B) B (2-45)
Xk = (Xk1 B) Ac (2-46)
Figura 2.24: Exemplo esquemtico do uso de MDE: (a) Imagem binria; (b)
Imagem MDE; (c) Eroso de passo 2.
Figura 2.25: Mtodo dos divisores de gua: (a) Imagem binria inicial; (b)
Imagem MDE; (c) Imagem sementes; (d) Imagem binria com os objetos
separados.
2.3.4
Extrao de Atributos
Na etapa de extrao de atributos onde fica mais marcada a diferena
entre processamento e anlise de imagem. Nesta etapa onde ocorre a extrao
da informao dos objetos da imagem. Alm disso, caractersticas dos objetos
e da imagem so medidas.(114) Existem basicamente duas classes de medidas:
. Contagem de objetos;
. Frao de rea;
. entre outras.
Este problema pode ser observado na Figura 2.26, onde uma imagem
binria tem dois objetos que se tocam (Figura 2.26a). Estes objetos so sepa-
rados em dois objetos diferentes (1 e 2) usando uma contagem de conectividade
4 (Figura 2.26b). Em contrapartida, o uso de uma conectividade 8 leva a con-
tagem de um objeto s (Figura 2.26c). A escolha de qual conectividade usar
vai depender somente do problema em questo.
No caso da rea total dos objetos, tambm uma medida fcil de se
implementar, j que ela se baseia na contagem dos pixels brancos na imagem
binria. Esta rea serve para calcular a frao de rea do campo ocupada por
objetos. Para isto, calcula-se a razo entre o nmero de pixels brancos (rea
total dos objetos) e o nmero total de pixels (rea da imagem) na imagem
binria. Como pode ser notado, a frao de rea do campo adimensional com
valores entre 0 e 1.
Da mesma forma, nesta etapa so usadas medidas de regio, tais como:
. rea;
. entre outras.
n
P
xi
CGx = i=1
Area
(2-48)
n
P
yi
CGy = i=1
Area
P =N+ 2Nd (2-49)
Fmin
RA = (2-50)
Fmax
Captulo 2. Reviso Bibliogrfica 59
4A
FFC = (2-51)
P2
que uma boa medida da suavidade dos contornos dos objetos, devido
a sua forte dependncia do permetro. Onde A a rea preenchida e P
o permetro obtido pela Equao (2-49). Caso se deseje um fator de forma
circular mais sensvel ao alongamento do objeto e menos dependente da
suavidade do contorno, ento basta substituir P 2 por (Fmax )2 , como:
4A
F F Cc = (2-52)
(Fmax )2
4A
F F Cm = (2-53)
P (Fmax )
e
Captulo 2. Reviso Bibliogrfica 60
16A2
F F Cg = (2-54)
P (Fmax )3
Pc
C= (2-55)
P
A
S= (2-56)
Ac
2.3.5
Reconhecimento e Classificao
A etapa de reconhecimento e classificao a etapa final da sequncia
padro de PADI. Durante essa etapa realizado o tratamento dos dados
quantitativos obtidos na etapa anterior, interpretando-os, de modo a fornecer
um resultado de mais alto nvel, similar ao processo de reconhecimento de
padres realizado pelo crebro humano.
Segundo o dicionrio Houaiss, a definio da palavra reconhecer
tomar conhecimento de novo ou em outra situao, distinguir os traos
caractersticos de algum ou algo; caracterizar, identificar, distinguir (algum
ou algo) por certos caracteres.(116) O reconhecimento pode-se acontecer por
identidade ou por semelhana. No reconhecimento por identidade um objeto,
previamente conhecido, identificado. Por outro lado, o reconhecimento por
semelhana ocorre quando um objeto identificado como membro de uma
classe atravs de traos caractersticos. Deste modo, o reconhecimento pode
ser visto como um processo de classificao.(30)
As tcnicas de reconhecimento de padres so usadas para classificar
objetos atravs de um conjunto de propriedades ou caractersticas comuns a
cada classe de objetos.(117) O reconhecimento de padres por computadores
parte importante da inteligncia artificial. Estes sistemas bem podem ser
Captulo 2. Reviso Bibliogrfica 62
usados por uma pessoa para restringir sua ateno a um conjunto de casos
selecionados pelo sistema, ou bem para automatizar completamente o processo
de tomada de deciso, sem necessidade de intervir pessoalmente.(30)
O crescimento acelerado e disponibilidade de capacidade computacional
tornam mais rpido o processamento de grandes conjuntos de dados, alm de
facilitar o uso de mtodos elaborados e variados para anlise e classificao des-
tes dados. Computadores, s vezes, so melhores classificadores que as pessoas,
devido a que eles no se distraem com variaes aleatrias de parmetros no
crticos e conseguem extrair comportamentos estatsticos significativos para
isolar grupos.(114)
Em contrapartida, as pessoas geralmente ainda so mais rpidas no
reconhecimento de padres que os computadores.(114) Ao mesmo tempo, a
quantidade de dados a serem processados vem aumentando com o tempo, o que
tem gerado tambm um aumento da demanda por melhorias no desempenho
das tcnicas de reconhecimento de padres, tanto em velocidade como em
exatido e custo.
Um padro pode ser descrito matematicamente como um vetor cujas
componentes so caractersticas numricas dos objetos de interesse, as quais
so obtidas por meio de um conjunto de observaes.(118, 119) O problema de
reconhecimento colocado como uma tarefa de classificao ou categorizao
dos padres.
Por outro lado, as classes so definidas como um conjunto de padres
semelhantes entre si. Estas classes podem ser identificadas como regies do
espao de caractersticas onde muito provvel encontrar pontos representa-
tivos dos objetos. Isto significa que quando so extradas as caractersticas de
um conjunto de objetos pertencentes mesma classe, os pontos representati-
vos destes no espao de caractersticas devem agrupar-se mantendo entre si
distncias menores do que aquelas que se medem em relao a objetos perten-
centes a outras classes. Desta forma so formados agrupamentos, aglomerados
ou clusters.(30)
Os sistemas de classificao so divididos, conforme a participao ou no
do usurio, em supervisionados ou no supervisionados (Figura 2.29).(119)
Os sistemas de classificao supervisionados so aqueles em que o usurio
define as classes rotulando objetos que lhe so apresentados. Neste caso, as
classes so conhecidas ou previamente determinadas pelo usurio do sistema
de classificao. Os sistemas de classificao no-supervisionados so aqueles
em que a semelhana entre os padres estabelecida pelo sistema, o qual
identifica quantas e quais so as classes. Este tipo de sistema usado quando
as classes so desconhecidas ou precisa-se de um sistema de classificao sem
Captulo 2. Reviso Bibliogrfica 63
a interveno do usurio.(52)
2.3.5.1
Conjunto de treinamento
O conjunto de treinamento um conjunto de objetos previamente iden-
tificado pelo usurio. Este conjunto de treinamento deve ser estatisticamente
grande, com o intuito de aumentar a preciso do classificador, alm de apre-
sentar grande variabilidade dentro de cada classe para assim poder garantir
uma boa representatividade.
Como poder ser observado mais na frente, o conjunto de treinamento
precisa crescer exponencialmente com o aumento da dimensionalidade do
espao de caractersticas.(120) Outros autores definem que o conjunto de
treinamento deve aumentar em dez vezes por classe, com o aumento da
dimensionalidade do espao de caractersticas.(119) Contudo, nem sempre
possvel obter mais objetos conhecidos para ampliar o conjunto de treinamento.
2.3.5.2
Conjunto de caractersticas
A escolha do conjunto de caractersticas feita a partir da observao
dos atributos que melhor representam as classes no conjunto de treinamento. O
conjunto de atributos que define o espao de caractersticas deve caracterizar
bem os objetos, agrupando os objetos similares e separando os distintos. Este
conjunto deve ser sensvel o bastante para descriminar todas as classes.
Raramente uma nica caracterstica separa mais de duas classes, sendo
geralmente utilizadas vrias caractersticas. Porm, um nmero de caracters-
ticas muito grande em relao ao tamanho do conjunto de treinamento pode
acarrear problemas de dimensionalidade. Um espao de caractersticas com di-
mensionalidade muito alta torna o sistema mais complexo, consumindo maior
tempo no treinamento e ainda podendo reduzir a capacidade de generaliza-
o do sistema.(121) Assim, de crucial importncia realizar uma cuidadosa
escolha do conjunto de caractersticas.
Na verdade, a alta dimensionalidade um problema bastante recorrente
no reconhecimento de padres, chegando a ser chamada de maldio da
dimensionalidade. Assim, vrias tcnicas foram desenvolvidas com o intuito
de reduzir a dimensionalidade do espao de caractersticas com a esperana de
obter problemas mais simples. Um exemplo disto a Anlise Discriminante
Linear (LDA).(120)
Fica claro que a dimensionalidade poderia ser reduzida de d dimenses
para 1 dimenso se for possvel projetar as d dimenses numa linha formando
clusters devidamente separados. Este exatamente o objetivo da anlise dis-
criminante linear, que serve de base para as tcnicas de Anlise Discriminante
Captulo 2. Reviso Bibliogrfica 65
2.3.5.3
Classificadores
Os classificadores so funes que utilizam como entrada os padres
desconhecidos, e como sada as classes a que estes padres provavelmente
pertencem. Os classificadores podem ser divididos em dois tipos principais:
os estatsticos (paramtricos e no paramtricos) e os conexionistas (redes
neurais).(52)
Os classificadores estatsticos no paramtricos so os mais simples. Eles
utilizam uma funo de distncia como medida de similaridade, atribuindo um
objeto desconhecido classe mais prxima dele no espao de caractersticas.
Dois dos classificadores no paramtricos comumente empregados so o de
Distncia Euclideana e o de Distncia de Mahalanobis.
Antes de entrar em detalhes acerca dos classificadores estatsticos,
sero definidas algumas nomenclaturas e conceitos a serem usados. Seja
w1 , w2 , ..., wW um padro de classe que contem algumas propriedades em co-
mum, onde W o nmero total de classes. Da mesma forma x um padro
de caractersticas, que no mais que um vetor de n componentes:
x1
x2
x= .. (2-57)
.
xn
ou seja,
Desta forma dij (x) > 0 para objetos pertencentes classe wi e dij (x) < 0
para objetos pertencentes classe wj . Tendo claro estes conceitos, pode-se
detalhar alguns classificadores de interesse.
O classificador de Distncia Euclideana, tambm conhecido como classi-
ficador de distncia mnima, consiste em primeiramente calcular a mdia da
classe wi :
1 X W
xi = xi (2-61)
Ni i=1
Di (x) =k x xi k (2-62)
ento:
Deste modo, o objeto ser atribudo classe mais prxima dele. Fazendo
uso da definio de funo discriminante e da Equao 2-63, aps algumas
simplificaes temos que:
Captulo 2. Reviso Bibliogrfica 67
1
di (x) = xT xi xTi xi (2-64)
2
1
dij (x) = xT (xi xj ) (xi xj )T (xi xj ) = 0 (2-65)
2
|x |
x = (2-66)
Di2 (x) = (x xi )T 1
i (x xi ) (2-67)
1 W
i = (x xi ) (x xi )T (2-68)
X
(Ni 1) i=1
W
P (wi ) = 1 (2-69)
X
i=1
W
p(x) = p(x|wi )P (wi ) (2-70)
X
i=1
p(x|wi )P (wi )
P (wi |x) = (2-71)
p(x)
[3] VIEIRA, C. B.; ROSIRE, C. A.; SESHADRI, V.; ASSIS, P. S.; COELHO,
L. H.; PENA, H. Q. Geometallurgical approach for quality control
of iron ores for agglomeration in iron and steel industry. In: IN-
TERNATIONAL SYMPOSIUM ON BENEFICIATION AGGLOMERATION
AND ANVIRONMENT ISBAN, p. 17, Bhubaneswar, ndia, 2000.
[6] PIRARD, E.; LEBICHOT, S. Image analysis of iron oxides under the
optical microscope. In: INTERNATIONAL CONGRESS ON APPLIED
MINERALOGY: DEVELOPMENTS IN SCIENCE AND TECHNOLOGY -
(ICAM 2004), p. 153156, guas de Lindia, 2004.
[7] DONSKOI, E.; SUTHERS, S. P.; FRADD, S. B.; YOUNG, J. M.; CAMP-
BELL, J. J.; RAYNLYN, T. D.; CLOUT, J. M. F. Utilization of optical
image analysis and automatic texture classification for iron ore
particle characterisation. Minerals Engineering, 20:461471, 2007.
[10] VIEIRA, C. B.; ROSIRE, C. A.; PENA, E. Q.; SESHADRI, V.; ASSIS, P.
S. Avaliao tcnica de minrios de ferro para sinterizao nas
siderrgicas e mineraes brasileiras: uma anlise crtica. Rem:
Revista Escola de Minas, 56 (2):97102, 2003.
[45] MCHUGH, S. White balance. White Balance Tutorial, 2012. Acesso em:
Abril de 2012.
[47] CARL ZEISS VISION GMBH. KS400, 2001. [software, v. 3.0]. Acesso em:
Abril de 2012.
[59] DONSKOI, E.; SUTHERS, S. P.; FRADD, S.B.; YOUNG, J. M.; CAMP-
BELL, J. J.; RAYNLYN, T.D.; CLOUT, J. M. F. Utilization of optical
image analysis and automatic texture classification for iron ore
particle characterisation. Minerals Engineering, 20 (5):461471, 2007.
[66] HECHT, E. Optics. Addison Wesley, New York (NY, USA), 4th edition,
2002.
[68] WIKIPEDIA. Linearly polarized light, 2012. Acesso em: Junho de 2012.
[86] FIJI-IMAGEJ. FIJI, 2012. [software, v.1.45b]. Acesso em: Abril de 2012.
[92] PRATT, W. K. Digital Image Processing. John Wiley & Sons, New
Jersey (NJ, USA), 4th edition, 2007.
[500] BARBOSA, P. F.; LAGOEIRO, L.; SCHOLZ, R.; GRAA, L.; ALVAREZ, G.
Electron backscattering diffraction (ebsd) as a tool to evaluate
the topotactic and epitactic growth of minerals: The example
of the magnetite and hematite. Microscopy and Microanalysis, 17
(2):408409, 2011.