You are on page 1of 6

Instituto Tecnolgico de Chihuahua ELECTRO 2001

125
RECONOCIMIENTO E IDENTIFICACION DE ROSTROS
USANDO ANALISIS DE LOS PRINCIPALES COMPONENTES

Rose Gmez Csar Enrique
Instituto Tecnolgico de Hermosillo
Departamento de Sistemas y Computacin
Avenida Tecnolgico S/N
Hermosillo, Sonora 83170
Tel. 2 60 65 00
crose@sahuaro.ith.mx



RESUMEN. La construccin de retratos hablados
tiene como objetivo la identificacin de personas
basada en las caractersticas del rostro, si no se
tiene un sistema computarizado, esta identificacin
puede ser muy laboriosa y tardada. Como
complemento del sistema constructor de rostros se
ha desarrollado un mdulo para el reconocimiento
de rostros que nos permite obtener las
caractersticas principales y posteriormente obtener
la identificacin de los rostros ms similares que se
encuentren en una base de datos criminalista.

1. INTRODUCCION.
Actualmente encontramos en el mercado
internacional diversos sistemas comerciales para la
creacin de retratos hablados as como para su
identificacin en una escena o en una base de
datos. Estos sistemas son muy costosos y tienen la
gran desventaja de que estn desarrollados para
grupos tnicos que no contienen las caractersticas
de la morfologa facial de la poblacin mexicana.
Entre 1993 y 1996 a peticin de la Procuradura
General de Justicia del Distrito Federal se
desarroll el proyecto La cara del mexicano por
parte del Instituto de Investigaciones
Antropolgicas de la UNAM [3]. El producto final
fue un acervo de imgenes con los rasgos ms
representativos de los rostros de los mexicanos. El
uso que inicialmente se le dio a este acervo fue la
elaboracin de retratos hablados por medio de
superposicin de imgenes con el programa Adobe
Photoshop, una solucin viable, pero que
consideramos no es lo ms adecuado.
Debido a lo anterior se ha desarrollado un sistema
de cmputo que permite la construccin de
retratos hablados y su posible identificacin dentro
de un conjunto de fotografas.
Ya que nuestro objetivo es obtener los rostros ms
similares a alguno en cuestin, tenemos que
considerar un mtodo para la representacin de los
objetos, en este caso; rostros, y el mecanismo para
la recuperacin basada en contenido.

2. ESTRUCTURA DEL SISTEMA
El sistema bsicamente est constituido de dos
subsistemas: el constructor de retratos hablados y
el subsistema de bsqueda por similaridad como se
muestra en la Figura 1.















Figura 1 Mdulos del Sistema

2.1. Constructor de retratos hablados.
sta herramienta es en esencia un editor grfico
especializado en utilizar los elementos de rostros
de La cara del mexicano para realizar imgenes
compuestas de rostros y obtener un retrato hablado.
La inclusin de los elementos del rostro se hace
mediante un control que permite seleccionar
rpidamente las imgenes deseadas, en este control
se encuentran todas las imgenes que se pueden
incluir en el retrato y se encuentran organizadas en
las siguientes categoras:

Constructor de Retratos
Hablados
Bsqueda por
Similaridad
Base de
Datos
Imgenes
Instituto Tecnolgico de Chihuahua ELECTRO 2001


126
Cara.
Orejas.
Tipo de calvicie o cabellera.
Pilosidad facial: bigotes y barbas.
Cejas.
Ojos.
Nariz.
Boca o labios.
Arrugas y lneas faciales.
Acn, verrugas, lunares, pecas y cicatrices.
Papadas.
Torus masculino.
Barbilla partida u hoyo en el mentn.
Accesorios: lentes, sombreros, aretes.
Tambin se encuentran clasificadas por gnero
(masculino o femenino). En la figura 2 se muestra
una imagen de este tipo.


Figura 2 Imagen de La cara del mexicano

Las imgenes al ser cargadas se colocan en la
posicin correcta de acuerdo al rostro, esto
resuelve una problemtica que se presenta en el
mtodo manual, que consiste en tener que
seleccionar las partes de la cara en un orden
establecido. Asimismo se pueden mover y ajustar
en su tamao y aspecto segn se requiera, los
cambios se pueden hacer por cada imagen o
formando grupos y estas acciones pueden
deshacerse si se cometen errores o se estaba
probando algn cambio. En la figura 3 se muestra
una secuencia de construccin de un retrato
hablado.
El sistema incluye algunas caractersticas de
edicin avanzada, las imgenes se sobreponen
usando un mezclado suave, el tono de la imagen se
puede cambiar para retratos con piel clara y oscura,
tambin se pueden hacer ligeras rotaciones y
recortes en las imgenes para ajustarlas a la cara.
El sistema permite al usuario visualizar en
pequeos recuadros todas las imgenes de una
misma categora, as el usuario y la persona que
est describiendo el retrato pueden elegir el
elemento del rostro que le sea ms adecuado.
Algo importante a destacar es la capacidad de
funcionamiento en dos monitores, esto hace
posible que el usuario tenga a su disposicin todos

Figura 3 Secuencia de construccin
del retrato hablado


los controles de edicin en su monitor, mientras la
persona que est describiendo el retrato puede ver
en el segundo monitor el retrato a pantalla
completa.
Los retratos creados pueden exportarse a los
formatos JPEG y BMP para su utilizacin en otras
aplicaciones, esta exportacin permite hacer
cambios en la compresin, calidad y el tamao de
las imgenes.

2.2. Bsqueda por similaridad
Mucho del trabajo en el reconocimiento de rostros
en computadora [1,2,4,8] se ha enfocado a la
deteccin de caractersticas individuales tales como
los ojos, nariz, boca y forma de la cabeza; y la
definicin de un modelo del rostro por la posicin,
tamao y relaciones entre estas caractersticas. Este
enfoque es un tanto complejo y para algunas
aplicaciones no es lo adecuado.
Algunos otros trabajos tienen un reconocimiento
automtico de rostros caracterizando un rostro por
un conjunto de parmetros geomtricos y
ejecutando el reconocimiento de patrones basado
en estos parmetros. En la actualidad existen una
gran diversidad de tendencias.
El enfoque usado en este proyecto considera la
representacin de la imagen extrayendo
caractersticas [5,6,7,9], estas caractersticas
pueden estar o no estar relacionadas a nuestra
nocin intuitiva de caractersticas del rostro tales
como ojos, nariz, boca y pelo.
En el lenguaje de la teora de la informacin, se
desea extraer la informacin relevante en una
Instituto Tecnolgico de Chihuahua ELECTRO 2001


127
imagen, codificarla tanto como sea posible y
comparar un rostro codificado en un conjunto de
modelos codificados de manera similar. Una
tendencia simple para extraer la informacin
contenida en una imagen de un rostro es capturar la
variacin en una coleccin de imgenes,
independientemente de cualquier juicio de
caractersticas y usar esta informacin para
codificar y comparar rostros individuales.
En trminos matemticos, se desea encontrar los
principales componentes de la distribucin de
rostros, o los eigenvectores de la matriz de
covarianza del conjunto de imgenes, tratando una
imagen como un punto (o vector) en un espacio de
muy alta dimensin. Los eigenvectores son
ordenados, cada uno contando para una diferente
cantidad de la variacin entre imgenes de los
rostros.
Estos eigenvectores pueden ser pensados como un
conjunto de caractersticas que juntos caracterizan
la variacin entre las imgenes. Cada imagen
contribuye ms o menos a cada eigenvector, de
modo que se puede desplegar el eigenvector como
un grupo de caras fantasmales a las cuales se les
llaman eigenrostros.
Cada rostro individual puede ser representado
exactamente en trminos de una combinacin
lineal de los eigenrostros. Cada rostro puede ser
tambin aproximado usando nicamente las
mejores eigenrostros, aquellos que tienen los
ms grandes eigenvalores y por lo tanto cuenta con
la mayor varianza dentro del conjunto de imgenes.
Los mejores M eigenrostros expande un subespacio
de M-dimensiones de todas las posibles imgenes.

3. REPRESENTACIONES DE ROSTROS
USANDO EL ANLISIS DE PRINCIPALES
COMPONENTES (PCA)
Un rostro es una imagen que puede ser vista como
un vector. Si el ancho y la altura de la imagen son
w y h pixeles respectivamente, el nmero de
componentes de este vector ser w*h. Cada pixel
est codificado por un componente del vector. La
construccin de este vector desde una imagen es
hecha por una simple concatenacin, las filas de la
imagen son localizadas una tras otra.
El vector del rostro pertenece a un espacio, le
llamamos el espacio de imagen, y es donde se
encuentran todas las imgenes cuya dimensin es
w*h pixeles. El espacio completo de la imagen no
es un espacio ptimo para la descripcin del rostro.
La idea es construir un espacio del rostro que
describa mejor los rostros. Los vectores bsicos de
este espacio del rostro son llamados principales
componentes.
La dimensin del espacio de imagen es w*h. Por
supuesto, no todos los pixeles del rostro son
relevantes y cada pxel depende de sus vecinos. De
modo que la dimensin del espacio del rostro es
menor que la dimensin del espacio de la imagen.
El objetivo del mtodo Anlisis de los Principales
Componentes (PCA) es reducir la dimensin de un
conjunto o espacio de modo que la nueva base
describa mejor los modelos tpicos del conjunto.
En nuestro caso los modelos son un conjunto de
rostros de entrenamiento.
Este mtodo involucra las siguientes operaciones
iniciales:
1.-Adquirir un conjunto inicial de imgenes (el
conjunto de entrenamiento).
2.- Calcular los eigenrostros del conjunto de
entrenamiento, manteniendo nicamente las M
imgenes que correspondan a los ms altos
eigenvalores. Estas M imgenes definen el espacio
del rostro. Cuando nuevos rostros son agregados,
los eigenrostros deben ser actualizados o
recalculados.
3.- Calcular la distribucin correspondiente en el
espacio de pesos de M dimensiones para un
individuo conocido, esto es, proyectando su rostro
en el espacio de rostros.

3.1. Clculo de los eigenrostros
Sea
1
,
2
,
3
,...
M
el conjunto de entrenamiento de
imgenes. El rostro promedio del conjunto es
definido como =(1/M)(
1
+
2
,+
3+
,...+
M
) donde
cada imagen del conjunto de entrenamiento difiere
del promedio por el vector
i
=
i
-.
El conjunto de entrenamiento es considerado para
el anlisis de los principales componentes, el cual
busca un conjunto de M vectores ortogonales,
n
,
los cuales describen la distribucin de los datos. El
k-simo vector,
k
, es elegido tal que

k
=[(
k
T

1
)
2
+(
k
T

2
)
2
+..+(
k
T

M
)
2
]/M

es un mximo, sujeto a

l
T

k
=
lk
={ 1, si l=k
0, de otra manera

Los vectores
k
y escalares
k
son los
eigenvectores y eigenvalores, respectivamente, de
la matriz de covarianza C,

Instituto Tecnolgico de Chihuahua ELECTRO 2001


128
C=(
1

1
T
+
2

2
T
++
M

M
T
)/M=AA
T

donde la matriz A=[
1

M
]. La matriz C, sin
embargo es N
2
por N
2
y determinar los N
2

eigenvectores y eigenvalores es una tarea intratable
para tamaos tpicos de imgenes. Se requiere un
mtodo computacional eficiente para encontrar
estos eigenvectores, el cual se describe a
continuacin:
Si el nmero de puntos de dato en el espacio
imagen es menor que la dimensin del espacio
(M < N
2
) habr nicamente M-1, en lugar de N
2

eigenvectores.

Considere los eigenvectores
i
de A
T
A tal que
A
T
A
i
=
i

i

Multiplicando ambos lados por A, tenemos

A A
T
A
i
=
i
A
i

Donde podemos ver que A
i
son los eigenvectores
de C = AA
T
.
Siguiendo este anlisis, construimos la matriz
L = A
T
A de tamao M*M, donde L
mm
=
m
T

m
y
encuentra los M eigenvectores
l
de L. Estos
vectores determinan combinaciones lineales del
conjunto de entrenamiento para formar los
eigenrostros
l
.

l
= (
l1

1
+
l2

2
+....+
lM

M
) para l=1 hasta M.

4. PROCESO DE IDENTIFICACIN
Una vez que los eigenrostros han sido calculados,
el espacio del rostro ha sido poblado con rostros
conocidos. Usualmente estos rostros son tomados
del conjunto de entrenamiento. Cada rostro
conocido es transformado al espacio del rostro y
sus componentes almacenados en memoria.
En este punto el proceso de identificacin puede
iniciar. Este proceso es mostrado en la Figura 4.
Un rostro desconocido es presentado al sistema. El
rostro es identificado como el rostro ms cercano
en el espacio del rostro. Existen varios mtodos
para calcular la distancia entre vectores
multidimensionales. En este proyecto, una forma
de la distancia Euclidiana es usada.

5. NUESTROS RESULTADOS
Para probar nuestro sistema se ha usado una base
de datos con 336 imgenes, algunas de ellas se
repiten y las imgenes tienen un tamao en el
rango de 77 a 86 pixeles de ancho y 94 a 105
pixeles de largo, el lenguaje de programacin
usado es Java, se ejecut en una computadora
Pentium III, de 733 Mhz, con una memoria de 128
Mbytes, en la Tabla 1 se muestran resultados
obtenidos usando una imagen a buscar que
pertenece al mismo conjunto.

Tabla 1. Resultados
imagenes Conjunto de
entrenamiento
eigenrostros % xito
en la
bsqueda
336 112 30 100
336 84 30 100
336 84 20 100
336 84 10 100
336 84 5 100

La construccin de retratos hablados con el mtodo
manual es lenta y poco prctica, por lo tanto
nuestro desarrollo hace ms eficiente este proceso.
Adicionalmente el proceso de bsqueda junto con
el proceso de construccin de un retrato hablado es
de gran utilidad para las autoridades encargadas del
combate a la criminalidad.
Consideramos que las implicaciones y el impacto
social del sistema aqu expuesto son muy
importantes, ya que es una necesidad urgente de
optimizar los medios para el combate de la
delincuencia en nuestro estado y en el pas.

6. BIBLIOGRAFA
[1] Huang J., Gutta S., Wechsler H., Detection of
Human Faces Using Decision Trees, 2nd
International Conference on Automated Face and
Gesture Recognition
[2] Lawrence S., Lee Giles C., Chung Tos A.,
Back A.D., Face Recognition: A Convolutional
Neural Network Approach, IEEE Transactions on
Neural Networks, Special Issue on Neural
Networks and Pattern Recognition, Volume 8,
Number 1, pp 98-113,1997
[3] Link Karl Franz, Villanueva Mara Sagrado,
Quijada Jess Luy, Serrano Snchez Carlos, La
Cara del Mexicano. Manual de usuario y
referencia, Universidad Nacional Autnoma de
Mxico., 1996.
[4] Kruizinga P., Petkov N., Person identification
based on multiscale matching of cortical images,
Lecture Notes in Computer Science, Spinger
Verlag 1995, pp 420-427
[5] Pentland A.P., Moghaddam B., Starner T.,
View-Based and Modular Eigenspaces for Face
Instituto Tecnolgico de Chihuahua ELECTRO 2001


129
Recognition, IEEE Conference on Computer
Vision & Pattern Recognition, 1994
[6] Pentland A.P.,Picard R.W., Sclaroff S.,
Photobook: Contend-Based Manipulation of Image
Databases, International Journal of Computer
Vision, Fall 1995
[7] Romdhani S., Face Recognition Using
Principal Components Analysis, Technical Report,
University of Glasgow
[8] Samaria F., Fallside F., Face Identification
and Feature Extraction Using Hidden Markov
Models, Cambridge University Engineering
Department
[9] Turk M.A., Pentland A.P., Eigenfaces for
Recognition, Journal of Cognitive Neuroscience,
3(1); 71-86, 1991
Figura 4 Proceso de Identificacin



Instituto Tecnolgico de Chihuahua ELECTRO 2001


130

You might also like