You are on page 1of 294

Departamento de Estadstica e Investigacin Operativa

Aplicadas y Calidad

Control Estadstico de Procesos mediante


Anlisis Multivariante de Imgenes

Memoria para optar al ttulo de Doctor presentada por

Jos Manuel Prats Montalbn

y dirigida por

Alberto Jos Ferrer Riquelme

Valencia, 2005
Agradecimientos________________________________________________________

Agradecimientos

La verdad es que no s cmo empezar, con lo sencillo que parece. Pero


bueno, supongo que lo mejor es hacerlo directamente y sin ms. Desde
estas lneas quiero agradecer a todas las personas que han estado a mi
alrededor durante estos aos el apoyo e inters mostrado, y que me han
ayudado a realizar esta tesis.

En primer lugar, quiero acordarme aqu de mis Amigos, a los que dej
olvidados en los agradecimientos de mi Proyecto de Fin de Carrera,
espero que estas lneas sirvan para compensar aquella falta. Como podis
comprobar, esta vez s! Pero no slo por eso, sino por haber estado
preguntando e interesndose por este trabajo y su finalizacin. Y ms que
por esto, gracias por ser unos Amigos, es un autntico privilegio formar
parte de este grupo.

Tambin quiero dar las gracias a las profesoras Alcover, Calduch y


Vzquez porque, desde la sombra y sin hacer ruido, me han ayudado
realizando labores administrativas, docentes y, sobre todo, me han
apoyado en algunos momentos en que la realizacin de este trabajo se
haca realmente duro (gracias Rosa, M ngeles y Elena). Y al profesor
Vicente Chirivella, por llamar a la puerta, dar nimos y preguntar (si es
que no puede ser).

En cuanto a la labor propia de realizacin de la tesis, quiero agradecer a


los profesores Rafael Romero y Sebastin Balasch su amabilidad y ayuda
prestada en la parte de Diseo ptimo de Experimentos y de Regresin
Logstica. Asimismo, agradecer tambin la colaboracin prestada por
parte de los investigadores Enrique Molt y Jos Blasco desde el IVIA, y
por parte de los profesores Jos Miguel Valiente y Fernando Lpez del
DISCA; as como las labores de crtica realizadas por todos ellos, las

i
SPC mediante MIA____________________________________________________

cuales han servido sin duda alguna para que este trabajo tenga una mayor
consistencia.

Y me queda tal vez la parte ms fcil y a la vez ms difcil.

Durante la carrera nos ensean que hay que dar una solucin buena, no
necesariamente la mejor, pero s en tiempos cortos, prcticamente en
tiempo real, es lo que quiere la empresa: EFICIENCIA. La realizacin
de esta tesis me ha enseado (y sigo aprendiendo, lo juro) a trabajar de
otra manera. Y todo esto no hubiese sido posible sin mi director, una
persona exigente y que me ayuda a mejorar cada da. Por ello y por su
labor de revisin, crtica y conduccin de esta tesis, quiero agradecer
profundamente al profesor Alberto J. Ferrer Riquelme su trabajo y su
paciencia.

Para acabar, me queda el mbito ms personal.

A mis padres, porque siempre me lo han dado todo y ms, y a los que
nunca podr compensar (aunque hago todo lo que puedo). Sobran las
palabras, simplemente porque no las hay. Un beso muy fuerte.

Finalmente, si hay una persona que haya padecido los efectos de este
trabajo, sa es mi mujer. Desde aqu, quisiera dedicar todo este esfuerzo
y por tanto la realizacin de esta tesis doctoral a M ngeles, por haber
crecido juntos, por estar siempre ah, y por seguir adelante. Te quiero.

Jos Manuel Prats Montalbn

Valencia, junio de 2005

ii
Resumen______________________________________________________________

Resumen

La creciente competitividad durante los ltimos aos en los diversos


sectores industriales est obligando a las empresas a mejorar la eficiencia
y calidad de sus procesos para garantizar que sus productos satisfacen las
expectativas de sus clientes.

A fin de conseguir esta mejora en sus procesos, es necesario poder


disponer de informacin de los procesos que, adecuadamente procesada o
analizada, permita tomar decisiones sobre los mismos en tiempo real,
supliendo o complementando otros medios ms convencionales, tales
como sensores de temperatura, registros de variables de proceso a lo
largo del tiempo, de tensiones, etc.; e incluso permitiendo el registro de
informacin de un proceso que no podra llevarse a cabo a partir de los
medios convencionales mencionados. Tal sera el caso, por ejemplo, de
medidas relativas al nmero y dimetro de burbujas en superficie en un
proceso de separacin de un mineral, o el nmero de picadas en una
superficie metlica. Asimismo, se hace conveniente la introduccin de
nuevas metodologas que permitan conocer de manera aproximada, pero
sobre el 100% de la produccin, el valor de variables de calidad final que
en la mayora de los casos nicamente se pueden garantizar mediante la
aplicacin de ensayos destructivos o pruebas analticas sobre un nmero
pequeo y determinado de muestras del producto final.

Tradicionalmente, algunos procesos de inspeccin y control de la


adecuacin del producto final a los estndares de calidad se han llevado a
cabo mediante tcnicas de inspeccin visual, basadas en la experiencia de
operarios bien entrenados. La introduccin de cmaras en algunos
sectores industriales ha propiciado que las tcnicas de anlisis de
imgenes mejoren dichos procesos, sobre todo en aqullos en los que se
establecen comparaciones con un patrn bien definido, de carcter ms

iii
SPC mediante MIA____________________________________________________

bien determinista, a partir de la extraccin de caractersticas de la imagen


registrada.

El abaratamiento de la adquisicin de imgenes en color en los procesos


industriales ha ampliado y mejorado la posibilidad de controlar los
mismos a partir de la inspeccin visual automatizada de las primeras,
haciendo ms viables estas tcnicas desde un punto de vista econmico.
As, tomando una imagen en color que caracteriza el proceso en
condiciones normales de operacin, es posible crear un modelo que
acumule la mayor cantidad de informacin relevante posible y, a partir
del mismo, determinar si nuevas imgenes se adecuan o no al mismo.

De hecho, la introduccin de cmaras en color en las industrias ha


derivado en la aparicin de nuevas tcnicas desde finales de los aos 80
basadas en la compresin de la informacin subyacente en una imagen
mediante tcnicas de proyeccin sobre estructuras latentes, en lo que se
conoce como Anlisis Multivariante de Imgenes (Multivariate Image
Anlisis, MIA).

Estas tcnicas se muestran bastante potentes en situaciones donde existen


multitud de canales de color asociados a cada imagen registrada, es decir,
en su aplicacin a imgenes recogidas por medio de cmaras
multiespectrales, donde cada canal de color puede recoger informacin
de un nmero ms reducido de fenmenos y, por tanto, poder relacionar
unos pocos fenmenos de inters con unos pocos canales que los
caractericen.

Sin embargo, el coste de dichas cmaras multiespectrales hace que su


introduccin en entornos industriales no sea todava rentable
econmicamente. Por ello, el objetivo principal de esta tesis es explorar
la posibilidad de enriquecer la informacin efectiva que se puede aportar
en tiempo real a un proceso por medio de imgenes obtenidas a partir de
cmaras en color RGB.

Una manera de enriquecer la informacin proporcionada por estas


imgenes es incluir informacin de tipo textural, ya que sta suele ayudar
a caracterizar la imagen utilizada para crear el modelo, as como para
determinar la existencia de nuevas caractersticas o defectos presentes en
las nuevas imgenes.

iv
Resumen______________________________________________________________

As, mediante la integracin de la informacin textural, la estructura de


datos de las imgenes resulta ser de dimensin 4, asociada a tres tipos de
informacin de variacin natural: la informacin muestral, definida por la
estructura bidimensional de los pxeles, que constituyen los objetos que
se van a analizar; la informacin de carcter textural, formada por los
pxeles adyacentes al que constituye la muestra, y que forman la ventana
de vecindad; y la informacin de carcter espectral, formada por los
distintos canales de color a travs de los cuales se recoge la informacin
de este tipo. Desplegando esta estructura 4D a lo largo del modo de
variacin natural de las muestras, asociadas a los pxeles de la imagen, se
obtiene una estructura interna 3-way del tipo OVV (Objeto, Variable,
Variable), que puede ser analizada a partir de las metodologas de
desplegado de tipo Unfold-PCA o Unfold-PLS, o bien directamente a
partir de los modelos N-way, tales como PARAFAC, Tucker3 o N-PLS.

En esta tesis se ha trabajado con tres conjuntos de imgenes reales


procedentes de los sectores agrario, cermico y de produccin de piedra
artificial, as como con un conjunto de imgenes simuladas del sector
metalrgico. Las imgenes han sido estudiadas por medio de tres
estrategias diferentes, cuyos fines principales eran: mantener bajo control
estadstico un proceso, as como llevar a cabo una clasificacin de las
piezas producidas por medio de las imgenes registradas de las mismas;
detectar defectos inespecficos de cualquier tipo no conocidos a priori,
tales como rayas, manchas, etc., que pudiesen aparecer en las imgenes
como consecuencia de fallos en el proceso de produccin o deterioros
durante su manipulacin; y controlar el grado y distribucin espacial en
que una determinada caracterstica o defecto predefinido aparece en una
nueva imagen.

Con el fin de optimizar el proceso de clasificacin, se ha propuesto una


metodologa basada en el diseo de experimentos y el anlisis de
resultados mediante modelos de regresin logstica. Los resultados de la
aplicacin de dicha metodologa han revelado que, en funcin del
problema a analizar y del enfoque de clasificacin empleado, los niveles
de los factores que optimizan el porcentaje de acierto en la clasificacin
son diferentes. Esto pone de manifiesto la utilidad prctica de la
metodologa propuesta a la hora de optimizar el porcentaje de acierto en
la clasificacin en nuevos problemas.

v
SPC mediante MIA____________________________________________________

La estrategia de deteccin, localizacin y aislamiento de defectos


inespecficos, basada en la localizacin de los pxeles que superan los
lmites de los estadsticos T2 y SCR, ha derivado en la creacin de
imgenes que indican las zonas con anomalas, as como la naturaleza de
las mismas. De esta manera, es posible conocer la distribucin espacial
del defecto, y tener informacin adicional que permita establecer
distintos tipos de calificaciones finales de la pieza o proceso. Los
resultados obtenidos han puesto de manifiesto la utilidad de estos dos
grficos, que se muestran como potentes herramientas a la hora de
detectar desviaciones respecto de los estndares de calidad y la
localizacin de los defectos en la imagen original.

La ltima estrategia analizada consiste en, a partir de la compresin de


una imagen que presenta una caracterstica o defecto de inters en las
distintas componentes principales, ver cmo se agrupan los pxeles en
estas nuevas dimensiones, para despus, mediante la seleccin de las
distintas agrupaciones, determinar su situacin espacial en el espacio de
la imagen original, y controlar el grado en que dicha caracterstica o
defecto aparece en la imagen, con el objetivo final de determinar si dicho
grado o aquella distribucin son admisibles bajos los estndares de
calidad establecidos. Esto mismo se puede llevar a cabo a partir de
nuevas imgenes proyectadas sobre el modelo creado a partir de la
imagen patrn.

La revisin de las tcnicas y la experiencia adquirida han ayudado a


proponer una metodologa de anlisis, y han abierto un gran nmero de
lneas futuras de investigacin.

vi
Resumen______________________________________________________________

Resum

La creixent competitivitat durant els ltims anys en els diversos sectors


industrials est obligant a les empreses a millorar l'eficincia i qualitat
dels seus processos per a garantir que els seus productes satisfan les
expectatives dels seus clients.

A fi d'aconseguir esta millora en els seus processos, s necessari poder


disposar d'informaci dels processos que, adequadament processada o
analitzada, permeta prendre decisions sobre els mateixos en temps real,
suplint o complementant altres mitjans ms convencionals, com ara
sensors de temperatura, registres de variables de procs al llarg del
temps, de tensions, etc.; i incls permetent el registre d'informaci d'un
procs que no podria dur-se a terme a partir dels mitjans convencionals
mencionats. Tal seria el cas, per exemple, de mesures relatives al nmero
i dimetre de bambolles en superfcie en un procs de separaci d'un
mineral, o el nmero de picades en una superfcie metllica. Aix mateix,
es fa convenient la introducci de noves metodologies que permeten
conixer de manera aproximada, per sobre el 100% de la producci, el
valor de variables de qualitat final que en la majoria dels casos nicament
es poden garantir per mitj de l'aplicaci d'assajos destructius o proves
analtiques sobre un nmero xicotet i determinat de mostres del producte
final.

Tradicionalment, alguns processos d'inspecci i control de l'adequaci


del producte final als estndards de qualitat s'han dut a terme per mitj de
tcniques d'inspecci visual, basades en l'experincia d'operaris ben
entrenats. La introducci de cmeres en alguns sectors industrials ha
propiciat que les tcniques d'anlisi d'imatges milloren tals processos,
sobretot en aquells en qu s'establixen comparacions amb un patr ben
definit, de carcter ms prompte determinista, a partir de l'extracci de
caracterstiques de la imatge registrada.

vii
SPC mediante MIA____________________________________________________

L'abaratiment de l'adquisici d'imatges en color en els processos


industrials ha ampliat i millorat la possibilitat de controlar els mateixos a
partir de la inspecci visual automatitzada de les primeres, fent ms
viables estes tcniques des d'un punt de vista econmic. Aix, prenent
una imatge en color que caracteritza el procs en condicions normals
d'operaci, s possible crear un model que acumule la major quantitat
d'informaci rellevant possible i, a partir del mateix determinar si noves
imatges s'adeqen o no al mateix.

De fet, la introducci de cmeres en color en les indstries ha derivat en


l'aparici de noves tcniques des de finals dels anys 80 basades en la
compressi de la informaci subjacent en una imatge per mitj de
tcniques de projecci sobre estructures latents, en la qual cosa es coneix
com a Anlisi Multivariant d'Imatges (Multivariate Image Anlisi, MIA).

Estes tcniques es mostren prou potents en situacions on hi ha multitud


de canals de color associats a cada imatge registrada, s a dir, en la seua
aplicaci a imatges arreplegades per mitj de cmeres multiespectrales,
on cada canal de color pot arreplegar informaci d'un nmero ms redut
de fenmens i, per tant, poder relacionar uns pocs fenmens d'inters
amb uns pocs canals que els caracteritzen.

No obstant, el cost de les dites cmeres multiespectrales fa que la seua


introducci en entorns industrials no siga encara rendible
econmicament. Per aix, l'objectiu principal d'esta tesi s explorar la
possibilitat d'enriquir la informaci efectiva que es pot aportar en temps
real a un procs per mitj d'imatges obtingudes a partir de cmeres en
color RGB.

Una manera d'enriquir la informaci proporcionada per estes imatges s


incloure informaci de tipus textural, ja que esta sol ajudar a caracteritzar
la imatge utilitzada per a crear el model, aix com per a determinar
l'existncia de noves caracterstiques o defectes presents en les noves
imatges.

Aix, per mitj de la integraci de la informaci textural, l'estructura de


dades de les imatges resulta ser de dimensi 4, associada a tres tipus
d'informaci de variaci natural: la informaci mostral, definida per

viii
Resumen______________________________________________________________

l'estructura bidimensional dels pxels, que constituxen els objectes que


es van a analitzar; la informaci de carcter textural, formada pels pxels
adjacents al qu constitux la mostra, i que formen la finestra de venat; i
la informaci de carcter espectral, formada pels distints canals de color
a travs dels quals s'arreplega la informaci d'este tipus. Desplegant esta
estructura 4D al llarg del mode de variaci natural de les mostres,
associades als pxels de la imatge, s'obt una estructura interna 3-way del
tipus OVV (Objecte, Variable, Variable), que pot ser analitzada a partir
de les metodologies de desplegat de tipus Unfold-PCA o Unfold-PLS, o
b directament a partir dels models N-way, com ara PARAFAC, Tucker3
o N-PLS.

En esta tesi s'ha treballat amb tres conjunts d'imatges reals procedents
dels sectors agrari, cermic i de producci de pedra artificial, aix com
amb un conjunt d'imatges simulades del sector metallrgic. Les imatges
han sigut estudiades per mitj de tres estratgies diferents, els fins
principals de les quals eren: mantindre baix control estadstic un procs,
aix com dur a terme una classificaci de les peces produdes per mitj de
les imatges registrades de les mateixes; detectar defectes inespecfics de
qualsevol tipus no coneguts a priori, com ara ratlles, taques, etc., que
pogueren aparixer en les imatges com a conseqncia de fallades en el
procs de producci o deterioraments durant la seua manipulaci;
controlar el grau i distribuci espacial en qu una determinada
caracterstica o defecte predefinit apareix en una nova imatge.

A fi d'optimitzar el procs de classificaci, s'ha proposat una metodologia


basada en el disseny d'experiments i l'anlisi de resultats per mitj de
models de regressi logstica. Els resultats de l'aplicaci de dita
metodologia han revelat que, en funci del problema a analitzar i de
l'enfocament de classificaci emprat, els nivells dels factors que
optimitzen el percentatge d'encert en la classificaci sn diferents. A
posa de manifest la utilitat prctica de la metodologia proposada a l'hora
d'optimitzar el percentatge d'encert en la classificaci en nous problemes.

L'estratgia de detecci, localitzaci i allament de defectes inespecfics,


basada en la localitzaci dels pxels que superen els lmits dels estadstics
T2 i SCR, ha derivat en la creaci d'imatges que indiquen les zones amb
anomalies, aix com la naturalesa de les mateixes. D'esta manera, s
possible conixer la distribuci espacial del defecte, i tindre informaci

ix
SPC mediante MIA____________________________________________________

addicional que permeta establir distints tipus de qualificacions finals de


la pea o procs. Els resultats obtinguts han posat de manifest la utilitat
d'estos dos grfics, que es mostren com a potents ferramentes a l'hora de
detectar desviacions respecte dels estndards de qualitat i la localitzaci
dels defectes en la imatge original.

L'ltima estratgia analitzada consistix en, a partir de la compressi d'una


imatge que presenta una caracterstica o defecte d'inters en les distintes
components principals, veure com s'agrupen els pxels en estes noves
dimensions, per a desprs, per mitj de la selecci de les distintes
agrupacions, determinar la seua situaci espacial en l'espai de la imatge
original, i controlar el grau en qu dita caracterstica o defecte apareix en
la imatge, amb l'objectiu final de determinar si tal grau o aquella
distribuci sn admissibles baixos els estndards de qualitat establits.
A mateix es pot dur a terme a partir de noves imatges projectades sobre
el model creat a partir de la imatge patr.

La revisi de les tcniques i l'experincia adquirida han ajudat a proposar


una metodologia d'anlisi, i han obert un gran nombre de lnies futures
d'investigaci.

x
Resumen______________________________________________________________

Abstract

The last years improved competitiveness throughout the diverse


industrial fields is forcing the companies to enhance their process quality
and efficiency, in order to guarantee their products to satisfy the clients
demands.

In order to achieve this process improvement, it is necessary to dispose of


process information that, suitably processed or analysed, may help in the
on-line decision process, supplying or complementing other more
conventional tools, such as temperature sensors, process variables or
voltage records, etc.; or even making possible to dispose of some kinds
of information that could not be obtained by means of other ways. This
would be the case of, v.g., measurements related to the number and
diameter of supeficial bubbles in a froth flotation process, or the number
of pits in steel rolls. Moreover, it is advisable to introduce new
methodologies that allow knowing, at least in an approximate way, but
on the 100% of the production, the values of those final quality variables
that, in the most cases, can only be guaranteed by means of destructive
assays or analytical tests of a little number of samples of the final
product.

Traditionally, some final product quality standards inspection and control


processes have been performed by human visual inspection techniques,
based on the experience of some well trained people. The introduction of
cameras in some industries have made these image analysis techniques to
improve these processes, mainly those that compare features extracted
from new images with the ones obtained from other considered as a well
defined pattern.

xi
SPC mediante MIA____________________________________________________

The cheapening in the acquisition of colour images in industrial


processes has widened and enhanced the possibility of monitoring them
via an automatized visual inspection, making these techniques more
viable from an economic point of view. This way, taking one colour
image characterizing the process in Normal Operation Conditions, it is
possible to build a model comprising all the relevant information and,
furthermore, to determine if the new images fit the model, or if they do
not.

In fact, the introduction of colour images in the industries has derived


since the end of the 80s in the new application of techniques based on
the compression of the information present in the images by means of
their projection onto latent structure models, which is known as MIA
(Multivariate Image Analysis).

These techniques seem to be quite interesting in those situations where


there exist lots of colour channels to analyse, i.e., in images captured by
multispectral cameras, where each colour channel can gather information
related to a reduced number of features and, hence, relate some of them
to some channels that characterised them.

However, the cost of these multispectral cameras make their introduction


in industrial environments difficult. Hence, the main objective of this Ph.
D. Thesis is to explore the possibility of enhancing the effective on-line
information to show up in a production process by means of RGB
cameras colour images.

One way for enhancing the information provided by these images is to


include the textural information, since it usually helps to characterize the
image used to build the model, as well as to determine new features or
defects in the new images.

Hence, integrating the textural information, the image data structure is


4D: the sample dimension, defined by the bidimensional pixel structure
that conforms the image; the textural information, joined by the
neighbouring pixels to that one related to the sample, which actually
form the neighbouring window; and the spectral information, constituted
by the different colour channels that extract this kind of information.
Unfolding this 4D data structure along the internal direction linked to the

xii
Resumen______________________________________________________________

pixels that constitute the samples, an OVV (Object, Variable, Variable)


3-way internal data structure is obtained, which can be analysed via 2-
way models, such as Unfold-PCA or Unfold-PLS; or directly by means
of N-way models, such as PARAFAC, Tucker3 or N-PLS.

Three types of real processes images coming from agricultural, ceramic


and artificial stone industries have been analysed in this Ph. D. Thesis, as
well as one set of simulated steel images; which have been studied via
three different strategies, mainly oriented to: maintain a statistical
process control, as well as to classify the manufactured pieces by means
of the images obtained from them; detect some undefined defects, a
priori unknown, such as scratches, spots, etc., that could appear in the
images as a consequence of fails in the production process or due to
damages caused during their maintenance; control the quantity and
spatial distribution of some pre-defined feature in a new image.

In order to optimize the classification process, a methodology based on


an experimental design and a logistic regression model has been
proposed. The results derived from the application of this methodology
have shown up that the levels of the factors that optimize the success rate
in the classification depend on the problem analysed and on the
classification approach applied. This reinforces the utility of the proposed
methodology in order to optimize the sucess rate in the diverse
classification problems.

The strategy of detection, location and isolation of undefined defects,


based on the location of those pixels over the T2 and RSS statistics, has
derived in the building of images that locate those defective zones, as
well as their nature. This way, it is possible to know the spatial
distribution of the defect, and dispose of additional information that can
help to establish the final quality of the piece or process under inspection.
The obtained results have shown the usefulness of both T2 and RSS
Images, which raise up as very interesting tools when trying to detect
deviations from the Normal Operating Conditions and to locate the
defects in the original image space.

The last analysed strategy consists of that one related to the compression
of the original image having a feature or defect of interest in the different
principal components in order to determine the clusters of pixels in the

xiii
SPC mediante MIA____________________________________________________

new latent space and, via the selection of the pixels of interest, locate
them in the original image space, in order to determine if the quantity
and/or the spatial distribution of those pixels can be accepted according
to the established quality standards. This procedure can also be applied
on new images projected on the model built from the images linked to the
defect or feature of interest, detecting and locating the pixels that show a
similar behaviour.

The review of the techniques and the acquired experience have derived in
the proposal of an analysis methodology and, furthermore, multiple
future research trends.

xiv
ndice_________________________________________________________________

ndice

Agradecimientos i

Resumen iii

ndice xv

Captulo 1. Introduccin, contenidos y objetivos de la tesis 1


1 INTRODUCCIN... 1
1 1 Anlisis tradicional... 2
1 2 Anlisis Multivariante de Imgenes 4
1 3 Criterios, estrategias y problemas... 5
2 CONTENIDOS. 7
3 OBJETIVOS. 10

Captulo 2. Introduccin al Anlisis de Imgenes 13


1 CONCEPTO DE IMAGEN 13
2 PROCESAMIENTO CLSICO DE IMGENES... 18
2 1 Anlisis clsico de imgenes................................. 20
2 2 Anlisis clsico de texturas................................... 22
2 2 1 Mtodos estadsticos para el anlisis de textura.s 24
2 2 2 Mtodos estructurales...................................... 28
2 2 3 Mtodos basados en transformaciones de la matriz original 29
2 2 4 Comparacin de los diferentes mtodos clsicos de anlisis de
texturas......................... 30
2 3 Trabajos de anlisis clsico de imgenes aplicados a la clasificacin
automtica 32
2 4 Wavelets: anlisis y compresin de imgenes....... 35
2 4 1 Transformadas wavelets discretas...................... 37
2 4 2 Otros tipos de wavelets discretas: Wavelet Packet Transform 43
2 4 3 Ventajas de las wavelets para el anlisis de texturas 44
3 ANLISIS MULTIVARIANTE DE IMGENES..... 46
3 1 Anlisis de imgenes por medio de modelos de estructuras latentes. 47
3 2 Prediccin por medio de modelos de estructuras latentes 50

xv
SPC mediante MIA____________________________________________________

3 3 Anlisis de textura mediante modelos de estructuras latentes.. 53


3 4 Integracin de la informacin espectral y textural 56
4 PROCESAMIENTO CLSICO VS ANLISIS MULTIVARIANTE DE
IMGENES...... 62

Captulo 3. Modelos de estructuras latentes 65


1 INTRODUCCIN........ 65
2 MODELOS DE COMPRESIN................................ 67
2 1 Tucker3............................... 67
2 2 PARAFAC........................... 70
2 3 Unfold-PCA......................... 73
3 MODELOS DE PREDICCIN...... 76
3 1 Unfold-PLS......... 76
3 2 N-PLS...... 82
4 PRETRATAMIENTO DE LOS DATOS... 86
4 1 Centrado...... 87
4 2 Escalado...... 88
4 2 1 Escalado por columnas..... 89
4 2 2 Escalado por bloques (laterales o frontales) ... 90
4 2 3 Escalado a doble bloque................................... 90
5 VALIDACIN DEL MODELO......... 93

Apndice al captulo 3 97
1 ALGORITMOS DE LOS MODELOS DE COMPRESIN 97
1 1 Tucker3................................ 97
1 2 PARAFAC....... 99
1 3 PCA (y Unfold-PCA) .......... 101
2 MODELOS DE PREDICCIN.... 107
2 1 Unfod-PLS...... 107
2 1 1 SIMPLS...... 110
2 2 N-PLS.................................. 112

Captulo 4. MIA y SPC 117


1 INTRODUCCIN.................... 117
2 EL PROBLEMA DE LA DIMENSIN Y DEL FONDO 123
3 CONTROL Y CLASIFICACIN AUTOMTICA DE PROCESOS 125
3 1 Enfoques...... 125
3 1 1 Ajuste a un modelo........ 125
3 1 2 SIMCA........ 139
3 1 3 PLS-DA.......................... 151
3 1 4 Prediccin inferencial.... 154
3 2 Optimizacin de los factores: Diseo de Experimentos y Regresin
Logstica...... 156
3 3 Resultados 167
3 3 1 Estrategia de integracin de la informacin espectro-textural.. 167

xvi
ndice_________________________________________________________________

3 3 2 Estrategia MIA tradicional 175


3 4 Comentarios y conclusiones.. 181
4 DETECCIN Y LOCALIZACIN DE DEFECTOS INESPECFICOS... 185
4 1 Deteccin y localizacin de defectos inespecficos en naranjas.. 188
4 2 Deteccin y localizacin de defectos inespecficos en cermicas 192
4 3 Deteccin y localizacin de defectos inespecficos en acero 194
4 3 1 Estudio de picadas sobre una plancha de acero simulada. 195
4 3 2 Simulacin de un rea sucia.............................. 202
4 3 3 Simulacin de una plancha de acero rayada.... 208
4 4 Deteccin y localizacin de defectos inespecficos en piedra artificial.. 214
4 4 1 Tipo A............................. 214
4 4 2 Tipo B............................. 217
4 4 3 Tipo C............................ 219
4 5 Comentarios y conclusiones...... 227
5 SELECCIN DE CARACTERSTICAS DE INTERS.. 229
5 1 Visualizacin de la informacin............................ 230
5 1 1 Imgenes Score .............. 230
5 1 2 Score Plots: seleccin de caractersticas...................... 231
5 1 3 Seleccin de las caractersticas de inters..................................... 232
5 2 Estudio sobre naranjas.............................. 235
5 3 Estudio sobre cermicas............................. 240
5 4 Estudio sobre piedra artificial....................... 243
5 5 Conclusiones............................................... 250

Captulo 5. Conclusiones y lneas futuras 253


1 ASPECTOS DESARROLLADOS Y APORTACIONES..... 253
1 1 Clasificacin automtica............................ 254
1 2 Localizacin de defectos inespecficos.............................. 256
1 3 Seleccin de caractersticas de inters.............................. 257
1 4 Cdigo propio. 257
2 LNEAS DE INVESTIGACIN ABIERTAS... 258
Referencias bibliogrficas 261

xvii
Captulo 1. Introduccin, contenidos y objetivos de la tesis_____________________

Captulo 1. Introduccin, contenidos y objetivos de


la tesis

1 INTRODUCCIN

Desde hace ya bastantes aos el mundo de la visin artificial se ha ido


haciendo un hueco en los distintos sectores tecnolgicos e industriales,
ayudando a la deteccin, mediante el reconocimiento de patrones, de
distintos tipos de defectos visibles que pudiesen tener determinadas
piezas, o bien permitiendo la creacin de imgenes bi o tridimensionales
que ayuden a detectar y localizar tumores en las personas.

Dentro de algunos sectores del mbito industrial, existen multitud de


procesos que necesitan de algn tipo de inspeccin visual, la cual
tradicionalmente se ha venido llevando a cabo por parte de personas
experimentadas con el fin de determinar si la produccin es correcta,
inspeccionar lotes de proveedores, controlar un proceso en marcha, etc.

Este tipo de inspeccin visual no est exenta de criterios subjetivos, por


muy experimentada que est la persona encargada, lo cual cuestiona su
uso para establecer la bondad de un producto fabricado, de un proceso en
marcha, o de un lote proveniente de algn proveedor. La causa de esta
subjetividad est ligada, por una parte, a la variabilidad entre las
clasificaciones realizadas por un mismo inspector, debido a factores tales
como fatiga o prdida momentnea de atencin (asociado, por tanto, al
concepto de repetibilidad); mientras que por otra parte aparece la
variabilidad entre inspectores a la hora de realizar la clasificacin de las
piezas, relacionada con las caractersticas de percepcin visual de cada
persona (aspecto relacionado con la reproducibilidad). Por todo ello, se
hace necesario en este tipo de sectores introducir sistemas de control que
sean totalmente objetivos y sin este tipo de variabilidades, a la vez que se

1
SPC mediante MIA____________________________________________________

elimina la falta de calidad en la clasificacin en situaciones tales como


jubilaciones, despidos, bajas, etc. relativas a los inspectores.

En este sentido, la progresiva modernizacin de la industria ha llevado a


la inclusin de mtodos de inspeccin mediante sensores pticos y
cmaras, con el objeto de conocer de manera individualizada, o en su
defecto por lotes, las unidades que son correctas en un proceso de
fabricacin o que por el contrario deben ser retiradas, debido al
incumplimiento de alguna especificacin de calidad o por cualquier otro
motivo.

En otros sectores, la motivacin fundamental de la introduccin de este


tipo de tecnologa viene derivada de la necesidad de eliminar los
elevados costes asociados a sensores ms tradicionales (por ejemplo,
termopares). De esta manera, es posible abordar procesos de control
estadstico a partir de imgenes de una manera relativamente econmica.

Por otro lado, existen pruebas que no se pueden llevar a cabo sobre la
totalidad de las piezas, ya que implican una destruccin de las mismas,
como es el caso de los ensayos destructivos destinados a determinar la
resistencia de una pieza metlica, cermica o de otro tipo. En otros casos,
no es posible controlar la evolucin del proceso por medio de sensores,
sino que dicho control debe ejecutarse por medio de indicadores
derivados de caractersticas visuales, tales como el tamao y distribucin
de las burbujas en el proceso de floculacin del cobre. Finalmente, el
control de procesos mediante anlisis de imgenes permite incorporar
esta tecnologa a lazos de control que permiten modificar los parmetros
de entrada del proceso, como en el caso del control de adicin de
colorantes y aromas durante la fabricacin de snacks.

1.1 Anlisis tradicional

El mundo digital ha posibilitado la incorporacin de cmaras que


discretizan directamente las imgenes que toman, obtenindolas adems
en color, lo cual proporciona una gran cantidad de informacin, tanto
ms cuanto mayor sea el nmero de imgenes disponibles para controlar
el proceso, as como cuanto mayor sea la resolucin de las mismas,

2
Captulo 1. Introduccin, contenidos y objetivos de la tesis_____________________

aspecto determinado por la cantidad de pxeles en que las cmaras son


capaces de dividir la escena que captan.

Dichas imgenes en color proporcionan una cantidad de informacin


adicional muy importante a la hora de controlar un proceso, sobre todo si
se compara con una imagen en escala de grises, donde la informacin
proporcionada es demasiado global. Evidentemente, cuanto mayor sea el
nmero de canales o espectros captados por una cmara, mayor ser la
capacidad del modelo a crear para asociar cada caracterstica o conjunto
de ellas a los distintos canales o espectros utilizados.

Sin embargo, en ocasiones la informacin espectral proporcionada por


las cmaras digitales no es suficiente para extraer todas las caractersticas
o informacin presente en una imagen, ya que el total de la informacin
existente en la misma queda recogida en tan slo tres variables,
correspondientes a los canales R (rojo), G (verde) y B (azul). Esto ha
hecho necesario buscar nuevos tipos de informacin presentes en la
imagen que sirvan para mejorar los modelos obtenidos a partir de
cmaras RGB, que son las que se utilizan de manera general en los
entornos industriales.

Uno de estos tipos de informacin ha ido asociada tradicionalmente al


anlisis de la textura de la imagen, concepto asociado a la correlacin
espacial de cada pxel con sus vecinos. Dicha propiedad es de gran ayuda
a la hora de llevar a cabo clasificaciones y/o de determinar defectos y su
localizacin en la imagen. La textura mide propiedades como la
regularidad, uniformidad y tosquedad, indicando de alguna manera el
grado de rugosidad superficial de una imagen. Existen una gran variedad
de herramientas clsicas de anlisis de textura que han sido y siguen
siendo utilizadas para discriminar las distintas texturas que pueden
aparecer en una imagen.

Asimismo, existen multitud de tcnicas desarrolladas dentro del mbito


del reconocimiento de patrones, las cuales han demostrado su utilidad y
aplicabilidad en diversas reas, tales como la medicina, defensa o
industria. Dichas tcnicas permiten la restauracin y mejora de imgenes,
as como la determinacin de la existencia o falta de piezas o
caractersticas a partir del reconocimiento de formas o de contornos. A
partir de aqu, la extraccin de caractersticas ha permitido el anlisis

3
SPC mediante MIA____________________________________________________

automatizado de procesos por medio de imgenes, y la posterior


clasificacin de las mismas.

Quiz una de las principales limitaciones de estas tcnicas ms clsicas


sea la dificultad para analizar imgenes con caractersticas aleatorias,
tales como las presentes en imgenes naturales o en imgenes
procedentes de procesos que dan lugar a defectos o caractersticas que no
siguen unos determinados patrones.

1.2 Anlisis Multivariante de Imgenes

Cuando se estudia una imagen, una de las primeras dificultades es la gran


cantidad de informacin que se encuentra altamente correlacionada para
cada pieza o conjunto de ellas (cada imagen supone una matriz de
tamao mnimo I=n1n2 pxeles, si no se tiene en cuenta informacin
espacial ni informacin multiespectral relativa a las distintas bandas de
frecuencias), lo cual hace conveniente su compresin para intentar
encontrar otro tipo de variables que resuman la variabilidad de los datos.

Ello ha dado pie en los ltimos aos al estudio y anlisis de imgenes por
medio de tcnicas que permiten comprimir y agrupar la informacin
existente en las imgenes. Dichas tcnicas son los modelos de proyeccin
sobre estructuras latentes, de los cuales sus mximos exponentes son el
anlisis de componentes principales (Principal Component Analysis,
PCA) y la regresin por mnimos cuadrados parciales (Partial Least
Squares, PLS).

El anlisis de imgenes por medio de mtodos o tcnicas de proyeccin


se ha desarrollado hasta la fecha utilizando bien la informacin de
carcter espectral (Geladi y Grahn, 1996), basada en los canales de color,
o la informacin de carcter espacial (Bharati y MacGregor, 2000),
basada en la informacin correspondiente a los pxeles vecinos a uno
dado.

El problema de este tipo de anlisis es la gran demanda computacional de


las estructuras de datos y de los modelos a crear, lo cual hace necesaria la

4
Captulo 1. Introduccin, contenidos y objetivos de la tesis_____________________

bsqueda de mtodos de compresin, que minimicen el gran volumen de


datos disponible, pero sin eliminar informacin relevante de los mismos.

1.3 Criterios, estrategias y problemas

Los criterios que deben seguirse a la hora de determinar las condiciones


de fabricacin de un producto o proceso son:

Rapidez en la determinacin, ya que en un proceso en continuo


hay que inspeccionar muchas piezas, o bien establecer si un
proceso se encuentra a punto para pasar a otra subfase. Ejemplos
de la importancia de este criterio pueden encontrarse en el sector
cermico, donde la rapidez es fundamental debido al elevado
nivel de produccin; en aceras, donde un encargado determina
cundo el arrabio ha alcanzado el punto ptimo para pasar del
horno elctrico de arco al horno cuchara; o en la industria minera,
donde en el proceso de floculacin del mineral se inspecciona la
superficie para conocer el punto de cambio de fase (Liu et al.,
2005).

Objetividad a la hora de establecer si el producto o proceso est


en condiciones operativas normales de funcionamiento o
clasificarlo en una cierta categora. Este aspecto es muy
importante para conseguir una homogeneizacin lo mayor posible
en los procesos. Es aqu donde las tcnicas de control estadstico
de procesos juegan una baza fundamental, al erigirse como
herramientas poderosas desde el punto de vista de la objetividad y
del manejo eficiente de la gran cantidad de datos registrados, para
convertirlos en la mejor informacin posible que conduzca a una
eficiente toma de decisiones.

Las estrategias que pueden utilizarse cuando se pretende realizar un


control estadstico de procesos mediante anlisis de imgenes son:

Clasificacin automtica de piezas a la salida de un proceso de


produccin, ya sea en relacin a su adecuacin a los estndares de

5
SPC mediante MIA____________________________________________________

la lnea de produccin, o bien en funcin de su pertenencia o no a


distintas clases predefinidas y modelizadas.

Deteccin de defectos superficiales tales como picadas, manchas,


rayas, etc., cuya localizacin y distribucin espacial condicionan
diferentes niveles de clasificacin o calidad final del producto, e
incluso la retirada del mismo para su posterior comercializacin.
Ejemplos de este tipo de control aparecen en sectores tales como
el cermico o el relacionado con la produccin de piedra artificial,
cuyos estndares de calidad constituyen un aspecto fundamental a
la hora de introducirse y mantenerse en los mercados.

Control de caractersticas especficas de las piezas a producir,


tales como el rea de una pieza asociada a una determinada
caracterstica del producto (v.g., la distribucin de colores en las
cermicas); o de defectos conocidos, como las rayas en cermicas
o piedra artificial, as como la localizacin y cuantificacin de las
reas afectadas por enfermedades en ctricos.

Prediccin de caractersticas de calidad para determinar el estado


de una pieza o proceso, tales como el grado de corrosin, dureza,
temperatura, maduracin, etc. Y todo ello a la finalizacin de un
proceso, o bien mediante la inspeccin visual automatizada a lo
largo del mismo, en tiempo real.

Los problemas asociados a este tipo de estrategias surgen por un lado


ligados a la necesidad de comprimir de manera eficiente la informacin,
como ya se ha comentado, as como por la gran cantidad de factores que
influyen o pueden influir a la hora de optimizar los modelos construidos,
y que pueden variar en funcin del problema estudiado. Por ello, se hace
conveniente establecer una metodologa que, de manera objetiva, permita
establecer cules son los niveles de los factores que, para cada problema
estudiado, optimizan el objetivo perseguido por cada una de las
estrategias planteadas.

6
Captulo 1. Introduccin, contenidos y objetivos de la tesis_____________________

2 CONTENIDOS

A fin de establecer las bases necesarias para el desarrollo de la presente


tesis a partir de la problemtica planteada, este trabajo muestra en el
captulo 2 una descripcin del anlisis de imgenes, a modo introductorio
y de revisin. En este captulo se introduce el concepto de imagen, se
presentan las tcnicas clsicas de procesamiento digital de imgenes, as
como las basadas en el anlisis multivariante de imgenes, introduciendo
el tipo de estructura de datos a analizar, que integra la informacin de
tipo espectral y espacial, as como una discusin relativa a la
nomenclatura a emplear dentro del campo del anlisis multivariante de
imgenes.

Por su parte, el captulo 3 hace una revisin de los distintos modelos de


compresin y de prediccin multivariantes, tanto de los 2-way, que
analizan las estructuras de datos una vez desplegadas, como de los N-
way, que analizan dichas estructuras de manera directa, sin la necesidad
de ningn tipo de desplegado.

El captulo 4 presenta la aplicacin de las diferentes estrategias antes


comentadas para realizar un control estadstico de procesos mediante
anlisis multivariante de imgenes a partir de cuatro tipos diferentes de
imgenes. Por un lado se dispone de imgenes de naranjas
proporcionadas por el IVIA (Instituto Valenciano de Investigaciones
Agrarias), as como de cermicas proporcionadas por el DISCA
(Departamento de Informtica de Sistemas y Computadores) de la
Universidad Politcnica de Valencia. Por otro lado, la importancia de la
aplicacin de este tipo de estrategias dentro del sector metalrgico ha
motivado la simulacin de imgenes de planchas de acero, a las cuales se
les ha aadido diferentes tipos de defectos para su posterior estudio. Este
conjunto de imgenes simuladas ha constituido el tercer conjunto de
datos. Finalmente, se ha dispuesto de un cuarto conjunto de imgenes
procedentes del sector de piezas de piedra artificial para cocinas y baos,
proporcionado igualmente por el DISCA.

7
SPC mediante MIA____________________________________________________

Para la estrategia de clasificacin automtica, se han estudiado tres tipos


diferentes de enfoques a aplicar, denominados Ajuste a un modelo,
SIMCA y PLS-DA. A fin de ilustrar la metodologa propuesta de
optimizacin de los niveles de los factores que optimizan cada criterio de
cada una de las estrategias posibles de actuacin, se han aplicado tcnicas
de Diseo de Experimentos sobre cada uno de los dos problemas o tipos
de imgenes estudiados (naranjas y cermicas), con el objeto de
maximizar el porcentaje de acierto en la clasificacin de cada uno de los
enfoques empleados. El estudio de la significacin estadstica y el nivel
ptimo de funcionamiento de los distintos factores comentados en cada
caso se ha realizado mediante un anlisis de Regresin Logstica. Dicha
metodologa se propone como herramienta eficiente de determinacin de
los niveles y/o variantes que optimizan los distintos tipos de imgenes a
estudiar en cada situacin. Adems, los resultados obtenidos en las
clasificacin mediante la integracin de la informacin espectral y
textural son comparados con los proporcionados por los modelos
construidos a partir de la informacin de tipo espectral exclusivamente.

A la hora de monitorizar defectos o caractersticas, en muchos casos no


basta con controlar un proceso determinando la adecuacin o no de una
nueva pieza o de parte del producto en proceso a los estndares
establecidos, sino controlar, cuantificar y localizar espacialmente los
defectos, ya que no slo la cuantificacin, sino tambin la situacin y
grado de agrupacin de un defecto o caracterstica, puede derivar en
distintos niveles de calidad del producto final. Esto se discute en las dos
ltimas partes del captulo 4.

La penltima parte del captulo 4 se centra en la estrategia de deteccin


de defectos inespecficos, introduciendo dos nuevos grficos basados en
los estadsticos T2-Hotelling y SCR (Suma de Cuadrados Residuales),
denominados Imagen T2 e Imagen SCR, respectivamente, los cuales
permiten detectar, localizar y aislar de manera efectiva dichos defectos.
Esta estrategia ha sido aplicada sobre los cuatro tipos de imgenes
disponibles. La bondad de estos grficos radica en el hecho de poder,
adems de cuantificar, localizar y aislar de manera objetiva aquellos
pxeles que no se comportan en las condiciones esperadas, poder
establecer una interpretacin sobre a la causa de dicha desviacin, tanto
en cuanto al comportamiento extremo de un pxel o conjunto de ellos
(delimitando tal vez un rea determinada) dentro de un modelo, como en

8
Captulo 1. Introduccin, contenidos y objetivos de la tesis_____________________

cuanto al comportamiento de los mismos fuera del modelo establecido.


Es decir, permiten diferenciar si, por ejemplo, una naranja padece una
determinada enfermedad en un determinado grado (Imagen T2) o si dicha
naranja no padece dicha enfermedad (Imagen SCR), localizando adems
de manera aislada la zona de la naranja que se ve afectada por los
fenmenos comentados, o bien por la falta de ellos.

El captulo 4 acaba con la ltima estrategia estudiada, correspondiente a


la seleccin de defectos o caractersticas especficas. Para la aplicacin
de esta estrategia, se ha utilizado el conjunto de imgenes
correspondientes a las naranjas, cermicas y piedra artificial. Esta
estrategia permite, por medio de la visualizacin de la informacin en
imgenes asociadas a cada una de las componentes o direcciones
principales de los modelos de compresin empleados, seleccionar
aqullas ligadas al defecto o caracterstica de inters, aislando los
defectos no slo en las imgenes estudiadas en un primer momento, sino
tambin en aqullas que posteriormente se proyecten sobre los modelos
creados a partir de uno o varios defectos. Mediante esta estrategia es
posible, por tanto, monitorizar el grado en que una caracterstica o
defecto se da en una imagen, ya sea en trminos de nmero de pxeles o
porcentaje de rea de la imagen asociada a la caracterstica o defecto
objeto de estudio, as como localizar en el espacio de la imagen original
la zona asociada, con el objeto de poder estudiar su distribucin espacial.

La tesis finaliza con la presentacin en el captulo quinto de las


conclusiones ms importantes y las lneas futuras de investigacin.

Una vez presentados los contenidos de la presente tesis, se pasa a


enumerar de una forma ms precisa cules son los objetivos de la misma.

9
SPC mediante MIA____________________________________________________

3 OBJETIVOS

La presente tesis se plantea explorar las posibilidades del Control


Estadstico Multivariante de Procesos (Multivariate Statistical Process
Control, MSPC) basado en mtodos de proyeccin sobre estructuras
latentes mediante el anlisis de imgenes y su aplicacin en tiempo real a
procesos productivos, con tres objetivos generales, subdivididos en
algunos casos en objetivos especficos:

1. Desarrollar y evaluar procedimientos para la monitorizacin y


clasificacin automtica de piezas o productos a partir de imgenes
obtenidas del proceso de produccin o inspeccin.

1.1. Mejorar la eficiencia de los modelos de monitorizacin y


clasificacin automtica de piezas o productos a partir de
imgenes obtenidas del proceso de produccin o inspeccin, por
medio de la integracin de la informacin espectral y textural en
una nica estructura de datos; y compararla con las obtenidas a
partir de la utilizacin de la informacin espectral
exclusivamente.

1.2. Proponer una metodologa eficiente, basada en el Diseo de


Experimentos, que permita, para cada problema estudiado y en
funcin de los factores controlables, determinar cules son las
condiciones de trabajo que permiten obtener los mejores
resultados posibles para cada criterio establecido, as como
establecer comparaciones entre los tres enfoques de clasificacin
automtica aplicados. En este sentido se pretende comparar y
determinar la conveniencia de emplear modelos 2-way frente a
modelos N-way, as como el efecto del tamao de las muestras
patrn y la influencia de factores asociados al preprocesado de
los datos, tales como el centrado de los canales de color de una
determinada imagen respecto de s misma, o bien el centrado y
escalado de una imagen proyectada respecto de los valores
asociados a los datos a partir de los cuales se han creado los
distintos modelos.

10
Captulo 1. Introduccin, contenidos y objetivos de la tesis_____________________

1.3. Reducir los tiempos de computacin mediante la compresin de


imgenes por medio de las wavelets, as como determinar el
nivel de compresin ms adecuado a fin de maximizar el
porcentaje de acierto en la clasificacin.

2. Ampliar el estado del arte mediante la creacin de nuevos grficos de


control que permitan una monitorizacin on-line de imgenes similar
a la planteada de manera general por los diversos modelos de MSPC.

2.1. De esta manera, se plantea el desarrollo de grficos que


permitan la deteccin, localizacin y aislamiento, de manera
objetiva, de las zonas de la imagen que presentan anomalas, ya
sea debido a un comportamiento extremo para el proceso bajo
control, o a que la imagen estudiada no sigue la estructura de
correlacin del proceso.

3. Desarrollar procedimientos para la seleccin y localizacin en las


imgenes de defectos o caractersticas de inters, para su posterior
monitorizacin y localizacin en nuevas imgenes; ampliando dicha
estrategia a los modelos N-way.

11
Captulo 2. Introduccin al Anlisis de Imgenes_____________________________

Captulo 2. Introduccin al Anlisis de Imgenes

1 CONCEPTO DE IMAGEN

La presente tesis pretende abordar el problema del anlisis de los datos


contenidos en una imagen, con el objeto de extraer de la misma la mayor
cantidad posible de informacin relevante. En este sentido, una de las
primeras preguntas que cabra realizar es:

Qu es una imagen?

Desde un punto de vista tcnico, una imagen es la composicin de las


distintas intensidades de longitudes de onda recibidas desde una
superficie, como consecuencia de la reflexin sobre la misma de otras
longitudes de onda proyectadas o emitidas.

Como se muestra en la Figura 2.1, el fenmeno de reflexin se produce


como sigue: parte de la radiacin emitida (IO) penetra en la superficie y
es absorbida (IA). Parte de la radiacin sigue una serie de pasos de
reflexin y absorcin y vuelve a ser reflejada por el material slido (IR).
La reflexin es hemisfrica en todas las direcciones, si bien su
distribucin no es uniforme necesariamente.

Esta es la situacin ms comn en imagen, donde IO es la luz fuente y la


parte reflejada (IR) queda registrada por un medio fotogrfico o vdeo
cmara.

A pesar de que el proceso de interaccin con la materia es complejo, no


constituye un problema para que el observador haga una interpretacin
de la imagen registrada. De hecho, una foto en blanco y negro (escala de

13
SPC mediante MIA_____________________________________________________

grises) no es ms que un mapa de cmo se refleja la luz por cada punto


en la escena fotografiada.

Haz luminoso Imagen en


emitido escala de grises

IR
Parte del
haz reflejada
IO
Filtro de longitudes de onda

IA
Parte del haz absorbida Imagen en color filtrada

Figura 2.1 Esquema de captacin de una imagen.

Existen tres factores que determinan la percepcin de los colores de los


objetos:

sensibilidad del sistema visual,

iluminacin,

caractersticas de la reflexin de la luz en la superficie del objeto.

Las imgenes objeto de estudio son captadas por medio de cmaras de


vdeo o fotogrficas, las cuales captan la luz reflejada por los objetos
cuando sobre ellos incide un haz de luz luminoso, a una determinada
longitud de onda.

Las imgenes se crean por la combinacin de diferentes longitudes de


onda, cada una de las cuales (o mejor dicho, determinados intervalos de
las mismas, en funcin de la capacidad de captacin espectral de las

14
Captulo 2. Introduccin al Anlisis de Imgenes_____________________________

cmaras) se corresponde con un color, dentro del espectro visible, tal


como presenta la Figura 2.2. Si esta combinacin se realiza con las
longitudes de onda correspondientes a los colores Rojo, Verde y Azul, se
obtienen las imgenes RGB (Red, Green, Blue).

Fig. 2.2. Correspondencia de las longitudes de onda con la frecuencia de emisin y


bandas de color dentro del espectro visible.

As, en funcin de la mayor o menor segregacin de la informacin


espectral en diferentes canales de color, se pueden obtener diferentes
estructuras de datos, los cuales dan lugar a los diferentes tipos de
imgenes disponibles.

En el caso de utilizar un nico intervalo de longitudes de onda, se obtiene


una imagen univariante correspondiente a dicho intervalo, el cual recoge
la intensidad media dentro del mismo. Cuando este intervalo es el
correspondiente al espectro visible, lo que se obtiene es una imagen
univariante en escala de grises, la cual capta la intensidad global media
de cada pxel de la imagen.

Si en lugar de utilizar un nico intervalo de longitudes de onda, se


utilizan, por ejemplo, los tres correspondientes a los canales de Rojo,
Verde y Azul, se obtiene una imagen en RGB, tal como ya se ha
comentado. Este tipo de imagen es ya una imagen multivariante, puesto
que cada imagen (y por tanto cada uno de los pxeles que la conforman)

15
SPC mediante MIA_____________________________________________________

lleva asociada un total de 3 variables, correspondientes a las intensidades


de los canales Rojo, Verde y Azul.

Finalmente, y ampliando tanto como se desee o sea posible la cantidad de


intervalos de longitud de onda o canales, se obtienen las imgenes
multiespectrales, que no son ms que una imagen multivariante formada
por tantas intensidades como intervalos de longitud de onda la formen.

La Figura 2.3 muestra las estructuras de datos correspondientes a cada


una de estas imgenes.
n2

J=K
n2 n2
J=3 n2 n2
n2 n2 n2
n1
Imagen en Imagen
escala de grises Imagen RGB multiespectral
(univariante) (trivariante) (multivariante)
n1 n1

n1 n1 n1

Figura 2.3. Estructura y evolucin de una imagen univariante hacia una imagen
multivariante.

Una imagen ptica puede convertirse a una seal elctrica con una
cmara de vdeo o un dispositivo similar. Esta conversin cambia la
representacin de la imagen de una fuente de luz ptica a una seal
elctrica que vara continuamente (seal analgica). Esta seal analgica
puede ser digitalizada.

El proceso de digitalizacin consiste en medir la intensidad o el voltaje


de la seal analgica (continua y con infinitos estados posibles) en otra
digital (numrica, con un conjunto finito de posibles estados).

16
Captulo 2. Introduccin al Anlisis de Imgenes_____________________________

En el proceso de digitalizacin, la intensidad de tono continuo se


convierte, en cada punto, en un valor de brillo digital, cuya precisin
depende del nmero de bits usados en el digitalizador. En la mayora de
las aplicaciones, este nmero suele ser de 8 bits, lo cual da lugar a una
escala de niveles de gris que vara generalmente desde 0 hasta 255.

En el dominio digital, una imagen se representa por medio de una serie


de puntos con valores discretos de brillo. Manipulando el valor de cada
uno de dichos puntos, el ordenador puede efectuar multitud de
operaciones de tratamiento de imgenes, de forma rpida y fcil.

Es precisamente a partir de estas operaciones de tratamiento y


manipulacin de imgenes como se ha venido estableciendo de manera
tradicional en la industria la clasificacin de piezas y/o la determinacin
de existencia de defectos en las mismas.

La Figura 2.4 presenta un esquema de la toma de imgenes de un proceso


de produccin en lnea asociado a la produccin de tablas de madera y su
procesamiento en un ordenador, con el objeto de llevar a cabo un anlisis
de anlisis de las mismas.

Line lineal
Cmara scan
Camera
Personal Computer with
Ordenador Personal con
Image Analysis
Software S oftware
de Anlisis de
- RecordImgenes
and Display
Results

Digital Signal Processing


Hardware de
(DS P) almacenamiento
Hardware - Pre-y
process image data
preprocesado de imgenes
(si es el caso)

300 ft./min.
Movimiento a velocidad cte.

Figura 2.4. Esquema de la toma de imgenes mediante cmara lineal de una tabla de
madera (Bharati, 2002).

El apartado siguiente presenta, muy resumidamente, los mtodos


utilizados con estos fines, antes de pasar a discutir el uso de los mtodos
multivariantes en el terreno del anlisis de imgenes.

17
SPC mediante MIA_____________________________________________________

2 PROCESAMIENTO CLSICO DE IMGENES

El presente apartado presenta los mtodos de tratamiento y anlisis de


imgenes tradicionales utilizados hasta la fecha, y que por ello han sido
denominados en la presente tesis procesamiento clsico. El
procesamiento clsico de imgenes hace referencia a la manipulacin y
anlisis de informacin pictrica, tal como mejorar, corregir o cambiar de
alguna manera una imagen. Su objetivo es transformar o analizar una
imagen para hacer evidente cualquier tipo informacin existente en la
misma. Ejemplos cotidianos: unas gafas, que distorsionan la imagen de
un objeto, con el fin de que se pueda percibir mejor, o los controles de
brillo, contraste y color del televisor.

La idea principal subyacente en la mayora de las operaciones de


procesamiento de imgenes es manipular las variaciones espaciales de
intensidad de los pxeles de una imagen en base a unos criterios
predefinidos. Estas tcnicas alteran el brillo de cada pxel en la imagen
con el fin de hacerla ms amable a la vista, o con el fin de facilitar la
extraccin de caractersticas cuantitativas de los pxeles basadas en
descriptores espaciales de forma, tamao, rea, textura, etc.

En los ltimos 40 aos se han desarrollado numerosas operaciones de


procesamiento digital de imagen (PDI). Mientras una operacin puede
mejorar la calidad de una imagen, otra puede extraer de forma automtica
informacin de la misma. Sea cual sea la operacin aplicada, el proceso
es siempre el mismo: una operacin de PDI se aplica sobre una imagen
digital dando como resultado o una nueva imagen, o una serie de datos
extrados de la misma.

Las principales operaciones de PDI son:

Mejora y restauracin de imagen. Consiste bsicamente en


preparar las imgenes para poder llevar a cabo otras acciones
sobre las mismas, por medio de operaciones que mejoran la calidad
de la imagen o reducen la presencia de ruido en la misma. En el caso
de la mejora de imagen, el objetivo bsico es conseguir que la

18
Captulo 2. Introduccin al Anlisis de Imgenes_____________________________

imagen resulte lo ms agradable posible al observador; mientras que


en el caso de la restauracin, el objetivo es corregir la imagen
mediante criterios exclusivamente objetivos, basndose en
degradaciones conocidas y/o medidas de manera precisa.

Anlisis de imagen. Las operaciones de anlisis de imgenes no


producen generalmente como resultado una nueva imagen, sino una
serie de datos numricos y/o grficos acerca de determinadas
caractersticas de la imagen, que son utilizados posteriormente como
caracterizadores de la misma, y a partir de los cuales es posible
clasificar o detectar fallos en las piezas existentes en dicha imagen.

Dada la importancia de este tipo de operaciones de anlisis para el


desarrollo de la presente tesis, en el apartado 2.1 del presente captulo
se profundiza sobre estas tcnicas.

Compresin de imagen. Las operaciones de compresin y


descompresin de imagen permiten reducir el volumen de datos
necesario para su almacenamiento, mediante la eliminacin de la
redundancia presente en las imgenes originales.

Sntesis de imagen. Las operaciones de sntesis de imagen son capaces


de crear imgenes a partir de otras imgenes o a partir de datos no
pictricos. Tales operaciones se utilizan cuando una determinada
imagen es fsicamente imposible de adquirir, o cuando la escena que
representa no existe en realidad. Ejemplos de este tipo de operaciones
pueden ser la realizacin de mapas cartogrficos, donde los diferentes
colores indican la variacin en altura de la imagen contenida en
planta, o la creacin de imgenes tridimensionales mediante
ordenador, tal como sucede actualmente con multitud de efectos
especiales y juegos.

El rea del procesamiento digital de imagen ha sido investigado en


profundidad durante las ltimas cuatro dcadas. Como resultado, existe
una multitud de referencias que describen en detalle las operaciones
comentadas anteriormente (Baxes, 1994; Ekstrom, 1984; Gonzlez et al.,
1992; Pratt, 1978; Russ, 1999; Serra, 1982).

19
SPC mediante MIA_____________________________________________________

2.1 Anlisis clsico de imgenes

El anlisis clsico de imgenes pretende realizar, de una manera


automtica y objetiva, una extraccin de la informacin contenida en una
imagen, describiendo los objetos encontrados en la misma, incluyendo
caractersticas relevantes como forma, tamao, posicin, color, etc.

Para ello, el primer paso a realizar es distinguir los distintos objetos que
pueden aparecer en la imagen, diferencindolos del fondo. Este proceso
se denomina segmentacin, y tras el mismo cada pxel de la imagen
queda asignado a cada uno de los objetos que aparecen en la misma, o
bien al fondo. Los principales mtodos de segmentacin son: la
umbralizacin, en la que los pxeles se clasifican atendiendo a sus niveles
de intensidad; la deteccin de regiones, en la que los pxeles que
presentan caractersticas del mismo tipo son agrupados en regiones; y la
deteccin de fronteras, que se utiliza para separar los distintos objetos
que aparecen en la imagen.

Una vez segmentada la imagen, es posible extraer caractersticas de los


objetos que aparecen en ella, o bien de la imagen en su conjunto, si por
ejemplo slo se ha segmentado el fondo del resto, como podra ser el
caso de la caracterizacin de una pieza cermica. Las principales
caractersticas que se suelen extraer de una imagen son: la forma de los
objetos, tamao, posicin relativa, texturas, tonos de gris, colores, etc.

Una posible aplicacin del anlisis de imgenes consiste en, comparando


estas caractersticas con las de un objeto o pieza conocida, determinar si
la pieza de la imagen pertenece a una determinada clase, o bien si se
ajusta a unas medidas predefinidas dentro de unas tolerancias.

La presente tesis denomina a este tipo de anlisis de imgenes como


clsico con el fin de poder establecer una posterior comparacin con la
metodologa de anlisis de imgenes empleada en la misma, y que se
comenta en el siguiente apartado.

Bsicamente, lo que hace el anlisis clsico de imgenes es tratar la


imagen como una observacin (un elemento de la muestra) a partir de la
cual se extraen una serie de parmetros determinados a priori, que sirven

20
Captulo 2. Introduccin al Anlisis de Imgenes_____________________________

para caracterizarla. De esta manera, se pasa de una estructura de


informacin matricial o cbica a otra vectorial, tal como se muestra en la
Figura 2.5.

n2
J

n2
n2
n2
n1 Vector de caractersticas
Imagen
multiespectral
(multivariante
n1 J canales de
de
color)
n1

Figura 2.5. Esquema de la transformacin de una imagen multiespectral de J canales de


color en un vector de caractersticas de los objetos presentes en la misma.

Por medio de esta extraccin de caractersticas y descripcin de la


imagen, el anlisis de imgenes permite llevar a cabo aplicaciones de
diversos tipos, tales como la inspeccin automatizada de bloques motor
mediante cmaras, con el fin de detectar posibles anomalas como, por
ejemplo, la falta de algn elemento superficial o su incorrecta posicin en
el bloque.

Otro ejemplo de anlisis de imagen lo constituyen las operaciones de


toma automatizada de medidas, para determinar si una pieza se encuentra
o no dentro de los lmites de tolerancia para los diversos parmetros a
medir. A partir de tales medidas, y por comparacin con imgenes patrn
(o modelos creados a partir de las mismas), se puede determinar la
bondad de un producto o la presencia y/o magnitud de alguna
caracterstica en la nueva imagen; o bien clasificar la imagen como
perteneciente al modelo respecto del cual presenta una mayor similitud.
De esta manera, se pueden liberar recursos humanos dedicados a la
inspeccin de calidad, ofreciendo adems resultados ms fiables.

21
SPC mediante MIA_____________________________________________________

El anlisis de texturas constituye otra posible aplicacin del anlisis de


imgenes. Debido a la importancia que tiene en relacin a la presente
tesis, el siguiente apartado se dedica a hacer una breve introduccin al
mismo.

2.2 Anlisis clsico de texturas

No existe una definicin precisa sobre la textura; diversos autores han


tratado de dar algunas definiciones, como las siguientes. Una textura se
puede definir como un conjunto de propiedades locales en un entorno de
vecindad de los niveles de gris en una regin de la imagen. Russ (1999)
afirma que la textura es un atributo que representa la distribucin espacial
de los niveles de gris de los pxeles de una regin. Por su parte, Gonzlez
et al. (1992) indican que la textura es una medida de propiedades como la
regularidad, uniformidad y tosquedad. As, la textura de una imagen
puede dar una medida del grado de rugosidad superficial de una imagen.

Haralick (1979) afirma que la frecuencia espacial est relacionada con la


textura porque las texturas finas son ricas en altas frecuencias espaciales,
mientras que las texturas rugosas son ricas en bajas frecuencias
espaciales. De esta manera, una alternativa a la concepcin de la textura
como una distribucin de la frecuencia espacial es considerar la textura
como una cantidad de filos o bordes, por unidad de rea. Las texturas
finas tienen un elevado nmero de filos por unidad de rea. En cualquier
caso, hay que tener en cuenta que conforme aumenta la resolucin de la
cmara o la escala a la que se toman las imgenes, las texturas se hacen
cada vez ms gruesas (ya que aumentamos la distancia entre bordes, con
lo cual se produce una mayor variacin en el brillo de la imagen
obtenida). Por ello, la textura de una imagen es el resultado de las
propiedades superficiales del objeto del cual se ha obtenido dicha
imagen, de la fuente de iluminacin utilizada y de la geometra en la
obtencin de las imgenes.

La textura tiene dos dimensiones bsicas: por un lado, la descripcin de


las primitivas (pxeles simples o agrupados), tales como sus tonalidades
y/o propiedades locales; por el otro, la descripcin de la dependencia

22
Captulo 2. Introduccin al Anlisis de Imgenes_____________________________

espacial o interaccin entre las primitivas, y estadsticos como la media,


mximos y mnimos de la regin.

Conforme disminuye el nmero de primitivas o zonas tonales


distinguible, como por ejemplo el nmero de pxeles en el caso de una
imagen digital, las propiedades tonales aumentan en importancia (en el
extremo, si slo tenemos un pxel, slo podemos conocer su nivel de gris,
o bien los niveles de intensidad correspondientes a las bandas de emisin
RGB, caso de tener una imagen en color). A medida que van aumentando
las primitivas tonales, las propiedades de textura adquieren ms
importancia, dado su creciente poder discriminante respecto de las
propiedades tonales.

Las texturas tienen diversas aplicaciones, tales como la inspeccin de


superficies, clasificacin de las escenas, orientacin de superficies y
determinacin de formas.

Un aspecto fundamental en este campo es la resolucin en que se observa


la imagen, ya que sta determina la escala en que se percibe la textura y
por tanto la relacin espacial entre la distribucin de los niveles de gris.
Debido a esto, los anlisis y conclusiones extradas para una resolucin
determinada pueden no ser vlidos para otras resoluciones.

Existen tradicionalmente dos enfoques del anlisis de texturas, el enfoque


estadstico y el enfoque estructural (Haralick, 1979). El enfoque
estadstico genera parmetros para caracterizar las propiedades
estocsticas de la distribucin espacial de los niveles de gris en una
imagen. El estructural analiza la imagen en trminos de la organizacin y
relaciones entre sus subestructuras. En el enfoque estructural las
propiedades y reglas de emplazamiento de los elementos texturales
definen la textura de la imagen. A stos se les han unido los enfoques
basados en transformaciones, recientemente tambin denominados como
mtodos tericos de seal (Palm, 2004). La Figura 2.6 presenta un
esquema de estos enfoques.

23
SPC mediante MIA_____________________________________________________

Mtodos estadsticos
Estadsticos de primer orden
Matrices de concurrencia
Transformada textural
Matrices de Longitudes de Racha
Funcin de autocorrelacin
Mtodos basados en modelos
Markov Random Fields
Anlisis de texturas Modelos Fractales
Modelos autorregresivos (AR)

Mtodos estructurales

Mtodos basados en transformaciones


Fourier
Wigner
Wavelets
Gabor

Figura 2.6. Mtodos para el anlisis de texturas.

2.2.1 Mtodos estadsticos para el anlisis de texturas

Este enfoque trata de caracterizar la textura de una imagen mediante el


clculo de una serie de estadsticos extrados de las propiedades locales
de las imgenes.

Los estadsticos ms sencillos son los de primer orden, tales como la


media o la varianza extrados del histograma de niveles de gris. Estos
estadsticos contienen poca informacin para la clasificacin de texturas
ya que no contienen informacin espacial sobre la distribucin de esos
niveles de gris, por lo que slo se pueden utilizar para clasificar un
conjunto muy limitado de texturas. Por ello, se han investigado y
desarrollado estadsticos de segundo orden capaces de captar la
dependencia espacial de la distribucin de los niveles de gris de una
imagen.

24
Captulo 2. Introduccin al Anlisis de Imgenes_____________________________

Uno de los mtodos ms usados para capturar la dependencia espacial de


los niveles de gris que contribuyen a la percepcin de la textura es la
matriz de dependencia bidimensional conocida como matriz de
coocurrencias (Albregsten, 1995; Conners y Harlow, 1980; Haralick,
1979). Las matrices de coocurrencia (Gray Level Coocurrence Matrix,
GLCM), tambin llamadas matrices de dependencia espacial de nivel de
gris (Spatial Gray Level Dependence Matrix, SGLDM) extraen
caractersticas texturales de la imagen a partir del clculo de estadsticos
de segundo orden.

Una matriz de coocurrencias asociada a una distancia entre dos pxeles


definida por las coordenadas (x,y) es una matriz C con un nmero de
filas y columnas igual al nmero de niveles de intensidades de gris de la
imagen, y representa todas las combinaciones de niveles de gris que
pueden darse entre dos pxeles de la imagen con una posicin relativa
definida por las coordenadas (x,y). La matriz de concurrencias es la
tabla de frecuencias cruzadas correspondiente al histograma
bidimensional asociado a la distribucin aleatoria bidimensional de la
variable

x1 = nivel de gris del pxel i;


x =
x 2 = nivel de gris del pxel j a una distancia del pxel i definida (x , y )

El elemento de la matriz C(i,j| x,y) es la frecuencia relativa con la que


la combinacin de valores de intensidades (i,j) aparecen en el conjunto de
todas las parejas de pxeles de la imagen separadas una distancia (x,y).
La posicin relativa entre los dos pxeles se puede definir tambin
mediante una distancia (d) y un ngulo (). En este caso un elemento
genrico de la matriz de coocurrencias se define por C(i,j| d, ). As, por
ejemplo, si la matriz de coocurrencias correspondiente a la distancia de 1
pxel (d=1) y direccin horizontal (=0) contiene un 23 en la posicin
(150, 100), C(150,100| 1, 0)=23, esto significa que en la imagen original
23 de las parejas de pxeles que la componen correspondientes a pxeles
contiguos contienen intensidades de gris de 150 y 100, respectivamente.

25
SPC mediante MIA_____________________________________________________

Si se desea obtener informacin completa sobre la textura de una imagen,


es necesario computar un nmero relativamente grande de matrices de
coocurrencia, con direcciones y distancias diferentes. En lo relativo a las
distancias, se ha comprobado que la mayor parte de la informacin
textural se suele encontrar en las matrices de coocurrencia
correspondientes a distancias pequeas, siendo las correspondientes a
distancias grandes irrelevantes, salvo en casos muy especiales.

La direccin de las GLCM y la informacin textural extrada de las


mismas dependen del nmero de niveles de intensidad utilizados. Por un
lado, un gran nmero de niveles de gris, C, implica la necesidad de una
gran cantidad de espacio de almacenamiento temporal, concretamente
una matriz CC por cada combinacin (x,y). Se puede dar, por tanto,
la paradjica situacin de que las matrices desde las cuales se extraen las
caractersticas de las texturas sean ms voluminosas que la imagen de la
que se han derivado. Por otra parte, la disminucin del nmero de niveles
de gris provoca una prdida de descripcin de la textura en texturas de
pequeo contraste, donde la diferencia de niveles de gris entre unas y
otras no sea muy grande.

En la prctica, para obtener una estimacin estadstica real de la


distribucin de probabilidad se suele restringir el nmero de niveles de
gris o usar una regin espacial de pxeles, denominada ventana, mayor.
Como ya se ha comentado, en el primer caso se puede producir una
prdida de capacidad descriptiva para texturas de pequeo contraste,
mientras que en el segundo caso se pueden producir errores si la textura
cambia dentro de la ventana. Haralick et al. (1973) indican que regiones
(ventanas) muy pequeas no tendrn suficiente informacin textural para
separar las categoras de inters de una imagen, mientras que regiones
(ventanas) muy grandes recogern informacin de diferentes categoras.
Valores tpicos de estos parmetros son 16 niveles de gris y ventanas de
3030 y 5050 pxeles.

Dada la necesidad computacional de limitar o restringir el nmero de


valores (d,), para una distancia dada usualmente se obtienen al menos 4
GLCM (0, 45, 90 y 135). Si se desea obtener unas caractersticas
invariantes a giros, se puede calcular la media de las cuatro matrices
como matriz de la que extraer el vector de caractersticas.

26
Captulo 2. Introduccin al Anlisis de Imgenes_____________________________

El hecho de que se suelan utilizar 16 niveles de gris, ventanas de tamao


fijo, y valores medios de cuatro direcciones que normalmente son las ya
comentadas, hace de ste un mtodo bastante rgido, que no se adapta a
las posibles distintas texturas existentes en una imagen. En los casos en
que existen texturas aleatorias, como sucede en las aplicaciones
estudiadas en la presente tesis, habra que fijar una determinada ventana,
con lo que se perdera la fiabilidad. Adems, como en estos casos las
direcciones y distancias varan, se deberan utilizar varias direcciones y
orientaciones, con lo que al final se puede dar el caso de que las matrices
de coocurrencia sean mayores que las imgenes originales.

En cuanto a las caractersticas extrables de las GLCM, Haralick (1979)


propone 14, de las cuales destacan: energa, entropa, correlacin,
inercia, contraste, homogeneidad local, varianza, media, suma y
diferencia de entropas.

Otra forma de extraer estadsticos de mayor orden para caracterizar las


texturas de las imgenes es mediante las matrices de longitud de rachas
de niveles de gris (Gray Level Run Length, GLRLM). La matriz GLRLM
es una matriz bidimensional en la que cada elemento P(i,j|) da el
nmero total de rachas de longitud j en el nivel de gris i, en la direccin
. Una racha de nivel de gris es un conjunto de pxeles consecutivos con
el mismo nivel de gris en una direccin dada.

Otra alternativa es la construccin de transformadas texturales,


consistentes en construir una nueva imagen J a partir de la original I,
donde el nivel de gris de J se establece como una funcin de I que
indique el nivel de similitud textural de las celdas colindantes a una dada,
(Haralick, 1979).

Otro de los mtodos clsicos de anlisis de texturas ms utilizados es la


funcin de autocorrelacin, la cual mide la periodicidad de la textura para
unas distancias en abscisas y ordenadas. Esta funcin decrece de manera
rpida con la distancia en los casos de primitivas pequeas, mientras que
para primitivas grandes, esta funcin decrece lentamente. De esta
manera, la organizacin espacial queda caracterizada por el coeficiente

27
SPC mediante MIA_____________________________________________________

de correlacin, que es una medida de la dependencia lineal de un pxel


con otro.

Otra aproximacin estadstica que en algunos textos aparece como un


mtodo distinto de anlisis de texturas es determinar el modelo analtico
de la imagen analizada. Estos modelos son generados de manera emprica
mediante mnimos cuadrados, aproximando la intensidad de cada pxel
de la imagen como una media ponderada de las intensidades de los
pxeles vecinos. Los parmetros del modelo definen la textura de la
imagen, de manera que se pueden comparar con los parmetros de las
texturas conocidas para determinar la clase de la textura analizada.
Ejemplos de este tipo de modelos son los Markov Random Fields
(Winkler, 2003), los modelos autorregresivos (Sarkar et al., 1997) o los
modelos fractales (Keller et al., 1989).

2.2.2 Mtodos estructurales

Se trata de modelos que asumen que las primitivas aparecen en conjuntos


regularmente repetidos de manera espacial, basados en la matemtica
morfolgica (Serra, 1982). Este tipo de modelos asume que, para
describir la textura, se deben describir las primitivas y las reglas de
ubicacin de las mismas (Rosenfeld y Lipkin, 1970).

La morfologa matemtica permite procesar la imagen, segmentarla,


extraer sus propiedades estructurales y obtener descripciones
cuantitativas de los objetos. Caractersticas tpicas de estos mtodos son
el rea, excentricidad, elongacin, momentos, compactibilidad de la
regin, etc., que pueden utilizarse en un proceso de clasificacin de
objetos, al igual que puede hacerse con los descriptores de forma. Una
vez caracterizadas las regiones, se caracteriza la estructura espacial de las
mismas por medio de probabilidades.

Una de las limitaciones de este tipo de modelos es que asumen que la


textura de la imagen es peridica o cuasi peridica (Rosenfeld et al.,
1970), por lo que no parecen ser la mejor herramienta para caracterizar
texturas naturales o aleatorias, las cuales no tienen por qu cumplir estas
premisas (Chetverikov y Hanbury, 2002).

28
Captulo 2. Introduccin al Anlisis de Imgenes_____________________________

2.2.3 Mtodos basados en transformaciones de la matriz original

Su intencin es transformar la imagen de forma que las caractersticas de


las texturas sean ms accesibles. Ejemplos de estos mtodos son la
transformacin de la informacin del dominio espacial al dominio
frecuencial mediante la transformada de Fourier (Alsberg et al., 1997,
Walczak, 2000), la cual puede ser utilizada para determinar la frecuencia
espacial de las intensidades de los pxeles. Las texturas finas son ricas en
altas frecuencias, mientras que las texturas bastas sern ricas en bajas
frecuencias. Otro tipo de transformada es la Distribucin de Wigner, que
es una pseudo transformada de Fourier (Song et al., 1995). Ejemplos de
aplicacin al estudio de texturas en cermicas y a la deteccin de
defectos en las mismas pueden encontrase en Boukovalas et al. (1998),
Fioravanti et al. (1995), Song et al. (1995).

Derivados de estos modelos aparecen los mtodos multirresolucin, los


cuales transforman la imagen en una nueva representacin que separa las
caractersticas a diferentes escalas de resolucin. Ejemplos de estas
transformaciones son las wavelets y las transformaciones Gabor
(Monadjemi et al., 2002).

En cuanto a las wavelets, una de las caractersticas ms importantes es


que permiten mantener la estructura textural de las imgenes analizadas,
a la vez que se llevan a cabo compresiones sobre las mismas, lo cual ha
permitido poder llevar a cabo los estudios presentes en esta tesis. Dada la
importancia que tiene esta herramienta para la compresin de
informacin con pocas prdidas, y su adaptabilidad para captar las
distintas frecuencias, fenmeno asociado a la textura en las imgenes, en
el apartado 2.4 se explica con ms detalle este tipo de transformaciones.

Las transformaciones Gabor (Bovik et al., 1990), son particularmente


tiles para describir texturas con caractersticas especficas de orientacin
o de altas frecuencias. De hecho, pueden definirse para tener respuestas
de frecuencias muy estrechas y de orientaciones a la vez que mantienen
la localizacin espacial. Los filtros Gabor se utilizan principalmente en
anlisis de texturas para extraer caractersticas para clasificacin y

29
SPC mediante MIA_____________________________________________________

segmentacin (Porter y Canagarajah, 1997). Estos filtros son una


herramienta muy poderosa cuando las texturas tienen una orientacin
predeterminada, pero no en caso contrario, ya que no son invariantes a la
rotacin (Clausi y Jernigan, 2000), pudindose considerar como un caso
particular de las transformadas wavelets (Van de Wouwer, 1998).

2.2.4 Comparacin de los diferentes mtodos clsicos de anlisis de


texturas

Luo y Savakis (2001) indican que, a pesar de la utilizacin de diferentes


mtodos de anlisis de caractersticas texturales por parte de los
investigadores, ninguno de ellos aparece como claro vencedor sobre el
resto, ya que cada mtodo tiene unas ventajas pero tambin una serie de
inconvenientes.

Esta conclusin parece tener una cierta lgica a la vista de los resultados
que se indican a continuacin, si bien los mismos parecen sealar a los
modelos basados en transformaciones (Gabor y wavelets principalmente)
como el estado del arte en el campo del anlisis clsico de texturas.

En cuanto a la bondad de los distintos modelos estadsticos de anlisis


clsico de texturas, Haralick (1979) indica que las aplicaciones de
autocorrelacin no son tan buenas medidas de textura como las
aplicaciones de coocurrencia. En referencia a este punto, Conners y
Harlow (1980) muestran que esta matriz proporciona mejores resultados
que la GLRLM (matriz de longitudes de recorrido de niveles de gris) y las
caractersticas extrables de la imagen obtenida con la transformada de
Fourier. Muy recientemente Palm (2004) tambin se pronuncia en este
sentido.

Clausi y Jernigan (2000) hacen hincapi en el gran potencial de las


wavelets para su aplicacin a imgenes naturales, donde existen gran
cantidad de frecuencias dominantes. Indican que si los espectros se
solapan, las matrices de coocurrencia funcionan mejor que las
transformadas de Fourier y sus alteraciones (funciones basadas en ellas),
ya que stas quedan fijadas para el dominio temporal o frecuencial, y no
se adaptan a las distintas caractersticas espacio-frecuenciales a la hora de

30
Captulo 2. Introduccin al Anlisis de Imgenes_____________________________

extraer la informacin (coeficientes asociados). Sin embargo, como las


wavelets tienen la capacidad de adaptarse a las distintas caractersticas
espacio-frecuenciales, no tienen este problema de solapamiento, ya que
no quedan fijadas para una frecuencia (dominio) ni para un espacio
(tiempo), sino que se adaptan a cada textura, sin solaparse entre ellas, y
adems no tienen el coste computacional de las matrices de coocurrencia.

Ojala et al., (2001) y Pietikinen et al., (2000) presentan nuevas


caractersticas basadas en distribuciones multidimensionales, indicando
que superan los resultados obtenidos por los Gaussian Markov Random
Fields y por los filtros Gabor, a los que consideran los mtodos ms
potentes. Sin embargo, Monadjemi et al. (2002), aunque los utilizan,
indican que los filtros Gabor tienen un elevado coste computacional.

Song et al. (1992) piensan que a pesar de que los descriptores estadsticos
de textura (tales como las matrices de coocurrencia) son ampliamente
utilizados por los investigadores, necesitan una ventana bastante grande
para calcular las caractersticas de una manera adecuada. Como la textura
(o el defecto asociado) es una propiedad local, si el defecto es mucho
ms pequeo que la ventana utilizada, las caractersticas texturales
calculadas pueden no diferenciar significativamente entre las imgenes
con y sin defectos. As que estas aproximaciones, entre las que se
encuentran las matrices de coocurrencia, son ms apropiadas para la
deteccin de defectos considerablemente grandes.

Pero en texturas aleatorias no es posible saber si los defectos o


caractersticas a estudiar van a tener el mismo tamao, incluso dentro del
mismo tipo de defecto el tamao puede ser distinto. Todo ello hace que
se propongan herramientas que permitan estudiar no slo las
caractersticas geomtricas, sino tambin las espectrales, y una de stas
son las wavelets.

Posteriormente, Song et al. (1995) recalcan de manera explcita que para


texturas aleatorias, los descriptores de textura existentes (GLCM,
Transformadas de Fourier) son bastante inadecuados para la
representacin de las mismas. Ofrecen el ejemplo del mrmol, cuya
textura no obedece a reglas de posicionamiento deterministas y tampoco
muestran periodicidad, lo cual dificulta la deteccin de roturas.

31
SPC mediante MIA_____________________________________________________

Porter y Canagarajah (1997) ya no hablan tan siquiera de las GLCM,


debido a su elevado coste computacional, restringiendo el estudio
textural a herramientas basadas en transformaciones de la matriz original
(imagen). Proponen en principio el uso de las Gaussian Markov Random
Fields, de los filtros Gabor o de wavelets. Un punto a destacar es que los
tres mtodos indicados pueden llevar a una mala clasificacin si hay
rotacin en la imagen o si existe ruido presente, por lo que proponen la
utilizacin de un mtodo invariante frente a las rotaciones. Partiendo de
esta base, van analizando y eliminando las distintas herramientas. De los
filtros Gabor dicen que dependen mucho de la direccin, como ya se ha
comentado. De los Gaussian Markov Random Fields, aunque en
principio parecen una muy buena herramienta, se comprueba despus que
dependen mucho del ruido presente. Las wavelets y los filtros de Gabor
no se ven tan afectados por el ruido, pero las wavelets son menos
sensibles a la direccin, y su complejidad computacional es menor.

Siguiendo esta lnea, Noda et al., (2002) utilizan los Gaussian Markov
Random Fields en combinacin con las transformadas wavelets, las
cuales son empleadas en dicho trabajo como herramienta de extraccin
de caractersticas.

Indahl y Naes (1998), comparan diversos mtodos clsicos de extraccin


de caractersticas texturales de imgenes transformadas en escala de
grises procedentes de mayonesa con el objeto de inferir, por medio de un
modelo de regresin multivariante PCR, caractersticas texturales
sensoriales de la mayonesa. Los resultados que obtienen es que todos los
mtodos utilizados son tiles para el estudio en cuestin, si bien no
obtienen diferencias significativas entre ninguno de ellos.

2.3 Trabajos de anlisis clsico de imgenes aplicados a la


clasificacin automtica.

Existen desarrollados diversos trabajos a la hora de crear modelos que


permitan estudiar imgenes procedentes de procesos reales, y clasificar
los objetos de las mismas como pertenecientes a una clase u otra. Dos
trabajos de anlisis clsico de imgenes relacionados con la presente tesis
han sido los desarrollados por Blasco (2001) en el campo de la

32
Captulo 2. Introduccin al Anlisis de Imgenes_____________________________

citricultura, y por el profesor J.M. Valiente en el campo de la inspeccin


de procesos industriales, fundamentalmente ligados al sector cermico
(Valiente et al., 2001; Valiente et al., 1998) y, en menor grado, al textil
(Valiente et al., 2002 a; Prez et al., 2001).

En el sector cermico la determinacin de la existencia de defectos tales


como manchas, defectos de coccin, defectos serigrficos y, sobre todo,
defectos de integridad, entre los que destacan la falta de material en los
bordes, supone un punto primordial a la hora de establecer la calidad y el
consiguiente precio del producto final. La velocidad de produccin de la
lnea de fabricacin (con velocidades entre 40 y 120 piezas por minuto) y
la existencia de multitud de factores que afectan a la clasificacin
realizada por los operarios (cansancio, condiciones ambientales, estrs,
etc.) constituyen dos aspectos crticos que hacen necesario el
establecimiento de sistemas automticos de visin artificial que faciliten
esta labor, consiguiendo buenos resultados.

En este sentido, Acebrn et al. (2002), Valiente et al. (2002 b), Lpez et
al. (2001) y Lpez et al. (1997), han desarrollado mtodos para la
inspeccin automtica de defectos en piezas cermicas, basados en la
correccin de la posicin de la imagen, el filtrado de determinados falsos
defectos, y la extraccin de caractersticas de sus pxeles (a partir de la
comparacin directa pxel a pxel), tales como rea, permetro, longitudes
de ejes, orientacin, etc. para, a partir de las mismas y mediante el
empleo de distintos algoritmos basados por una parte en distancias a los
distintos tipos de defectos o calidades, y por otra en la cuantificacin de
defectos, determinar la pertenencia de las nuevas imgenes a cada una de
las clases o calidades predeterminadas.

Con el objeto de establecer mejor las distancias, en lugar de emplear los


canales RGB, utilizan los espacios CIE-Lab y CIE-Luv, los cuales
presenta distancias perceptuales del color ms uniformes desde el punto
de vista del sistema de visin humano. CIE-Luv fue desarrollado
pensando en los dispositivos de reproduccin de imgenes: televisores,
etc.; mientras que CIE-Lab se pens ms para la industria del color;
tintes, etc. En cuanto a las aplicaciones de visin por computador el ms
comn es el CIE-Lab con la distancia Eucldea como forma de
diferenciar colores y cuantificar esta diferencia.

33
SPC mediante MIA_____________________________________________________

Los resultados obtenidos son realmente buenos, y los tiempos


conseguidos (entre 0,3 y 1,06 segundos) se adaptan a los requeridos por
los sistemas productivos, si bien dichos mtodos de determinacin de
defectos y de clasificacin han sido empleados sobre imgenes de
cermicas de patrn fijo (no aleatorio).

Asimismo, Lpez et al. (2002) han ampliado dichos estudios a la


clasificacin de tonalidades de modelos de cermicas, a partir de la
extraccin de dos caractersticas de color de cada una de las imgenes, y
su comparacin con las utilizadas como referencia por medio de la
combinacin de algoritmos de clasificacin, basados tambin en
distancias.

En el sector de la agricultura, se han establecido mtodos de clasificacin


de ctricos a partir de sistemas de visin multiespectrales. El desarrollo
de dichas tcnicas ha venido motivado por la inexistencia de mquinas
que distingan y clasifiquen ctricos. Blasco (2001) ha presentado un
mtodo que permite detectar e identificar daos en diversos tipos de
ctricos mediante la utilizacin de un sistema de visin multiespectral,
tanto en el espectro visible como en los canales de fluorescencia, UV e
infrarrojo. Esta informacin puede tratarse de forma conjunta o
individualizada para cada canal estudiado.

El sistema, mediante la utilizacin de longitudes de onda pertenecientes


al espectro visible, disea los algoritmos correspondientes basados en
imgenes transformadas a partir de las originales (J-imgenes o
transformadas texturales), que dependen de la homogeneidad de la
imagen original, y que proporcionan tambin una idea de la textura del
objeto (ctrico) presente en las mismas, si bien el mtodo se centra en
anlisis de la informacin de carcter multiespectral.

Una vez creada la imagen transformada (J-imagen), se define un conjunto


inicial de regiones en la imagen, que se van haciendo crecer hasta que
todos los pxeles son asignados a alguna de las mismas. Mediante
tcnicas de anlisis discriminante que indican la probabilidad de que cada
regin pertenezca a una determinada clase de defecto, se determina cul
es el tipo de defecto presente en la imagen, y mediante diversos
algoritmos se recrea una nueva imagen que debe indicar las zonas sanas y
las daadas del ctrico.

34
Captulo 2. Introduccin al Anlisis de Imgenes_____________________________

Asimismo, se disean algoritmos para los canales de fluorescencia,


basados en umbrales para separar en histogramas las distribuciones de los
pxeles correspondientes a las zonas sin y con defecto. Los algoritmos
para el canal de UV e infrarrojo son una combinacin de los dos
anteriores. Finalmente, tambin disea un algoritmo para el anlisis
global de todos los canales anteriores, que obtiene porcentajes de xito en
la clasificacin superiores al 75%.

Las limitaciones de estos resultados han aparecido ligadas al elevado


coste computacional de los algoritmos desarrollados en trminos de
tiempo de ejecucin, lo cual imposibilita su aplicacin a un sistema de
control por visin artificial en tiempo real, para las necesidades de
produccin del sector en cuanto a velocidad de inspeccin.

2.4 Wavelets: anlisis y compresin de imgenes

Uno de los principales problemas a la hora de analizar imgenes es la


gran cantidad de datos que una imagen supone de por s. Si a ello se le
aade la creacin de estructuras de datos en base a las imgenes, la
complejidad y el tamao de las mismas crecen de manera notable.
Analizar estas enormes estructuras de datos lleva asociado tiempos de
clculo elevados, que pueden hacer inviable su implantacin en sistemas
de control por visin artificial en tiempo real. Es necesario, por tanto,
encontrar herramientas de compresin eficiente de la informacin
contenida en las imgenes que reduzcan drsticamente los tiempos de
procesamiento.

Artculos recientes (Gurden et al., 2003) proponen a las wavelets como


herramientas eficientes de compresin de informacin. Existen diversas
aplicaciones de las wavelets en el anlisis de imgenes, de las cuales se
presentan a continuacin las ms usuales:

Una de las utilidades de las wavelets para el anlisis de imgenes


es que si se lleva a cabo la eliminacin de ruido por medio de las
mismas, de manera previa a su estudio para clasificacin, sta
mejora de manera significativa. La presencia inherente de ruido

35
SPC mediante MIA_____________________________________________________

en imgenes analticas suele llevar a falsas agrupaciones en las


imgenes clasificadas o a la mala clasificacin de algunas
caractersticas o realizaciones.

Otra de las aplicaciones de las wavelets al anlisis de imgenes es


la extraccin de caractersticas a partir de imgenes. Las wavelets
se pueden usar para la deteccin de bordes y anlisis de texturas.
Caractersticas geomtricas en imgenes digitales, tales como
textura y forma, conducen a poblaciones de pxeles agrupadas de
manera coherente mediante medidas de parmetros estadsticos.

Aunque no sea el objetivo de la presente tesis, indicar que todas


las investigaciones muestran claramente que los algoritmos de
compresin por medio de wavelets producen mejores
reconstrucciones que los tradicionales mtodos de suavizado
lineal, especialmente en los casos de elevada variabilidad espacial
de los datos originales.

Para algunos tipos de clasificacin de imgenes se obtienen


resultados iguales o muy similares a diferentes escalas, por lo que
dicha clasificacin debera llevarse a cabo sobre las imgenes
comprimidas. De esta manera se disminuyen considerablemente
los tiempos de computacin.

Las wavelets (Xiong y Ramchandran, 2000) pueden ser consideradas


como microscopios matemticos que permiten realizar ampliaciones y
reducciones de imgenes a mltiples resoluciones.

Una gran ventaja de la utilizacin de las wavelets (Vidakovic, 1999) para


la compresin de imgenes radica en las caractersticas de tiempo-
frecuencia, o ms correctamente, de espacio-frecuencia, de las imgenes
naturales, lo cual requiere de herramientas que sean capaces de capturar
bien estos fenmenos. Como las imgenes, sobre todo las naturales, estn
dominadas por una mezcla de estos fenmenos, las wavelets prometen ser
muy eficientes a la hora de capturar el grueso de la energa de la imagen
en una pequea fraccin de los coeficientes.

36
Captulo 2. Introduccin al Anlisis de Imgenes_____________________________

A un nivel bsico, el objetivo de una herramienta de compresin es ser


capaz de representar todas las seales tiles y fenmenos importantes de
la manera ms compacta posible. En este sentido, la descomposicin
wavelet permite la realizacin del zoom sin ningn coste en trminos de
exceso de redundancia, ya que para una imagen de n1n2 pxeles, hay
exactamente n1n2 coeficientes wavelet. Adems, es conveniente destacar
que precisamente la principal ventaja de las wavelets frente a otros
mtodos de transformaciones basados en modelos, tal como la
transformada de Fourier, es que no slo detectan los fenmenos
importantes, sino tambin dnde se producen (ya sea un instante de
tiempo o un lugar en el espacio).

En cualquier caso, el objetivo es comprimir imgenes (2D) digitales, por


lo que es necesario hallar un tipo de wavelet que permita llevar a cabo
este objetivo, como es el caso de la wavelet bidimensional y discreta,
presentada en el siguiente apartado.

2.4.1 Transformadas wavelets discretas

Cuando se estudian imgenes digitales, las wavelets que se utilizan para


comprimir, descomponer o caracterizar la informacin presente en las
mismas son las wavelets discretas.

La transformada wavelet discreta descompone las imgenes en un


conjunto completo de funciones wavelet que forman una base,
normalmente ortogonal. Toda wavelet se corresponde con dos filtros: uno
de paso alto conocido como funcin wavelet, cuyo fin es detectar las
variaciones de brillo, es decir, las altas frecuencias, dentro de cada
escala; y otro de paso bajo conocido como funcin de escala, a baja
frecuencia, para suavizar las intensidades de los pxeles analizados. La
transformada wavelet discreta se conoce como Discrete Wavelet
Transform o DWT. Para el caso ms comn de transformada wavelet
discreta, con divisiones por un factor de dos, tenemos la dyadic wavelet
transform.

Cuando se comprime una imagen por medio de wavelets, o bien se


utilizan stas para obtener los coeficientes asociados a las bandas de baja

37
SPC mediante MIA_____________________________________________________

y alta frecuencia, se ejecuta un proceso en dos pasos. En primer lugar, la


imagen se muestrea en direccin horizontal, y despus en direccin
vertical, con lo que se obtienen al final cuatro subimgenes. Es decir, que
esta descomposicin wavelet implica aplicar una descomposicin a las
filas y despus otra a las columnas de la imagen digitalizada (Walczak,
2000).

Mediante este mtodo, el cual consiste bsicamente en la aplicacin


consecutiva de transformadas unidimensionales, es posible construir una
transformada wavelet bidimensional, tal como se muestra en la Figura
2.8. De esta manera, a las subbandas obtenidas en la descomposicin se
las suele etiquetar como LL, LH, HL y HH.

LL es la imagen comprimida o suavizada, submuestreada a muy bajas


frecuencias, recogiendo el grueso de la informacin; LH es la subimagen
que contiene la textura horizontal, ya que se ha submuestreado a altas
frecuencias en esa direccin; HL es la que contiene la textura vertical,
por razones anlogas; y HH es la diagonal. Porter y Canagarajah (1997),
indican que el canal HH contiene bsicamente ruido, para cada escala,
por lo que conviene eliminarlo o no estudiarlo, al menos en las primeras
escalas de compresin.

La imagen wavelet proporciona una representacin que es fcil de


interpretar. Las wavelets son funciones de base que se utilizan para
representar la informacin que se pierde al aproximar una funcin (o
imagen) a una resolucin menor. En el caso del anlisis de imgenes, a
las diferencias direccionales se les llama imgenes de detalle de la
imagen, que acompaan a la comprimida.

Con el fin de clarificar el proceso de compresin por medio de estas


herramientas, se expone a continuacin un ejemplo en el cual se
muestran los pasos indicados en la Figura 2.7. Dicho ejemplo se basa en
la aplicacin de la wavelet ms sencilla, conocida como Haar (Trygg y
Wold, 1998), debido a su sencillez y facilidad de comprensin.

En la wavelet Haar, los coeficientes del filtro de la funcin de escala


(paso bajo) son [1,1] , mientras que los coeficientes del filtro de la
funcin wavelet (paso alto) son [1, - 1] . De esta manera, es fcil

38
Captulo 2. Introduccin al Anlisis de Imgenes_____________________________

comprobar que la funcin de escala obtiene como resultado un valor que


es la suma de las intensidades de dos pxeles contiguos, mientras que la
funcin wavelet determina la diferencia de las intensidades de dichos
pxeles. As, mediante la aplicacin de esta transformada, cada dos
pxeles de la imagen en cada direccin (primero horizontal y luego
vertical), quedan convertidos en otros dos, el primero de los cuales
recoge el valor global de los mismos, mientras que el segundo mide la
variacin de sus intensidades.

filtro
X XL + XH

imagen
filtro filtro

LL HL X X
ordenacin LL HL
LH HH X X
LH HH

Figura 2.7. Esquema de la descomposicin llevada a cabo por la 2D DWT.

Si se dispone de una imagen que se desea comprimir, tal como la de la


Figura 2.8, la compresin mediante una DWT se lleva a cabo en dos
fases.

En primer lugar, la transformada se aplica a las filas, y despus a las


columnas. El primer paso consiste en aplicar la wavelet en direccin
horizontal, de manera que se obtienen las imgenes XL y XH,
correspondientes a la imagen comprimida por filas y la imagen de
detalles verticales, tal como se aprecia en la Figura 2.9.

39
SPC mediante MIA_____________________________________________________

Imagen original a comprimir

50

100

150

200

250

300

350

400

450

500
50 100 150 200 250 300 350 400 450 500

Figura 2.8. Imagen original a comprimir.

En la imagen de detalles se puede apreciar las variaciones de brillo que se


producen en direccin vertical, y que parecen delimitar aquellos
contornos verticales de la imagen, principalmente asociados en este
ejemplo a la chica de la imagen. Por su parte, la imagen suavizada se
podra asimilar a la imagen original apretada, pero bsicamente la
misma.
Paso 1: compresin de la informacin por filas, detalles verticales

50

100

150

200

250

300

350

400

450

500
50 100 150 200 250 300 350 400 450 500

Figura 2.9. Imgenes comprimidas por filas y de detalles verticales.


40
Captulo 2. Introduccin al Anlisis de Imgenes_____________________________

A continuacin, a estas imgenes se les aplica de nuevo la transformada


wavelet, pero ahora en direccin vertical, obteniendo as los canales LL y
LH correspondientes a las imgenes comprimida y de detalles
horizontales; y los canales HL y HH, correspondientes a las imgenes de
detalles verticales y de detalles diagonales (Figura 2.10).

Al aplicar la compresin por columnas, se puede comprobar cmo ahora


el canal HH (subfigura inferior derecha) no recoge prcticamente
informacin, lo cual refuerza de alguna manera los comentarios de Porter
y Canagarajah (1997), mientras que las imgenes de detalle vertical
(subfigura superior derecha) y de detalle horizontal (subfigura inferior
izquierda) recogen las variaciones de brillo (concepto asociado a la
textura) en las direcciones vertical y horizontal. De hecho, en la imagen
horizontal se puede ahora intuir los escalones existentes detrs de la
chica, as como las ondulaciones de la bufanda, tambin horizontales.

Imagen de los cuatro canales

50

100

150

200

250

300

350

400

450

500
50 100 150 200 250 300 350 400 450 500

Figura 2.10. Canales LL (imagen superior izquierda), HL (superior derecha), LH (inferior


izquierda) y HH (inferior derecha).

41
SPC mediante MIA_____________________________________________________

Por ltimo, tambin se puede apreciar cmo la imagen comprimida es


bsicamente la misma que la original, pero reducida a una cuarta parte de
sus dimensiones. La Figura 2.11 muestra en detalle el canal LL,
correspondiente a la imagen comprimida.

Como se ha podido comprobar en el ejemplo anterior, cada subimagen


contiene informacin de una escala y orientacin especficas, las cuales
han sido convenientemente separadas. La informacin espacial queda
retenida, para cada escala y orientacin, dentro de las subimgenes
correspondientes.
Imagen del canal LL

50

100

150

200

250
50 100 150 200 250

Figura 2.11. Imagen comprimida, canal LL.

Dado que no hay ninguna razn para esperar que cualquiera de las
subimgenes contenga ms informacin que el resto, de cara al anlisis
textural habra que estudiar, en un primer momento, todas las
subimgenes, para ver cul o cules de ellas resultan ms informativas.

Despus, si se comprueba que existen determinadas subimgenes que


proporcionan ms informacin, se pueden analizar dichas subimgenes,
obteniendo de ellas ms subimgenes a su vez, hasta conseguir el
mximo poder discriminante o la mejor caracterizacin posible.

42
Captulo 2. Introduccin al Anlisis de Imgenes_____________________________

En este sentido, hay que destacar los comentarios de Unser (1995), quien
indica que se suele extraer ms informacin con dos o tres niveles de
escala que con uno solo, y que el porcentaje de aciertos en la
clasificacin aumenta con el nmero de escalas.

Tambin es muy importante destacar el hecho de que muchos estudios


comparativos concluyen que la eleccin de la wavelet tiene poca
influencia sobre los resultados finales (Livens et al., 1997).

2.4.2 Otros tipos de wavelets discretas: Wavelet Packet Transform

Existen tipos de imgenes (o subimgenes significativas) que tienen


informacin tanto a baja como a alta frecuencia dentro de cada escala o
nivel de compresin. Por ello, es conveniente buscar wavelets que sean
capaces de proporcionar informacin completa de todas las bandas de
frecuencias, asociadas a la ocurrencia de distintos fenmenos o
caractersticas en la imagen.

Esto motiva la bsqueda de transformaciones alternativas con una mayor


capacidad de adaptacin a la informacin de la imagen en su
representacin, y ms robustas para una gran clase de imgenes de
caractersticas espacio-frecuenciales desconocidas o mal ajustadas.

Ambos requerimientos quedan recogidos en una generalizacin de la


transformada wavelet, llamada descomposicin wavelet packet (Walczak,
2000, Alsberg et al. 1997), tambin conocida como sistema best basis.
Como en el caso de las 2D DWT, la WPT se puede extender a dos
dimensiones. Las Wavelet Packets suelen ir asociadas a Bases, las cuales
se encuentran por medio de algoritmos.

Mientras que las wavelets se ajustan mejor a seales que tienen un


espectro de energa menguante, las wavelet packets pueden ajustarse a
seales con perfiles espectrales arbitrarios, tales como seales con fuertes
componentes estacionarios de alta frecuencia o media frecuencia, es
decir, que permiten caracterizar bien tanto el grueso de la informacin
recogida en la imagen suavizada, como la informacin textural recogida

43
SPC mediante MIA_____________________________________________________

en las subimgenes de detalles de los primeros niveles de compresin, la


cual quedara desechada conforme dichos niveles aumentan.

2.4.3 Ventajas de las wavelets para el anlisis de texturas

Tsatsanis et al. (1992) comentan que la mayor parte del trabajo


relacionado con el problema de la textura realizado hasta esa fecha lo ha
sido desde un punto de vista determinista y estocstico, de manera que la
textura se considera como generada por la repeticin de un elemento
estructural con una determinada probabilidad. Ello hace que los mtodos
desarrollados sean de aplicacin sobre todo a texturas artificiales, donde
las caractersticas a estudiar s deben seguir un patrn ms o menos
repetitivo. Sin embargo, para texturas naturales se hace ms adecuado
otro tipo de herramientas o mtodos, asociados a las caractersticas
estadsticas de la imagen que se pueden utilizar para la discriminacin de
texturas, en el espacio o en la frecuencia. Dentro del campo del anlisis
clsico de texturas, proponen la utilizacin de los mtodos basados en
transformaciones, tales como las transformadas Fourier, Gabor o Wigner,
o bien las wavelets.

Bharati et al., (2004), proponen a las wavelets como el estado del arte en
el anlisis textural. De todas formas, parece haber una gran similitud
entre las Gabor y las wavelets (Van de Wouwer, 1998). Livens (1998)
indica que, en aplicaciones prcticas, la decisin relevante radica en el
hecho de utilizar transformaciones discretas, ms rpidas, o continuas,
ms precisas, y no en el tipo de funcin utilizada (Gabor, wavelets u
otras).

La utilizacin de las wavelets en la presente tesis surge a partir de la


necesidad de comprimir la gran cantidad de datos presentes en una
imagen y que conforman la misma, sin perder informacin, sobre todo a
nivel textural. Relacionado con esta necesidad, Walczak y Massart
(1997) comentan que las wavelets son capaces de comprimir los datos
eliminando la informacin irrelevante, y manteniendo por tanto la
informacin relativa a la estructura espacio-frecuencial (a no ser que
existan texturas muy especficas que se den a determinadas direcciones y

44
Captulo 2. Introduccin al Anlisis de Imgenes_____________________________

elevadas frecuencias, que son las que se eliminaran con los primeros
escalados).

Porter y Canagarajah (1997) comentan, al igual que en otros trabajos de


otros autores (Livens et al., 1996), que un determinado tipo de wavelet no
es crtico, si bien proponen la wavelet Daubechies-4 por su gran
capacidad de clasificacin de texturas, y la pequea complejidad de su
filtro, asociado a un menor coste computacional. Indican que el canal HH
slo contiene ruido, por lo que es conveniente eliminarlo.

Livens (1998) comenta que si bien las Gabor han tenido xito en el
anlisis textural, debido a su aspecto de multirresolucin, las wavelets se
muestran ms fciles de implementar, siendo igualmente una tcnica de
multirresolucin, por lo que se las puede utilizar con garanta para el
anlisis textural.

Un trabajo muy reciente llevado a cabo por Soltanian-Zadeh et al.,


(2004) introduce un nuevo tipo de wavelets, las multiwavelets, como
herramientas muy potentes para la extraccin de caractersticas
texturales, mejorando los resultados obtenidos por las wavelets y por la
matriz de coocurrencias y otras caractersticas de forma.

Todos estos comentarios hacen pensar en la bondad de las wavelets para


analizar texturas, lo cual deriva en la decisin de utilizarlas en futuros
trabajos para estudiar su potencial, a la vez que se comprime la
informacin presente en las imgenes originales.

45
SPC mediante MIA_____________________________________________________

3 ANLISIS MULTIVARIANTE DE IMGENES

Como se ha visto en el apartado anterior, el anlisis de imgenes clsico


se centra en la caracterizacin de una imagen a partir de parmetros
previamente definidos, y trabajando sobre las dimensiones espaciales de
la imagen. Este tipo de anlisis suele proporcionar buenos resultados en
general, sobre todo cuando las estructuras de la imagen son conocidas a
priori. Este puede ser el caso de piezas con dimensiones conocidas,
materia textil con patrones determinsticos, etc. Sin embargo, el anlisis
de imgenes procedentes de fenmenos naturales, o bien de procesos
donde la localizacin de defectos o caractersticas es aleatoria, resulta
ms complejo.

Por otro lado, la caracterizacin de una pieza o fenmeno existente en


una imagen puede estar relacionada con parmetros o variables que no
han sido tenidas en cuenta a la hora de llevar a cabo la extraccin de las
mismas por medio de las tcnicas clsicas de anlisis de imgenes. De
hecho, la compleja estructura de correlaciones en la estructura espacial
que puede tener una imagen se ve aumentada en los ltimos aos por la
llegada al mundo industrial de las imgenes en color RGB, lo cual
provoca que dichas correlaciones se den, ya no slo en la localizacin
espacial, sino tambin a nivel espectral, debido al elevado grado de
correlacin que suele aparecer entre estos canales; e incluso diferencias
de correlaciones entre las estructuras espaciales en funcin del canal de
color estudiado.

Desde finales de los 80 (Geladi et al., 1989), se empez a promover


dentro del mundo de la quimiometra la posibilidad de estudiar la imagen
multivariante de una manera alternativa, considerando sta, no como un
todo, sino como un conjunto de individuos (pxeles) que representan los
elementos de la muestra u observaciones. A esta manera de analizar las
imgenes se la conoce como MIA (Multivariate Image Analysis)
(Esbensen y Geladi, 1989).

46
Captulo 2. Introduccin al Anlisis de Imgenes_____________________________

3.1 Anlisis de imgenes por medio de modelos de estructuras


latentes

La aplicacin del MIA requiere inicialmente transformar la imagen


multivariante en una nueva estructura, donde las filas se corresponden
con los pxeles, mientras que las columnas se corresponden con los
canales de color o multiespectrales. Una vez dispuesta la nueva estructura
de datos derivada de la imagen multivariante, sta se puede analizar por
medio de modelos de estructuras latentes, los cuales proporcionan como
resultado un nuevo espacio latente que caracteriza todos los fenmenos
existentes en la imagen, tal como muestra la Figura 2.12.

Mediante la aplicacin de modelos de compresin del tipo de Anlisis de


Componentes Principales, PCA (Principal Component Analysis), se
extraen los vectores columna de la matriz T, los cuales representan una
media ponderada de las intensidades de los pxeles en funcin de la
importancia de cada canal de color sobre cada una de las direcciones
principales extradas que constituyen el espacio latente P, que caracteriza
la imagen. De esta manera, cada vector ta se obtiene como (asumiendo un
modelo PCA):

t a = Xp a (2.1)

mientras que la matriz de residuos E se obtiene como diferencia entre la


matriz X y su prediccin, por medio de la expresin:

E = X TP T (2.2)

Por medio de estos modelos (los cuales se explican en detalle en el


captulo 3) es posible, por tanto, caracterizar las imgenes sin necesidad
de definir a priori cules van a ser los parmetros que mejor caracterizan
las mismas, y que tal vez las distinguen de otros tipos. De hecho, esta
eleccin puede resultar difcil en situaciones en las cuales se desconoce
qu fenmeno o fenmenos estn caracterizando realmente una imagen,
y la posibilidad de extraer un elevado nmero de parmetros o
caractersticas a priori no garantiza que sea ninguno de ellos el que mejor
defina la imagen, o el que realmente establezca diferencias respecto de
otros tipos de imgenes.

47
SPC mediante MIA_____________________________________________________

J
n2
J

n2
n2
n2
Imagenn1
multiespectral
(multivariante
con J canales de
n1
color)
n1 I=n1n2

A J

+
Aplicacin de modelos
de compresin

I I

T E

Figura 2.12. Esquema de la transformacin de una imagen multiespectral de J canales


de color en una matriz de caractersticas y una matriz de residuos.

Asimismo, el hecho de que los pxeles que presenten las mismas


caractersticas se agrupen en la misma zona del nuevo espacio latente
permite de manera relativamente sencilla su reubicacin en la imagen
original, facilitando de esta manera la deteccin y localizacin de
fenmenos de tipo aleatorio, tales como enfermedades, manchas, picadas,
rayas, etc.

48
Captulo 2. Introduccin al Anlisis de Imgenes_____________________________

Los trabajos de MIA comenzaron a desarrollarse en los pases nrdicos


por parte principalmente de los profesores Geladi y Esbensen dentro del
campo de la medicina y del mundo de los satlites (Esbensen y Geladi,
1989; Geladi et al., 1989; Geladi y Esbensen, 1989; Lindgren y Geladi
1991; Geladi et al. 1992; Geladi et al. 1992; Geladi, 1992; o Geladi y
Grahn, 1996).

Dentro del campo del control de procesos, el grupo de la McMaster


University, liderado por el profesor MacGregor, ha llevado a cabo un
importante trabajo relacionado con los temas de control de procesos
basados en MIA. Estas tcnicas, aunque son poco efectivas a la hora de
llevar a cabo operaciones tradicionales de anlisis de imgenes tales
como mejora de la imagen, reconstruccin, etc., se muestran ms
potentes para extraer la informacin subyacente en procesos estudiados
por medio de variables de naturaleza temporal (o espacial), las cuales son
tpicas de procesos de control (Bharati y MacGregor, 1998). Estos
autores utilizan el MIA en tiempo real en lo que ellos definen como una
aproximacin del Control Estadstico Multivariante de Procesos
(Multivariate Statistical Process Control, MSPC) on-line al MIA, que
puede ser un potente mtodo para analizar y monitorizar muchos
procesos industriales dependientes del tiempo. La tcnica de control se
basa en la deteccin de los pxeles que presentan las caractersticas o
defectos de inters, y su control por medio de la cantidad de pxeles
existentes en la zona del espacio latente asociada a dichas caractersticas
o defectos. Seguidamente, Bharati y MacGregor (2000) utilizan el MIA
con fines de control de procesos, si bien proponen la utilizacin de
diversos estadsticos con fines clasificatorios. Bharati (2002) aplica MIA
para la deteccin de defectos o caractersticas, que despus son
clasificados en funcin de los mismos. Este tipo de estudios se ha
desarrollado posteriormente con los trabajos de Bharati et al. (2003), Yu
et al. (2003), Yu y MacGregor (2003), Bharati et al. (2004) y Liu et al.
(2005).

Recientemente, el grupo de la profesora Buydens est desarrollando


tambin trabajos dentro del campo de la segmentacin y del
agrupamiento de clases a partir de imgenes multivariantes (Noordam et
al., 2002; Noordam et al., 2003; Noordam et al., in press; Tranh et al., in
press), introduciendo en los dos ltimos el anlisis conjunto de la
informacin de carcter espectral y espacial, si bien este ltimo tipo de

49
SPC mediante MIA_____________________________________________________

informacin se estudia por medio de la extraccin de caractersticas, a


partir de tcnicas de anlisis clsico de imgenes.

La extensin de los modelos PCA de proyeccin sobre estructuras


latentes a los modelos N-way, que pueden analizar directamente las
estructuras de datos, ha dado lugar a los trabajos de Corcoux et al.
(2002), Gurden et al. (2003) y Huang et al. (2003).

3.2 Prediccin por medio de modelos de estructuras latentes

En aquellos casos en los que se dispone de datos de salida relacionados


con las imgenes analizadas, es posible construir modelos de regresin en
mnimos cuadrados parciales PLS (Partial Least Squares regression), los
cuales tambin sern analizados en el captulo 3, al igual que los de tipo
PCA, comentados anteriormente. El objetivo final es construir un modelo
que relacione la informacin presente en la imagen con los datos de
salida, los cuales pueden estar formados a su vez por otras imgenes, o
bien por datos de distinta naturaleza, tales como edad (evolucin
temporal), parmetros analticos o mecnicos procedentes de anlisis o
ensayos (grado de corrosin, concentracin de ciertas sustancias,), o
incluso variables artificiales dummy asociadas a cada tipo de imagen en
el caso de un anlisis discriminante, etc., de manera que se pueda calcular
nuevas predicciones de las variables de salida a partir de las nuevas
imgenes.

La aplicacin de estos modelos a imgenes multivariantes dio lugar a lo


que se denomina MIR (Multivariate Image Regression) (Esbensen et al.,
1992), dentro del mbito general del anlisis multivariante de imgenes.

Los modelos MIR pueden clasificarse en tres tipologas:

los modelos cuyo fin es llevar a cabo una prediccin inferencial


cuyo resultado es una imagen de salida. Por ejemplo, aqullos
cuyo fin sea detectar, cuantificar y localizar espacialmente un
tumor en un paciente, o zonas de una fruta afectadas por una
enfermedad;

50
Captulo 2. Introduccin al Anlisis de Imgenes_____________________________

los modelos cuyo fin es tambin inferencial, pero cuyo resultado


son valores de una o varias variables de salida, tales como
aqullos cuyo fin sea cuantificar el tono de una cermica, la
resistencia de una pieza o el grado de madurez de una fruta;

La Figura 2.13 presenta de manera esquemtica la idea en la cual se


basan estos modelos.

J R
n2
J

Modelo
n2 PLS
n2
n2
Imagenn1
multiespectral
(multivariante
con J canales de
n1
color)
n1 I=n1n2 I

Figura 2.13. Esquema de la construccin de un modelo PLS con un fin inferencial.

y aqullos cuyo fin es llevar a cabo una clasificacin de la nueva


imagen proyectada, a partir de la construccin de un modelo
discriminante PLS-DA, como puede ser el caso de la clasificacin
o localizacin de productos en un almacn mediante robots de
visin artificial, la clasificacin de fruta en funcin de su
enfermedad en una cooperativa, etc.

La Figura 2.14 presenta el esquema correspondiente a la construccin de


este tipo de modelos. Bsicamente, se trata del mismo esquema que el
presentado en la Figura 2.13, pero con la adicin de tantas imgenes
como clases se disponga, y la creacin de variables de salida artificiales,
denominadas variables dummy, asociadas a cada tipo de imagen.

51
SPC mediante MIA_____________________________________________________

J C
n2 1 0
J
1 0
1 0
. .
n2
. .
n2
. .
n2
. .
Imagenn1 . .
multiespectral . .
clase 1 Modelo . .
(multivariante PLS . .
ncon
1
J canales . .
n1
de color) I=n1n2 I 1 0
n2 0 1
J 0 1
0 1
. .
n2 . .
n2 . .
n2 . .
Imagenn1 . .
multiespectral . .
clase 2 . .
(multivariante . .
ncon
1
J canales . .
n1
de color) I=n1n2 I 0 1

Figura 2.14. Construccin de un modelo PLS-DA para la clasificacin de dos tipos de


imgenes.

Al igual que en el caso del MIA, el MIR aparece por primera vez en los
trabajos desarrollados por parte de los profesores Geladi y Esbensen.
Geladi y Esbensen (1991) aplican una regresin a partir de componentes
principales (PCR, Principal Component Regression) a partir de imgenes
satlite. Ejemplos clnicos de la aplicacin MIR se pueden encontrar en
Esbensen et al. (1992) y en Grahn y Sf (1992), mientras que de tipo
industrial aparecen en Esbensen y Lied (1999) y Lied et al. (2000). Lied
et al. (2001) llevan a cabo un anlisis clasificatorio discriminante basado
en modelos inferenciales de estructuras latentes aplicados en el campo
agroindustrial.

52
Captulo 2. Introduccin al Anlisis de Imgenes_____________________________

3.3 Anlisis de textura mediante modelos de estructuras latentes

Como ya se ha comentado, la textura est relacionada con las


caractersticas espaciales existentes en cada zona de la imagen. El peligro
del desplegado que lleva a cabo la estrategia MIA es que se pierde la
correlacin de carcter espacial existente en la imagen.

Bharati y MacGregor (2000) han abordado este problema y han


propuesto un mtodo de anlisis textural basado en tcnicas de
proyeccin sobre estructuras latentes a partir de matrices de datos que
acumulan, para cada pxel, la informacin de sus pxeles vecinos. De esta
manera se conserva la informacin espacial, pero sin la necesidad de
recurrir a la extraccin a priori de caractersticas basadas en el anlisis
clsico de imgenes.

El esquema de esta tcnica se presenta en la Figura 2.15. Una vez se ha


tomado la imagen, sta se despliega mediante la aplicacin de la
estrategia MIA. Ello da lugar a un nico vector, correspondiente a los
niveles de gris de los pxeles de la imagen. Si a cada uno de estos pxeles,
que forman las muestras a analizar, se le asocia el nivel de gris de los
pxeles vecinos, se obtiene una matriz que, en lugar de incorporar la
informacin de carcter espectral de cada pxel de la imagen, integra en
cada fila la informacin espacial asociado a dicho pxel.

La limitacin de este mtodo radica en que, conforme aumentamos el


rea o amplitud de la ventana de vecindad, medida en pxeles, se pierde
informacin de los bordes, concretamente la raz del nmero de pxeles
almacenados (incluyendo el original) menos una lnea y columna,
distribuidas equitativamente de arriba abajo y de izquierda a derecha. Es
decir, que si se desea estudiar los pxeles inmediatamente vecinos a uno
dado, stos son ocho, ms el original nueve, de manera que perderemos
dos lneas y dos columnas de pxeles: una por arriba, otra por abajo, otra
por la izquierda y otra por la derecha.

La cantidad de informacin espacial a acumular, es decir, el nmero de


pxeles vecinos a estudiar, va a depender de las caractersticas de la

53
SPC mediante MIA_____________________________________________________

imagen, del objeto y del problema que estemos estudiando, as como de


la escala empleada. En este sentido, Haralick (1979) expone que las
texturas se hacen cada vez ms gruesas conforme nos acercamos al
objeto. As, determinadas texturas, para un determinado zoom o escala
se caracterizarn por unas frecuencias propias, que quedarn recogidas en
una determinada rea de pxeles.

n2

Imagen en escala
de grises + =
n1

I=n1n2

Figura 2.15. Incorporacin de la informacin espacial asociada a cada pxel de la


imagen. Por simplicidad, se ha supuesto el caso de incorporacin de los pxeles
inmediatamente vecinos a uno dado.

De esta manera, el rea mnima a utilizar podra ser aquella que recoge la
textura ms gruesa, aunque esto es algo que tambin puede depender del
nmero y tipo de texturas, y del poder predictivo o discriminante del
modelo que se est utilizando, en funcin de los pxeles vecinos
acumulados, ya que el hecho de recoger toda la informacin para una
textura puede confundir otras, y viceversa.

Debido a la naturaleza de los modelos de estructuras latentes, donde el


objeto deja de ser la imagen en su conjunto, pasando a serlo cada uno de

54
Captulo 2. Introduccin al Anlisis de Imgenes_____________________________

los pxeles de la imagen, se consigue un doble objetivo: en primer lugar,


se permite que las caractersticas texturales puedan localizarse de manera
aleatoria en la imagen, ya que las ventanas asociadas a cada pxel y que
caracterizan la textura de la imagen han sido separadas en las diferentes
observaciones que integran el conjunto de la imagen; y en segundo lugar,
mediante la utilizacin de esta propuesta se consigue un mtodo
invariante a la orientacin, algo muy necesario para esta tesis, enfocada
sobre texturas naturales, aleatorias.

Una vez entrenados por medio de la filosofa del MIA, los modelos de
proyeccin pueden utilizarse para extraer propiedades similares de
textura de otras imgenes correspondientes a otras superficies, mediante
la utilizacin de mscaras, y seleccin as de los pxeles de inters; o bien
llevar a cabo un control del proceso basado en imgenes.

Bharati (2002) compara el mtodo explicado anteriormente con la GLCM


(Gray Level Coocurrence Matrix), as como con la 2D FFT (2D Fast
Fourier Transform o Transformada Rpida de Fourier Bidimensional).

Los resultados de dichas comparaciones son que el mtodo propuesto por


Bharati funciona mejor que la GLCM, mientras que la tcnica basada en
la 2D FFT proporciona resultados igual de buenos que el mtodo de
desplazamiento y superposicin de imgenes.

Este ltimo resultado hace pensar que tal vez el anlisis basado en la
extraccin de caractersticas va wavelets proporciona unos resultados tal
vez mejores, o al menos del mismo nivel.

De hecho, un ltimo y muy reciente trabajo de Bharati et al. (2004)


presenta un anlisis de textura basado en wavelets, a partir de
coeficientes extrados de los canales de detalle a diversas escalas de
imgenes en escala de grises, donde dicho mtodo aparece como el mejor
de entre los diversos anlisis de textura basados en caractersticas y
modelos estudiados (FT, GLCM, PLS-DA, el enfoque de desplazamiento
de imgenes propuesto por Bharati y MacGregor (2000), y el basado en
los coeficientes de detalle wavelets). Asimismo, tambin indica que las
wavelets son mejores que las transformadas Gabor debido a que cuando
se discretizan, mantienen mejor la localizacin espacial y frecuencial.

55
SPC mediante MIA_____________________________________________________

3.4 Integracin de la informacin espectral y textural

Tal como se ha visto en el anteriormente, existen dos tipos de


informacin que se pueden utilizar para analizar las imgenes: la
espectral y la espacial, cada una de las cuales es ms til en unos casos
que en otros.

En la actualidad, resulta relativamente barato disponer de cmaras RGB,


las cuales proporcionan una mejor informacin que las cmaras de nivel
de gris. De esta manera, es posible obtener una gran cantidad de
informacin asociada al proceso de produccin, sin la necesidad de
recurrir a pruebas de laboratorio, en muchos casos destructivas, y que
suponen un retraso en las acciones posibles a realizar, o incluso poder
regular el proceso directamente a partir de la informacin visual, o de
llevar a cabo cualquier tipo de control o clasificacin.

Sin embargo, en la actualidad existen muy pocos trabajos que hayan


integrado el color y la textura, a pesar de que dicha integracin se ha
mostrado ventajosa (Palm, 2004). Ejemplos recientes son: Ozyildiz et al.,
(2002), que integran ambos tipos de informacin por medio de Markov
Random Fields; o Khotanzad y Hernndez (2003), que utilizan
Multispectral Autorregresive Random Fields en el espacio RGB.

Palm (2004) utiliza matrices de co-ocurrencia aplicadas a los canales de


color de los espacios RGB y Luv para la clasificacin de imgenes,
mostrando que la informacin espectral mejora los resultados derivados
de las caractersticas texturales aplicadas a niveles de gris. Tambin
Foucherot et al., (2004) amplan la utilizacin de las Matrices de
longitudes de racha y de coocurrencia a imgenes en RGB.

Bharati (2002) propone la integracin de ambos tipos de informacin,


pero no llega a realizarla.

El hecho de tener dos tipos de informacin, espectral y textural,


altamente correlacionada, as como la disponibilidad de una herramienta
que permite comprimir de manera eficiente este tipo de informacin, a la
vez que es capaz de manejar estructuras relativamente grandes de datos,

56
Captulo 2. Introduccin al Anlisis de Imgenes_____________________________

ha llevado a plantear la posibilidad de incorporar toda esta informacin


en una nica estructura de datos, tal como se presenta en la Figura 2.16.

A partir de la imagen RGB, de dimensiones n1n2, para cada canal de


color, se obtiene la matriz de informacin espacial mediante el
desplegado de la imagen y la incorporacin de las intensidades relativas a
los pxeles vecinos. As se obtiene un total de tres matrices,
correspondientes a los tres canales de color Rojo, Verde y Azul, de
dimensiones I=n1n2 y J=(2v+1)2, siendo v el entorno de vecindad
estudiado (distancias de 1, 2 o ms pxeles).

Superponiendo estas tres matrices, se obtiene la estructura interna 3-way


final, de dimensiones I,J,K (donde en este caso K=3). Por supuesto, el
nmero de canales espectrales puede ser ampliado en funcin de los
canales disponibles, as como por la naturaleza de la informacin
registrada: Rayos X, NIR, UV, etc.

K=3
n2 J
n2
J
n2 J
Imagen
Imagen
RGB Imagen Textural
Imagen
RGB Imagenpara el canal
Textural
RGB Imagen para Azul
el canal
Textural
n1 para el canal
Verde
n1 I=n1n2
Rojo
n1
I=n1n2
I=n1n2

Figura 2.16. Creacin de la estructura interna 3-way, a partir de la creacin de las


matrices de informacin espacial para cada canal de color de las imgenes RGB, de la
manera en que se muestra en la Figura 2.15.

Una vez dispuesta esta estructura, ya es posible analizarla a partir de los


modelos de proyeccin de estructuras latentes que se explican en el
siguiente captulo, bien directamente por medio de los modelos N-way, o
bien a travs de los modelos 2-way. En este ltimo caso, es necesario
desplegar una vez ms la estructura 3-way, simplemente incorporando en

57
SPC mediante MIA_____________________________________________________

una sola estructura bidimensional cada matriz asociada a cada canal de


color, tal como aparece en la Figura 2.17.

JK

Imagen Textural Imagen Textural Imagen Textural


para el canal para el canal para el canal
Rojo Verde Azul

I=n1n2 I=n1n2 I=n1n2

Figura 2.17. Desplegado de la estructura interna 3-way para su anlisis por medio de
modelos 2-way.

Como ya se ha comentado, hasta la fecha se han llevado a cabo diversos


estudios sobre imgenes basados en modelos N-way y que se explicarn
en el captulo 3, tales como PARAFAC o Tucker3, a los que se les llama
N-way Image Analysis (Huang et al., 2003) en unos casos, y Multivariate
Image Analysis, MIA, (Gurden et al., 2003) en otros casos.

A continuacin se intenta justificar la nomenclatura empleada en la


presente tesis, diferenciando entre N-way Image Analysis y Multivariate
Image Analysis, as como los motivos por los que el autor considera que
aplicar modelos N-way a estructuras de datos N-way, a partir de la
filosofa empleada por MIA, debe denominarse MIA y no N-way Image
Analysis.

Para comenzar la discusin, cabe recordar que una imagen multivariante


es un conjunto de imgenes congruentes desde el mismo punto de vista
medidas para una serie de variables diferentes, tales como: longitudes de
onda, frecuencia, espacio, tiempo, etc. (Geladi y Grahn, 1996).

Una imagen multivariante puede crearse formando, a partir de una nica


imagen 2-D, una pila de imgenes formada por la imagen original a la
que se van superponiendo la misma imagen desplazada una serie de

58
Captulo 2. Introduccin al Anlisis de Imgenes_____________________________

pxeles en las direcciones horizontal, vertical y diagonal. Esta idea se


desarrolla en el trabajo llevado a cabo por Bharati y MacGregor (2000).

De esta manera, se consigue una estructura multivariante, en la que las


observaciones son los pxeles de la imagen original, y las variables
quedan constituidas por la informacin espacial relativa a las
intensidades de niveles de gris (caso de imgenes en escala de grises), o
bien las intensidades de cada banda de longitudes de onda (caso de
imgenes procedentes de cmaras multiespectrales) de los pxeles
vecinos.

En este ltimo caso, se dispondra de dos modos de variacin natural, dos


series de variables, compuestas por un lado por la informacin espectral
y, por el otro, por la informacin espacial aportada por los pxeles
vecinos.

Algunos autores, como Huang et al. (2003) definen las estructuras de


datos de imgenes (N-way image data) como la superposicin de
imgenes que usualmente tienen similares propiedades, ya sea de tipo
qumico, biolgico, etc., sin analizar antes la estructura interna de los
datos presentes en la estructura fsica o dimensin de los mismos.
Suponiendo una estructura 3-way, asumen estructuras de los tipos OOO,
OOV, OVV y VVV, donde O indica una direccin correspondiente a
objetos (pxeles) y V de variables. Ejemplos de dichas estructuras pueden
encontrarse en Huang et al. (2003).

Huang et al. (2003) analizan directamente la imagen, sin llevar a cabo el


desplegado de la misma, por medio de modelos 3-way, tales como
PARAFAC o Tucker3. Explican que MIA, asociado al desplegado total de
la estructura geomtrica o interna de los datos a una matriz 2-way y su
anlisis mediante modelos PCA (Unfold-PCA), resulta apropiado para
anlisis descriptivos y de clasificacin, mientras que Tucker3 debera
aplicarse a compresin, de-noising (filtrado de ruido), etc., y PARAFAC
slo debera aplicarse en caso de tener tantas variables como objetos
(pxeles).

En la presente tesis se considera que, si se desea estudiar la diversa


informacin existente en el campo de las imgenes, debera resultar ms
conveniente, en principio, que las muestras quedasen constituidas por los

59
SPC mediante MIA_____________________________________________________

pxeles (desplegando cada una de las imgenes correspondientes, de


dimensiones n1n2 en una columna de dimensin I=n1n2), y no por la
imagen completa en s, la cual consumira adems dos modos de
variacin o dimensiones de la estructura interna de los datos, lo cual no
parece muy correcto desde el punto de vista terico.

De esta manera, y utilizando la nomenclatura de Esbensen et al. (1988),


no se utiliza la estructura dimensional de los datos On1On2VJVK, sino la
estructura interna o geomtrica de los mismos, OIVJVK, con lo que se
obtiene una estructura 3-way, donde el primer modo queda constituido
por los pxeles de la imagen, y los otros dos modos por la informacin de
tipo textural y espectral, respectivamente, tal como muestra la Figura
2.18.
K

J J
K

n2 Desplegado

n1

I=n1n2

Estructura 4-dimensional de los Estructura geomtrica o interna


datos OOVV 3-way de los datos OVV

Figura 2.18. Estructuras dimensional y geomtrica de los datos.

Por otro lado, y como ya se ha comentado anteriormente, Gurden et al.


(2003) denominan Multivariate Image Analysis a cualquier tipo de
anlisis llevado a cabo sobre imgenes, ya sea utilizando PCA o
PARAFAC, y desplegando o no la estructura interna de datos presentes en
la imagen, tal como se explicar en el captulo 3, de modelos de
estructuras latentes.

60
Captulo 2. Introduccin al Anlisis de Imgenes_____________________________

Surge entonces una discusin a la hora de asignar un nombre a la


extensin de la metodologa MIA, basada en el Unfold-PCA, a los
modelos 3-way: se le contina llamando MIA, dado que se trata de la
misma metodologa de desplegado de la imagen original (estructura
dimensional) y anlisis de los datos, pero con la diferencia de que dicho
anlisis se realiza con modelos N-way?

O por el contrario, y dado que la estructura interna de los datos es


analizada por estos modelos N-way, la metodologa debera pasar a
denominarse N-way Image Analysis?

En la presente tesis, se prefiere seguir utilizando la denominacin MIA,


porque Multivariate Image Analysis recoge en su concepto global tanto
los modelos 2-way (ver captulo 3) que analizan la estructura interna de
los datos a partir del desplegado de la misma a lo largo de los modos de
las diferentes variables registradas, como los modelos multiway
propiamente dichos (ver captulo 3), los cuales analizan dicha estructura
interna de manera directa, sin llevar a cabo desplegados adicionales ms
all de los correspondientes a los modos de variacin natural de los datos.
Gurden et al. (2003) utilizan esta filosofa a la hora de establecer dicha
nomenclatura (Multivariate Image Analysis). Podra entonces definirse
de manera ms adecuada esta extensin del Multivariate Image Analysis
como Multiway Image Analysis, pero sus siglas seguiran siendo MIA.

Sin embargo, y a diferencia de la nomenclatura utilizada por Gurden et


al. (2003), s se considera en este trabajo que, de manera general, el
anlisis de imgenes por medio de modelos N-way debera denominarse
N-way Image Analysis, reservando el nombre de MIA a la aplicacin
tradicional del desplegado de los pxeles de las imgenes a lo largo de
una nica direccin de variacin natural de los datos, ya sea por medio de
modelos del tipo de desplegados de PCA/PLS como PARAFAC, Tucker3
o N-PLS.

De esta manera, se est ms en la lnea del trabajo de Huang et al. (2003)


donde se define el N-way Image Analysis como cualquier tipo de anlisis
de imgenes llevado a cabo por medio de modelos N-way, con la
salvedad de que en la presente tesis se prefiere ampliar el concepto de
MIA a los modelos N-way, siempre que se lleve a cabo un anlisis de la

61
SPC mediante MIA_____________________________________________________

estructura interna de los datos independientemente del modelo utilizado,


en lugar de restringirlo a los modelos 2-way.

En definitiva, y a modo de resumen, se concluye que la extensin del


anlisis de las estructuras internas de los datos debe seguir, siempre a
juicio del autor, denominndose MIA, dado que el hecho de analizar
dichas estructuras mediante modelos N-way no cambia la filosofa de la
metodologa, sino que simplemente la ampla de manera natural de los
modelos de desplegado (Unfold-PCA y PLS) a los modelos N-way.

4 PROCESAMIENTO CLSICO VS ANLISIS


MULTIVARIANTE DE IMGENES

Las tcnicas de anlisis de imgenes (tanto las de anlisis clsico como


las basadas en mtodos estadsticos multivariantes) tratan de extraer
caractersticas de los pxeles a partir de la gran cantidad de datos
existentes en las imgenes. En cualquier caso, existen algunas diferencias
fundamentales entre sus metodologas y aplicaciones. A continuacin se
presenta un breve resumen de las diferencias entre ambas tcnicas.

Las tcnicas de anlisis clsico de imgenes estn diseadas para extraer


caractersticas o medidas cuantitativas definidas a priori de objetos
trabajando directamente sobre cada pxel en el espacio bidimensional de
la imagen. Estas tcnicas suelen apoyarse en diversas operaciones de
restauracin y mejora de la imagen, que manipulan las intensidades de
los pxeles a nivel individual o conjunto, con el objeto de que la imagen
goce de una mejor calidad visual desde el punto de vista del observador,
as como para eliminar el ruido presente en la misma. El objetivo ltimo
es conseguir que los pxeles que tienen unas determinadas caractersticas
se distingan del resto, a fin de extraer informacin de los mismos. Estas
tcnicas consiguen sus objetivos trabajando en las dimensiones
espaciales de la imagen.

Por otra parte, los diversos mtodos de anlisis multivariante de


imgenes se centran en la extraccin de informacin de los pxeles, y la
diferenciacin de aqullos que presentan caractersticas de inters, a
partir de la proyeccin de la imagen multivariante en un espacio de

62
Captulo 2. Introduccin al Anlisis de Imgenes_____________________________

variables latentes. Los pxeles de la imagen multivariante se proyectan de


esta manera en un espacio reducido de variables, pudindose reubicar en
nuevos espacios, de manera que todos aquellos pxeles que tengan las
mismas caractersticas quedarn localizados en la misma zona, mientras
que aqullos que no presentan dichas caractersticas o propiedades
quedarn localizados en zonas distintas. De esta manera, se pueden crear
modelos locales dentro del subespacio de las variables latentes
implicadas, con el objeto de separar dichos pxeles del resto, tanto en la
imagen analizada como en nuevas imgenes.

Los puntos fuertes del anlisis multivariante de imgenes no son el hecho


de eliminar ruido de las imgenes, o realzar su calidad visual (Benito y
Pea, 2003). En ese aspecto, los mtodos de procesamiento clsico de
imgenes son mucho mejores. La potencia de las tcnicas de anlisis
multivariante de imgenes radica en la diferenciacin de la informacin
subyacente en las imgenes multivariantes, la extraccin de aqulla que
se considera relevante, y su reubicacin en la dimensin espacial de la
imagen. Adems, esta informacin subyacente puede ser utilizada para el
control de procesos, o la clasificacin de nuevas imgenes, de la manera
en que se desarrolla en la presente tesis.

63
Captulo 3. Modelos de estructuras latentes_________________________________

Captulo 3. Modelos de estructuras latentes

1. INTRODUCCIN

Un N-way array es cualquier conjunto de datos para los cuales los


elementos se pueden agrupar como

xijk...n i=1,...,I; j=1,...,J; k=1,..., K; ; n=1,,N

En el caso particular de tres modos de variacin, se tiene una estructura


3-way, de dimensiones IJK (Figura 3.1).

Tercer modo

Primer modo

Segundo modo
Figura 3.1. Estructura geomtrica 3-way.

De acuerdo con esta nomenclatura, los conjuntos de datos de imgenes


tendrn dimensiones de variacin interna (IJK), donde I se refiere al
modo de los pxeles, J a la informacin de carcter espacial, y K a la
informacin de carcter espectral.

A la hora de extraer la informacin existente en las imgenes, se pueden


utilizar diferentes modelos de proyeccin, en funcin de la estructura de
datos que se analiza: 2-way, si los diferentes modos de variacin de las

65
SPC mediante MIA____________________________________________________

variables se despliegan en un nico modo; o N-way, si no se realiza


ningn desplegado de los modos de las variables.

En el primer caso (2-way), los modelos a utilizar sern los Unfold-PCA si


se utiliza un modelo de compresin y Unfold-PLS si el modelo utilizado
es de prediccin; mientras que en el segundo caso (N-way), los modelos
pueden ser Tucker3 o PARAFAC cuando se empleen modelos de
compresin, y N-PLS si se emplea un modelo de prediccin.

El hecho de que nuestra estructura interna de datos sea 3-way es la


justificacin de que todos los modelos se expliquen a partir de este
nmero de modos de variacin natural de los datos. Para ello, se va a
partir del modelo ms general Tucker3, para ir restringiendo cada vez
ms dicho modelo, llegando a los modelos de Unfold-PCA o Tucker1, as
como al modelo PARAFAC.

La nomenclatura utilizada para la explicacin de estos modelos es la


empleada por Louwerse y Smilde (2000): los caracteres normales,
incluyendo maysculas, son escalares y se refieren a elementos de datos
simples; los caracteres en negrita y minscula se refieren a vectores; las
maysculas en negrita quedan asociadas a matrices o estructuras 2-way;
por ltimo, las estructuras 3-way quedan indicadas mediante letras
maysculas subrayadas y en negrita.

66
Captulo 3. Modelos de estructuras latentes_________________________________

2. MODELOS DE COMPRESIN

2.1. Tucker3

A la hora de estudiar estructuras multivariantes N-way, el modelo ms


general que se puede utilizar para dicho estudio es el modelo Tucker3
(Kroonenberg, 1986), el cual ha sido tambin explicado, entre otros, por
Henrion (1994) o Kiers (2001).

Asumiendo una estructura interna de los datos 3-way, el modelo Tucker3


tiene una estructura tal como la definida en la Figura 3.2.

C
K
K J K
J E F J
G B + R
X = D E
I I
D

A
I

Figura 3.2. Estructura general de de un modelo Tucker3.

Los parmetros del modelo se estiman de forma que se minimice la suma


de cuadrados de residuos rijk, tal como se detalla en el Apndice al
captulo 3.

En forma matemtica, la estructura de un modelo Tucker3 se puede


expresar:

D E F
x ijk = a id b je c kf g def + rijk (3.1)
d =1 e =1 f =1

67
SPC mediante MIA____________________________________________________

Si se utiliza el producto de Kronecker, simbolizado como ,


desplegando la estructura de datos X en una matriz X, el ncleo G como
G, y el residuo R como R, dejando fijo el primer modo (desplegando los
modos correspondientes a las variables), la expresin matricial del
modelo Tucker3 es:

X = AG (C B) T + R (3.2)

donde A (ID) es la matriz de pesos o loadings correspondiente al


primer modo o direccin de variacin natural de los datos, y representa la
manera en que se puede comprimir la informacin correspondiente a las
muestras, si las colocamos a lo largo de esta direccin de variacin
natural o modo de los datos; G (DEF) es la matriz obtenida al desplegar
el ncleo G (DEF) dejando fijo el primer modo; B (JE) y C (KF)
son las matrices de loadings o pesos de los modos segundo y tercero,
respectivamente, representando la informacin comprimida
correspondiente a las series de variables alineadas a lo largo de los
modos respectivos; y R (IJK) es la matriz de residuos.

El hecho de que el nmero de componentes no tenga que ser el mismo en


los diferentes modos posibilita que las dimensiones de las matrices de
loadings se puedan acomodar individualmente en cada modo.

Se trata, por tanto, de un modelo en el cual la compresin se puede


producir tambin a lo largo del modo de las muestras. De esta manera, el
ncleo G se puede considerar como una aproximacin de X, el cual
aproxima la variacin de la estructura o array original expresndolo en
trminos de matrices de base truncadas A, B y C.

Es decir, que cada componente de cada modo no tiene por qu ir asociada


necesariamente a una y nica componente de cada uno de los modos
restantes, tal y como sucede con el modelo PARAFAC, explicado en el
apartado 2.2.

Como el modelo Tucker3 tiene libertad rotacional, no hay una nica


solucin, en contraposicin al modelo PARAFAC.

68
Captulo 3. Modelos de estructuras latentes_________________________________

Esto se puede ver reemplazando el modelo de la ecuacin 3.2 con otro


donde, por ejemplo, los loadings del primer modo han sido girados
mediante una matriz S cuadrada no singular.

As, girando G con la inversa de esta matriz, el modelo queda:

X = ASS 1G (C B) T + R = AG (C B) T + R (3.3)

Ni siquiera el hecho de imponer la restriccin de ortogonalidad


proporciona una solucin nica, ya que rotaciones mediante cualquier
matriz ortogonal de cualquiera de las matrices de loadings
proporcionaran nuevas matrices de loadings.

Realmente el modelo estructural es tan redundante que muchos


parmetros, muchos ms que la mitad de los elementos de G, se pueden
hacer cero sin cambiar el ajuste del modelo, quedando, por tanto,
asociados al ruido existente en el proceso que se intenta modelizar.

Los elementos de G que resultan importantes son los que indican cmo
se relacionan las variables de los distintos modos, y los fenmenos que
subyacen bajo el proceso, o bajo el conjunto de datos que lo definen.

Sin embargo, la bondad del modelo Tucker3 radica precisamente en la


capacidad del mismo de permitir cualquier posible combinacin entre las
distintas componentes de los diferentes modos del modelo, lo cual
posibilita la existencia de interacciones entre los mismos y, por tanto,
entre las variables ligadas en mayor medida a las componentes.

Por otra parte, existen algoritmos que permiten girar el ncleo o core G
hasta conseguir que el mnimo nmero de elementos del mismo
expliquen un mximo de la varianza del mismo (Henrion y Andersson,
1999), o bien que dicho ncleo alcance un mximo de diagonalidad, de
manera que es posible conseguir un mximo de interpretabilidad en el
modelo sin ms que realizar una transformacin de este tipo.

69
SPC mediante MIA____________________________________________________

2.2. PARAFAC

El modelo PARAFAC se puede derivar del Tucker3 sin ms que imponer


la condicin de superdiagonalidad e identidad en la estructura de la
matriz ncleo G (Kiers 2001). El modelo fue propuesto de manera
independiente por Harshman (1970) y por Carroll y Chang (1970),
quienes denominaron al modelo CANDECOMP (Canonical
Decomposition).

La estructura del modelo se presenta en la Figura 3.3.


F
c1 cF
K C
J
K
F B
J b1 bF F
X
= ++ = A
I a1 aF
I

Figura 3.3. Estructura general de un PARAFAC.

Al igual que en el modelo Tucker3, el modelo PARAFAC minimiza la


suma de cuadrados de los residuos, rijk . De esta manera, el modelo se
puede expresar matemticamente como:

F
x ijk = a if b jf c kf + rijk (3.4)
f =1

Utilizando el producto Khatri-Rao (Rao y Mitra, 1971) y desplegando la


estructura de datos X en una matriz X, se obtiene la expresin matricial
del modelo:

( )
F
X = A(C B) T + R = a f c Tf b Tf + R (3.5)
f =1

70
Captulo 3. Modelos de estructuras latentes_________________________________

En el modelo PARAFAC, af, bf, y cf son las f-simas columnas de las


matrices de loadings A, B y C, respectivamente.

En notacin matricial el modelo PARAFAC se puede expresar tambin


segn la expresin:

X k = AD k B T + R k , k=1,.....,K (3.6)

donde Dk es una matriz diagonal que contiene la fila k-sima de C en su


diagonal, y Rk es la matriz de residuos

Aunque esta expresin matricial del modelo PARAFAC parece indicar


que hay una diferencia en la manera en que los modos son tratados en el
modelo, no es el caso. El modelo PARAFAC es simtrico en el sentido
que si se reordena la estructura de datos (p.ej., el primer modo pasa a ser
el tercero y viceversa), los modelos PARAFAC de las dos estructuras de
datos sern idnticos, con la nica diferencia que los loadings del primer
y tercer modo estarn intercambiados (lo cual quiere decir que se trata de
la misma solucin).

La expresin ADkBT puede ayudar a interpretar los loadings del tercer


modo.

Sea

S k = AD k (3.7)

Entonces,

Xk = Sk BT + R k (3.8)

es decir, que para cada k se obtiene un modelo bilineal (2-way) diferente


y para diferentes ks los modelos sern idnticos con la nica diferencia
de que las componentes individuales estn promediadas de manera
diferente en la matriz Dk.

71
SPC mediante MIA____________________________________________________

Una de las ventajas de PARAFAC frente a Tucker3 es la no posibilidad de


rotacin, a no ser a costa de una prdida de ajuste.

PARAFAC tiende a la solucin fsica del modelo, sin perderse en


soluciones alternativas matemticas. Esto hace que los modelos
obtenidos mediante PARAFAC sean fcilmente interpretables.

Kruskal (1977), demuestra que si

k A + k B + k C 2 F + 2, (3.9)

entonces la solucin PARAFAC es nica.

En esta expresin, kA es el rango de A, kB el rango de B, kC el rango de C


y F es el nmero de componentes mostrados.

El significado matemtico de la unicidad es que las matrices de


componentes PARAFAC estimadas no se pueden rotar sin una prdida de
ajuste.

Si se considera un modelo bilineal (2-way) con F componentes tal como


el de la ecuacin siguiente:

X = AB T + R (3.10)

Este modelo se puede rotar mediante una matriz no singular FF, P, tal
como se indica en la expresin:

AB T = APP 1B T (3.11)

es decir, utilizando como valores (scores) en el nuevo espacio latente AP


y como loadings (B(P-1))T. Se obtiene as un modelo que tiene
exactamente el mismo grado de ajuste. A esto se le suele llamar la
ambigedad rotacional del modelo PCA, el cual se explica en el apartado
2.3.

En PARAFAC no existe esta indeterminacin rotacional.

72
Captulo 3. Modelos de estructuras latentes_________________________________

^
X k = AD k B T (3.12)

si fuera rotable, la expresin 3.12 se podra expresar igualmente a partir


de la ecuacin:

AD k B T = ATT 1D k SS 1B T (3.13)

Esta expresin indica que en lugar de A, B y Dk, se podran utilizar


tambin los loadings AT, (B(S-1))T y T-1DkS.

De todas formas, el modelo PARAFAC debe tener las matrices del tercer
modo T-1DkS diagonales. Este requerimiento hace que nicamente
matrices muy especiales Ts (y Ss) puedan ser vlidas, principalmente
aqullas que mantienen la diagonalidad.

En la prctica, esto significa que TS-1 (y por ello T-1S) tienen que ser
matrices de permutacin o de escala.

Por ello la nica indeterminacin en la solucin mnimo cuadrtica es el


orden de los componentes y la escala de los vectores loadings, la cual es
trivial y no tiene mucha importancia.

2.3. Unfold-PCA

El Anlisis de Componentes Principales, PCA (Principal Component


Analysis) (Jackson, 1991), es un mtodo de proyeccin de unas variables
sobre otras, llamadas variables latentes, ortogonales entre s, y que sirven
para describir de manera ptima un proceso, y los sucesos que tienen
lugar en el mismo.

Cuando se dispone de una estructura interna de datos N-way, para llevar a


cabo un anlisis PCA es necesario desplegar la estructura hasta conseguir
una matriz (estructura 2-way), por lo que a este modelo se le conoce
como Unfold-PCA o U-PCA.

73
SPC mediante MIA____________________________________________________

El desplegado es simplemente una manera de reagrupar una estructura de


datos N-way en una matriz, siendo la metodologa utilizada por los
mtodos 2-way para poder estudiar estructuras N-way.

La manera en que la estructura se despliega se muestra en la Figura 3.4.

K
B J
K
D D
J

+ R
X A

I I
Plegado

J K

D B
Desplegado
D
J K

PCA + R
X A
I
I

Figura 3.4. Estructura general de de un modelo Unfold-PCA.

En este caso lo que se tiene realmente es un modelo de Tucker, en


concreto un Tucker1.

Como en los modelos anteriores, el modelo se construye a partir de la


minimizacin de los cuadrados de los errores de la prediccin de la
estructura original de datos.

Si se tiene, como ya se ha comentado, una estructura X (IJK) y se


despliega de manera que se obtiene una matriz de dimensiones (IJK),

74
Captulo 3. Modelos de estructuras latentes_________________________________

obligando al modelo a recorrer el total de dimensiones J y K, el modelo


general de Tucker3 de la expresin 3.1 pasa a ser el de la ecuacin:

D E F
x ijk = a id b je c kf g def + rijk (3.14)
d =1 e =1 f =1

donde, absorbiendo bje y ckf en gdef se obtiene que

h jkd = b je c kf g def (3.15)

con lo que el modelo pasa a ser expresado como:

D
x ijk = a id h jkd + rijk (3.16)
d =1

lo cual equivale matricialmente a la expresin:

X ( I JK ) = A ( I D ) H ( D JK ) + R ( I JK ) (3.17)

que constituye un modelo PCA para una matriz X de dimensiones (IJK).

Tradicionalmente, la matriz A es conocida como matriz de scores o


matriz T, mientras que a la matriz HT se le denomina P o matriz de
loadings, cuyas columnas son ortonormales.

Al igual que el modelo Tucker3, el modelo PCA tiene libertad rotacional,


de manera que es posible obtener diferentes soluciones equivalentes sin
ms que emplear una matriz S cuadrada no singular, tal y como se ha
explicado en el apartado de dicho modelo.

75
SPC mediante MIA____________________________________________________

3. MODELOS DE PREDICCIN

Cuando el objetivo de la modelizacin no es explicar lo mejor posible o


comprimir la informacin presente en una estructura de datos, sino tratar
de predecir una variable respuesta a partir de unos determinados valores
de las variables de entrada, se emplean los denominados modelos de
prediccin.

Al igual que en el punto anterior, asumiendo una estructura 3-way, tal


como la de la tesis, se van a explicar a continuacin los modelos de
prediccin basados en estructuras N-way, modelo N-PLS, as como los
basados en una estructura desplegada de los datos, modelo Unfold-PLS.

Se va a comenzar explicando el modelo Unfold-PLS, ya que a diferencia


del punto anterior, el modelo N-PLS se ha desarrollado a partir del PLS
clsico y del modelo PARAFAC.

3.1. Unfod-PLS

Realmente, el modelo Unfold-PLS no es ms que la realizacin de un


PLS sobre la estructura desplegada de los datos. Dicho despliegue se
realiza de la misma manera que ya se ha comentado en el apartado
anterior a la hora de explicar el modelo Unfold-PCA o Tucker1.

El mtodo PLS (Partial Least Squares) es un modelo de proyeccin a


estructuras latentes por medio de mnimos cuadrados parciales,
presentado por Herman Wold en los aos 70, y perfeccionado por Svante
Wold y Harald Martens en los aos 80 (Wold et al., 1987). Asimismo,
existe una gran cantidad de literatura relacionada con el tema (Burnham
et al., 1996; Geladi y Kowalski, 1986; Hskuldsson, 1988; Kresta et al.,
1994).

A diferencia de los modelos anteriores, el objetivo en el caso del modelo


PLS es explicar la relacin entre dos conjuntos de variables X e Y, as
como la variabilidad tanto en X como en Y, pero maximizando la
Covarianza (X,Y); a diferencia de los modelos de compresin, los cuales

76
Captulo 3. Modelos de estructuras latentes_________________________________

maximizan la varianza en X o en Y, con la finalidad de explicar la


relacin dentro de cada uno de los dos conjuntos de variables.

Es decir, que PLS hace una proyeccin de X, de manera que aproxima


bien X y maximiza la correlacin con Y (aproximando tambin bien Y),
mientras que PCA es una aproximacin ptima de X o Y mediante
mnimos cuadrados.

Si se dispone de dos estructuras de datos tales como las proporcionadas


por la Figura 3.5,

K M

X Y
I I

Datos del Datos de Calidad y


Proceso Productividad
Figura 3.5. Estructuras de datos de entrada y salida de un proceso.

una vez se ha encontrado la relacin entre los conjuntos de datos


multivariantes X e Y, se puede predecir un conjunto a partir del otro para
nuevas observaciones.

El modelo PLS expresado en funcin de las variables latentes queda tal


como se expresa en el esquema de la Figura 3.6.

La primera componente del modelo PLS es una direccin en el espacio X


y otra en el espacio Y de manera que ambas aproximan bien los datos, y
adems las proyecciones t1 y u1 estn bien correlacionadas.

77
SPC mediante MIA____________________________________________________

pT1

...
pTF
t1 tF u1 u2

... ...
X Y

wT1 qT1
...

...
wTF qTF

Figura 3.6. Esquema del modelo PLS expresado en funcin de sus variables latentes.

La segunda componente PLS se representa por medio de otras dos


direcciones, una en cada espacio de variables. En el espacio X, esta
segunda componente es ortogonal a la primera, mientras que esta
condicin no tiene por qu cumplirse necesariamente en el espacio Y.
Ambas componentes mejoran la aproximacin y la correlacin entre X e
Y lo mximo posible.

Las componentes PLS juntas forman planos o hiperplanos tanto en el


espacio X como en el Y. Al proyectar las observaciones sobre estos
planos se obtienen las parejas de vectores de scores para la primera (t1,
u1), segunda (t2, u2), y F-sima (tF, uF) componentes.

Los sucesivos pares de vectores scores, ti y ui, tambin se encuentran


correlacionados linealmente, aunque con un grado de relacin lineal cada
vez menor conforme aumenta i, ya que son las primeras componentes las
que van capturando la mayor fuente de variacin entre X e Y.

La Tabla 3.1 presenta la notacin utilizada en la representacin del


modelo PLS, as como la interpretacin de la misma.

78
Captulo 3. Modelos de estructuras latentes_________________________________

Tabla 3.1. Notacin e interpretacin de la representacin del modelo PLS.

Letra Significado
T Matriz de scores en el plano X, coordenadas en el hiperplano definido en
EK. Los scores t son una combinacin lineal de las variables de X con pesos
w, que son los pesos de las variables originales X en la nueva variable
latente. Los scores t son un resumen de las variables X que estn
correlacionadas con Y.
U Matriz de scores en el plano Y, coordenadas en el hiperplano en EM.
W Matriz de correlaciones entre X y u(Y) t. Las variables de X que tengan
mayor correlacin con las variables Y tendrn mayores pesos o weights w.
Expresan la correlacin entre las variables de X (1 dimensin) o los
residuos de las variables de X (en las siguientes dimensiones), y las
variables respuesta Y o los scores de Y, u(Y).
Q Matriz de correlaciones entre Y y t(X) u. Dan los pesos que combinan
las variables Y para formar los scores u de forma que se maximice la
correlacin con la variables X. Variables Y con altos valores q en valor
absoluto, estarn altamente correlacionadas con T(X).
P Direccin de la componente en el espacio X (cargas o loadings). X se
aproxima como TPT, pero los scores t no se calculan a partir de los vectores
p.
W* Los weights w* son diferentes a w, pues expresan la correlacin entre las
variables X, en todas las dimensiones, y las variables respuesta Y. En la 1
dimensin, w1*=w1. En las siguientes dimensiones, los w* son los pesos que
combinarn las variables originales X (no sus residuos, como con w) para
formar los scores t. W*=W(PTW)-1.

De manera matemtica, y suponiendo desplegada la estructura de datos,


el modelo puede expresarse como:

F
x ij = t if p jf + rij (x) (3.18)
f =1

F F
y ij = u if q jf + rij (y) = t if q *jf + g ij (3.19)
f =1 f =1

teniendo en cuenta que:

u if = t if b f + h if (3.20)

79
SPC mediante MIA____________________________________________________

^
u if = t if b f (3.21)

quedando bf definido como

u Tf t f
bf = (3.22)
t Tf t f

De manera matricial,
Relaciones externas

X = TPT + RX (3.23)

Y = UQT + RY = TQ*T + G (3.24)


U = TB + H
Relacin interna
= TB
T *T
TBQ = TQ

La razn fundamental para la utilizacin del PLS es su explotacin como


modelo de prediccin. A partir del PLS, podemos expresar el modelo de
regresin estndar (suponiendo datos centrados y escalados) como:

Y pred = XB PLS = TQ T (3.25)

como T = XW* = XW(P T W ) 1 (3.26)

Y pred = XB PLS = TQ T = XW(P T W) 1 Q T (3.27)

con lo que

B PLS = W (P T W ) 1 Q T (3.28)

que tiene K filas (nmero de trminos en X) y M columnas (nmero de


variables en Y).

80
Captulo 3. Modelos de estructuras latentes_________________________________

De esta manera, se obtiene un modelo que facilita la interpretacin


cuando el nmero de variables es grande, obteniendo un vector con
informacin precisa por cada variable m de Y, y no varios vectores de
pesos, mucho menos informativos a primera vista, tal como aparece en la
expresin:

y m = b 1m x 1 + b 2 m x 2 + ...... + b km x k + f m (3.29)

La magnitud y signo de los coeficientes de regresin bkm (escalados y


centrados) indican la influencia de cada trmino xk del modelo sobre la
variable ym, facilitando as la explicacin de los resultados a personas no
expertas. La desventaja es que se pierde la informacin relativa a la
estructura de correlacin entre las respuestas, almacenada por las
variables latentes.

Una alternativa es predecir directamente a travs de las variables latentes,


tal como se muestra en la Figura 3.7.

A J A

T = X J W*
tiT = xiTW* I I
tiT xiT M
M A M

= QT
yprediT = tiTQT Ypre T A
I I
T
ypredi tiT
J K A J

xprediT = tiTPT
Xpre = T A PT
I I
tiT
xpredi
T

Figura 3.7. Esquema del proceso de prediccin en el modelo PLS a partir de las
variables latentes.

81
SPC mediante MIA____________________________________________________

A diferencia de los modelos clsicos de regresin mnimo cuadrtica


ordinarios, la ventaja de estos mtodos es que manejan bien datos
faltantes, pueden trabajar con matrices XTX mal condicionadas, o incluso
singulares, y predicen no slo las variables de salida o calidad (y), sino
tambin las de entrada o proceso (x).

3.2. N-PLS

Cuando se dispone de una estructura de datos N-way en la que adems de


variables de entrada se dispone de variables respuesta o de salida, es
posible ampliar el modelo PLS a una descomposicin similar a la
realizada por el modelo PARAFAC, pero con el objeto de predecir las
variables de salida.

La descomposicin producida por el modelo N-PLS es la que se muestra


en la Figura 3.8, asumiendo que tanto las variables de entrada como las
de salida son 3-way.

En la versin 3-way del PLS la estructura tridimensional de variables de


entrada se descompone en un modelo trilineal similar al PARAFAC, slo
que, para el N-PLS, el modelo no se ajusta en el sentido de mnimos
cuadrados, sino que, en concordancia con la filosofa del PLS, busca
describir la covarianza entre las variables de salida y las de entrada (Bro,
1996).

Esto se consigue mediante un ajuste simultneo de un modelo multilineal


de las variables de entrada y otro para las variables de salida, junto con
un modelo de regresin que relacione los dos modelos anteriores.

Si se asume que los datos de ambos conjuntos de variables son 3-way,

Sea X (IJK), y sea X (IJK) su versin desplegada.

Sea Y (ILM), y sea Y (ILM) su versin desplegada.

82
Captulo 3. Modelos de estructuras latentes_________________________________

wK1 WKF

wJ1 w JF
X = ++ + RX

t1 tF

qM1 q MF

qL1 qLF
Y = ++ + RY

u1 uF

Figura 3.8. Estructura del modelo N-PLS.

El modelo N-PLS descompone X a partir de X mediante la expresin:

F
x ijk = t if w Jjf wkfK + rijk (x) (3.30)
f =1

que de manera matricial queda:

X = T( W K W J ) T + R X (3.31)

Es decir, un modelo trilineal similar al modelo PARAFAC, e Y a partir de


Y segn la expresin:

F
y ilm = u if qlfL q mf
M
+ rilm (y) (3.32)
f =1

83
SPC mediante MIA____________________________________________________

o, de manera matricial,

Y = U (Q M Q L ) T + R Y (3.33)

Los vectores de scores de X e Y se llaman t y u, respectivamente, y los


vectores de pesos (weights en este caso) w y q, conforme a la notacin
PLS estndar. Los superndices J o K, L o M, se usan respectivamente
para especificar a cul de los modos se refieren los vectores.

Los modelos de descomposicin anteriores se estiman a lo largo de cada


componente bajo las siguientes restricciones: encontrar un conjunto de
vectores wJ, wK, qL y qM de manera que los vectores de scores mnimo
cuadrticos t y u tengan mxima covarianza. As, el modelo de
prediccin entre Y e X se encuentra utilizando un modelo de regresin
para la llamada relacin interna:

U = TB + R U (3.34)

El modelo N-PLS es nico en el sentido que consiste en una serie


estimaciones uni-componentes de modelos sucesivos.

Cuando es necesario predecir las variables de salida de una nueva


muestra, a partir del modelo de X, se estima T, y por medio de la
ecuacin anterior los scores en el espacio de Y pueden ser predichos, y a
travs del modelo de Y se obtiene la prediccin de Y.

Esta prediccin se lleva a cabo de manera anloga a la expuesta para el


modelo PLS (Bro 1998; Smilde et al., 2004).

Definiendo la matriz R como:

F 1
R = w 1 (I w 1 w 1T )w 2 ... (I w f w Tf )w F (3.35)
f =1

se deriva que

84
Captulo 3. Modelos de estructuras latentes_________________________________

T = XR (3.36)

y a partir de la relacin

^
y = Tb (3.37)

se obtiene que

b N PLS = Rb (3.38)

^
sern los coeficientes de regresin que calculan directamente y = Tb a
partir de X (IJK).

85
SPC mediante MIA____________________________________________________

4. PRETRATAMIENTO DE LOS DATOS

La forma en que se prepara la estructura de datos antes de llevar a cabo la


modelizacin de los mismos, independientemente del modelo que
vayamos a utilizar, constituye un punto primordial del anlisis, ya que va
a condicionar totalmente los resultados que se obtengan.

Gurden et al. (2001) llegan a concluir que el tipo de datos y escalamiento


utilizados es ms importante que el modelo de regresin utilizado en
trminos de poder predictivo, a pesar de que los modelos difieran en
trminos de interpretabilidad.

A pesar de la importancia dada al pretratamiento de los datos en teora,


en la prctica las distintas actuaciones a realizar sobre los mismos suelen
verse simplemente como pasos previos al acto de modelizacin, sin
mucha relevancia. Adems, a pesar de que el escalado es necesario para
muchos tipos de datos, el hecho de escalar de manera sistemtica las
variables a la misma varianza (la unidad), puede causar problemas
cuando a variables con pequea informacin se les asigna una
importancia elevada.

Cuando tenemos estructuras de datos de mayor orden, las posibilidades


de escalar los datos de diferentes maneras aumentan, y encontrar la
manera ptima de hacerlo se complica.

En el siguiente subapartado se parte directamente de una estructura 3-


way, dado que es la que presenta nuestra estructura interna de datos.

Las actuaciones ms comunes en cuanto al procesamiento de datos, antes


de construir un modelo, son el centrado y escalado de los mismos. Se van
a describir las diferentes maneras en que se pueden llevar a cabo estas
acciones para una estructura 3-way, si bien la extensin a estructuras ms
complejas es directa.

86
Captulo 3. Modelos de estructuras latentes_________________________________

4.1. Centrado

El proceso de centrado se puede definir de manera sencilla como la


ubicacin del origen del sistema de coordenadas del espacio de las
variables originales en el centro de gravedad de la nube de puntos que
constituyen el conjunto de datos.

El centrado a lo largo de un modo elimina los trminos constantes del


conjunto de datos. Hay diversas razones para realizar el centrado, siendo
una de ellas que los modelos de regresin no contienen un trmino
constante, sino que asumen una variacin alrededor del cero.

Bro y Smilde (2003) indican que el hecho de centrar un conjunto de datos


altera la estructura de los mismos, por lo que no siempre va a interesar
llevar a cabo dicha operacin, sobre todo si no se consigue un modelo
ms simple y/o ms fcilmente interpretable.

El proceso de centrado debera derivar en alguno de los puntos


siguientes:

Una reduccin del rango del modelo.

Un aumento del ajuste de los datos.

Una eliminacin especfica de valores constantes.

Evitar problemas numricos.

El proceso correcto de centrado consiste en hacerlo siempre a lo largo de


un solo modo cada vez, estando permitido el centrado secuencial a lo
largo de varios modos. Ya se ha visto que un modo se puede definir
como una dimensin de variacin natural de los datos, tal como el
tiempo, variables de un proceso, canales de color, pxeles, etc.

Es decir, que la manera correcta y no problemtica de llevar a cabo


centrados a lo largo de diferentes modos (dimensiones), es hacer varios
centrados consecutivos, cada uno de ellos a lo largo del modo que
interese (el orden en que se realicen no importa). El hecho de preprocesar

87
SPC mediante MIA____________________________________________________

los datos eliminando la media general no es de utilidad, si esta accin se


lleva a cabo de manera arbitraria.

Esto se puede ver de manera clara en el Anlisis de Imgenes, donde las


medias de cada canal de color (R, G y B) son diferentes en general, y
eliminar la media general no tiene sentido, puesto que no se aporta
informacin, como sera la desviacin de intensidad de cada canal para
cada pxel.

Bro (1997) explica que el tipo de centrado ms comn es el que se realiza


a lo largo del modo de las observaciones, el cual se conoce como
centrado a lo largo del primer modo, siempre que las observaciones se
coloquen en dicho modo.

ijk = x ijk x jk
x cent (3.39)

donde

x
i =1
ijk
x jk = (3.40)
I

El centrado a lo largo de un modo, por ejemplo el primero, se puede


realizar mediante el desplegado de la estructura de datos en una matriz
IJKL..., y el posterior centrado de esta matriz a lo largo del primer
modo.

Para modelos de regresin, el centrado a lo largo del primer modo es un


procedimiento ampliamente aceptado y se mantiene prcticamente igual
en los mtodos 2-way.

4.2. Escalado

El escalado a lo largo de un modo consiste en dividir todos los elementos


asociados a una determinada variable en ese modo por una constante.

88
Captulo 3. Modelos de estructuras latentes_________________________________

Razones para llevar a cabo un escalado de los datos son:

Cuando no se dispone informacin previa, cada variable se escala a la


misma varianza, de manera que todas ellas tienen la misma
oportunidad de contribuir al modelo.

Ajustar diferentes escalas, cada una de ellas propias de variables de


distinta naturaleza y/o medidas.

Acomodar el proceso de ajuste en caso de heterocedasticidad.

Permitir que diferentes conjuntos de variables de distinto tamao que


conforman la estructura total de los mismos puedan tener el mismo
peso a priori a la hora de llevar a cabo la modelizacin del proceso
(escalado por bloques).

En el caso de estructuras de datos 3-way, existen diferentes tipos de


escalado:

1. Escalado por columnas, en el cual cada vector xjk queda normalizado.

2. Escalado de un solo bloque (lateral).

3. Escalado doble de bloques, donde se escalan tanto los bloques


laterales como los frontales.

4.1.1 Escalado por columnas

En el escalado por columnas, cada una de las JK columnas se divide por


la raz cuadrada de su cuadrado medio. Si se considera que el primer
modo corresponde a las observaciones, la expresin correspondiente
queda:

x
i =1
2
ijk
RMS jk = (3.41)
I

89
SPC mediante MIA____________________________________________________

con lo que:

x ijk
x *ijk = (3.42)
RMS jk

Si X est centrada a lo largo de las columnas, la expresin de RMS es


aproximadamente igual a la desviacin tpica muestral (se divide por I-1
en lugar de I). Por ello, este procedimiento es muy similar al
autoescalado a varianza unitaria.

4.1.2 Escalado por bloques (laterales o frontales)

Para el escalado a un solo bloque o cara, cada uno de los bloques de J o


K variables se escalan multiplicando por un coeficiente que d como
resultado un cuadrado medio de valor la unidad dentro del modo elegido.
En el caso de, por ejemplo, escalar dentro del segundo modo, dado que la
raz cuadrada del cuadrado medio de la variable primaria j-sima viene
dada por la ecuacin:

I K


i =1 k =1
2
x ijk
RMS j = (3.43)
IK

los datos escalados a un solo bloque quedarn segn la expresin:

x ijk
x *ijk = (3.44)
RMS j

4.1.3 Escalado a doble bloque

Para el escalado a doble bloque, cada uno de los bloques de las J


variables primarias y de las K variables secundarias se escalan a la raz
cuadrada media unitaria, es decir,

90
Captulo 3. Modelos de estructuras latentes_________________________________

x ijk x * ijk
x *ijk = y x *ijk* = (3.45)
RMS j RMS k

donde RMSj viene dada por la expresin 3.43, y RMSk se define de


manera anloga a RMSj.

Se trata de un tipo de escalado que debe realizarse de manera iterativa


puesto que, como afirman Bro y Smilde (2003), escalar a lo largo de un
modo afecta al escalado en el otro modo. Los modos de las variables
primarias y secundarias se escalan alternativamente hasta que ambos
modos tienen una raz cuadrada media lo suficientemente cercana a la
unidad, convergencia que suele darse en menos de diez iteraciones
(Gurden et al., 2001).

Los dos mtodos de escalado por bloques mantienen la trilinealidad al


escalar simultneamente slo bloques enteros de datos. Sin embargo, si
se escala por columnas, como es el caso general del escalado en los
modelos 2-way, y considerando como primero el modo de las
observaciones, cada variable del segundo modo (por ejemplo medida de
un proceso) para cada variable del tercer modo (por ejemplo instante de
tiempo) se trata como una variable independiente. Esto significa que las
relaciones trilineales entre las variables pueden quedar distorsionadas o,
visto de otro modo, que la estructura multilineal presente en los datos se
puede perder.

Por otro lado, el efecto de escalar todas las regiones a la misma varianza
puede ser el de dar ms importancia a esas variables que tienen poco
contenido de informacin, incrementando as la cantidad aparente de
variacin no sistemtica en los datos. Este efecto es en ocasiones ms
pronunciado en el escalado por columnas que en el escalado por bloques,
ya que es ms probable que una columna, ms que un bloque entero,
contenga slo ruido de fondo.

Por ello, el escalado por columnas puede verse como una manera
incorrecta de escalar si nos encontramos ante una estructura multilineal.

91
SPC mediante MIA____________________________________________________

En cualquier caso, hay que tener en cuenta que la fase de preprocesado


viene fuertemente determinada por el problema que se est estudiando,
ya que en funcin del mismo, podemos obtener que preprocesados que en
un principio no deberan hacerse proporcionan mejores resultados que
preprocesados ms tericos, tales como un autoescalado a varianza
unitaria.

Este hecho es puesto de manifiesto por Westerhuis et al. (1999) al indicar


que a pesar de las reticencias de algunos autores (Bro, 1998) a
autoescalar matrices 3-way, dado que se destruye la estructura trilineal, e
incluso en el caso de que no haya estructura trilineal tambin (mala
influencia para un anlisis PARAFAC), ellos creen que el preprocesado
de las variables debe llevarse a cabo de la manera que sea ms adecuada
para el problema que se intenta resolver, y no en funcin del sesgo que
dicho preprocesamiento pueda introducir en los resultados
proporcionados por el modelo que se est utilizando.

92
Captulo 3. Modelos de estructuras latentes_________________________________

5. VALIDACIN DEL MODELO

Una vez explicada la importancia del pretratamiento de los datos antes de


llevar a cabo la modelizacin de los mismos, se pasa ahora a explicar
cul ha sido la tcnica empleada para validar dichos modelos una vez han
sido calculados.

En un modelo de regresin se pretende obtener la mayor capacidad


predictiva para el mismo. Existen estadsticos que determinan el grado de
variabilidad de los datos explicado por el modelo, tal como el R2, cuya
ecuacin viene dada por la expresin:

SCE
R2 = (3.46)
SCT

donde SCE es la suma de cuadrados explicada por el modelo, mientras


que SCT es la suma de cuadrados total presente en los datos.

El problema de este tipo de estadsticos es que siempre aumentan


conforme se aade un mayor nmero de componentes al modelo
independientemente de su significacin estadstica, con lo cual se puede
producir una situacin de sobreajuste, y la consiguiente prdida de
capacidad predictiva del modelo.

Con el objeto de determinar el nmero ptimo de componentes a utilizar


en el modelo, el criterio utilizado en la presente tesis ha sido el de
Validacin Cruzada mediante el PRESS (PRediction Error Sum of
Squares) o sus equivalentes Q2 y RMSECV (Root Mean Square Error of
Cross-Validation).

La Validacin Cruzada consiste en la definicin de varios subconjuntos


de observaciones a partir del conjunto de datos original, y la posterior
construccin del modelo sin uno de dichos subconjuntos. A continuacin
se estudia cmo ajusta el modelo creado el grupo de observaciones no
utilizadas para su ajuste, validndose mediante la prediccin de las
mismas.

93
SPC mediante MIA____________________________________________________

Para medir la bondad de estas predicciones se utiliza el PRESS, o su


equivalente Q2 y RMSECV.

PRESSA es la suma de cuadrados de los errores de prediccin r de las O


observaciones no consideradas, cuando se utilizan A componentes en la
construccin del modelo:

O
PRESS A = ri2 (3.47)
i =1

mientras que Q2 acumulado para A componentes sigue la expresin:

PRESS ( A )
2
Qcum ( A ) = 1 (3.48)
SC TOTAL

y RMSECV se calcula como:

PRESS A
RMSECV = (3.49)
I

asumiendo que I es el nmero de observaciones de la estructura de datos.

De esta manera, el nmero ptimo de componentes A a retener en un


2
modelo es aqul que maximiza el Qcum , o equivalentemente minimiza el
PRESS o el RMSECV.

Alternativamente, se puede ver que, para una componente a cualquiera:

PRESS (a )
Q 2 (a) = 1 (3.50)
SCR (a 1)

De esta manera, si PRESS(a)<SCR(a-1), interesa retener a componentes,


mientras que si PRESS(a)>SCR(a -1), no interesa.

94
Captulo 3. Modelos de estructuras latentes_________________________________

El proceso se repite para todos los subconjuntos (entre 4 y 7 suele ser


suficiente, Kresta et al. (1994)), de manera que el PRESS global es la
suma de los PRESS calculados para los distintos modelos. El nmero
ptimo de componentes se corresponde con el mnimo PRESS global, tal
como se muestra en la Figura 3.9.

Varianza residual

PRESS
Prediccin

SCR
Ajuste

N parmetros del modelo

Sobreajuste (se incrementa el


error de prediccin)

Figura 3.9. Evolucin de los grados de ajuste y de prediccin con el nmero de


componentes.

95
Apndice al captulo 3. __________________________________________________

Apndice al captulo 3

El presente apndice presenta los diferentes algoritmos utilizados para la


construccin de los diferentes modelos de compresin y de prediccin
explicados en el captulo 3, correspondiente a los modelos de estructuras
latentes.

1 ALGORITMOS DE LOS MODELOS DE COMPRESIN

1.1 Tucker3

Tal como ocurre en los modelos PCA y PARAFAC, la construccin del


modelo Tucker3 se basa en la minimizacin de la diferencia entre la
prediccin de la estructura de datos a los datos reales originales, por lo
que la funcin de prdida para el modelo Tucker3 es:

min || X AG (C B) T || 2F (A1.1)
A,B,C,G

sujeta a la restriccin de ortogonalidad para A, B y C. Las dimensiones


de la columnas de A, B y C son, respectivamente, D, E y F, y G es la
estructura ncleo de dimensiones DEF. De ahora en adelante slo se
considerar el modelo ortonormal.

La estructura ncleo G se puede condicionar sobre A, B y C mediante


una simple regresin de X sobre A, B y C. Matricialmente, puede
expresarse como:

G ( D EF ) = A T X ( I JK ) (C B) (A1.2)

97
SPC mediante MIA____________________________________________________

para matrices ortogonales de loadings. Si el modelo es perfecto, entonces


G contiene exactamente la misma informacin que X, simplemente
expresada a partir de diferentes coordenadas.

A partir de la definicin de G se deriva que el modelo Tucker3 de X


puede expresarse segn:

AG (CT B T ) = AA T X(C B)(CT B T ) = AA T X(CCT BB T ) (A1.3)

Para B y C fijadas se deriva que encontrar el ptimo de A es igual a


minimizar la norma de (X-AATM), donde MX(CCTBBT).

Sea PA=AA+ el proyector ortogonal en el espacio de las columnas de A y


QA=I-AA+ el antiproyector, es decir, el proyector en el espacio nulo de
A. Si A tiene columnas ortonormales, entonces A+=AT, por lo que
AAT=PA es un proyector; donde A+ es la matriz pseudoinversa de A.

Lo mismo aplica a BBT y CCT, y tambin a HHT, donde HCB.

La minimizacin del problema puede expresarse como:

min || X PA XPH || 2F =
A

min || XQ H + XPH PA XPH || 2F (A1.4)


A

Como QH y PH expanden espacios ortogonales, esto se puede indicar a


partir de la siguiente expresin:

min (|| XQ H || 2F + || XPH PA XPH || 2F ) (A1.5)


A

Debido a que ||XQH||2F es constante, esto es equivalente a maximizar la


ecuacin:

min || XPH PA XPH || 2F =


A

98
Apndice al captulo 3. __________________________________________________

min || Q A XPH || 2F =
A

max || PA XPH || 2F (A1.6)


A

De esta manera, el algoritmo queda tal como se indica en la Tabla A1.1.

Tabla A1.1. Algoritmo del modelo Tucker3.

Inicializar B y C

1. [A ,S , V ] = svd ( X ( I JK ) (C B) , D)
2. [B, S, V ] = svd (X ( J IK ) (C A), )
3. [C, S, V ] = svd ( X ( K IJ ) (B A), F )
4. Ir al paso 1 hasta la convergencia

5. G = A T X(C B)

1.2 PARAFAC

El modelo PARAFAC 3-way se define a partir de la ecuacin:

^
X = A(C | | B) T (A1.7)

De igual manera que suceda con Tucker3, se trata de aproximar tan bien
como sea posible la estructura original X, por lo que la correspondiente
funcin de prdida es la indicada en la ecuacin:

min || X A(C | | B) T || 2F (A1.8)


A, B,C

Para estimar A condicionalmente a B y C se formula el problema de


optimizacin segn:

99
SPC mediante MIA____________________________________________________

|| X AZ T || 2F (A1.9)

donde X es X desplegada a una matriz de dimensiones IJK y Z =


(C||B). De esto se deriva que la estimacin mnimo cuadrtica de A se
puede hallar mediante la expresin:

A = XZ(Z T Z) 1 = X(Z T ) + (A1.10)

Debido a la especial estructura del problema, es posible calcular XZ y


ZTZ directamente de B, C y X.

Se puede demostrar que

XZ = X 1 BD 1 + X 2 BD 2 + ... + X K BD K (A1.11)

y Z T Z = (B T B) o (CT C) (A1.12)

donde el operador o indica el producto de Hadamard. De esta manera, el


algoritmo queda expresado en los trminos de la Tabla A1.2.

Tabla A1.2. Algoritmo del modelo PARAFAC.

Inicializar B y C

Z = (C | | B)
1.
A = X ( I JK ) Z( Z T Z ) 1

Z = (C | | A)
2.
B = X ( J IK ) Z(Z T Z) 1

Z = (B | | A )
3.
C = X ( K IJ ) Z(Z T Z) 1

4. Ir al paso 1 hasta la convergencia

100
Apndice al captulo 3. __________________________________________________

1.3 PCA (y Unfold-PCA)

Los resultados del Unfold-PCA y su algoritmo se han llevado a cabo en


base a los correspondientes al modelo PCA, asumiendo, para una mayor
facilidad de interpretacin, que la estructura de datos es una matriz X de
dimensiones IJ. Asimismo, se utiliza la nomenclatura clsica
correspondiente a los modelos PCA, denominando, por tanto, T a la
matriz de scores y P a la matriz de loadings.

PCA es la descomposicin de una matriz X (IJ) en matrices ms


sencillas Ma a partir de la expresin:

A
X = Ma (A1.13)
a =1

Las matrices Ma son de tamao IJ, y tienen la propiedad de ser de rango


1, con lo cual X tiene rango A, donde A es el nmero de componentes
principales del modelo. Las matrices Ma se pueden representar, por tanto,
como el producto de dos vectores, t y p:

M a = t a p Ta (A1.14)

Siendo los vectores ta de tamao I1 y los vectores pa de tamao J1.

De esta manera, la funcin de prdida queda establecida segn la


ecuacin:

2
min X TP T (A1.15)
A

Lo que se desea es predecir de manera ptima las K variables primitivas a


partir de un nmero reducido de nuevas variables. A los vectores ta se les
llama scores, y son ortogonales; mientras que a los vectores pa se les
llama loadings, los cuales tienen la propiedad de ser ortonormales. Es
decir:

101
SPC mediante MIA____________________________________________________

A A
X = Ma = t a p Ta (A1.16)
a =1 a ==1

p Ti p j = ij (A1.17)

t Ti t j = ij i (A1.18)

siendo i un valor propio de XTX. Esto define la relacin entre PCA y la


ecuacin vector propio valor propio.

a p Ta = t Ta X (A1.19)

t a = Xp a (A1.20)

Existen tres criterios equivalentes que llevan a la explicacin matemtica


de estos resultados:

1. Subespacio que mejor se ajusta a la nube de puntos que


constituyen los datos.

2. Subespacio que minimiza la deformacin de la nube proyectada.

3. Prediccin ptima de las K variables a partir de las A nuevas


variables latentes (combinaciones lineales de las variables
originales).

Siguiendo el tercer criterio, se trata de hallar una primera variable latente


t = pTx (y otras sucesivas) de forma que se minimice la varianza residual
del ajuste de xk a la nueva variable latente (componente principal) t, k2*,
expresada como:

( k2,t ) 2 2 ( k2,t ) 2
* = (1
2 2 2
) = 1 2 2
2 = k



(A1.21)
t k
k k k ,t k 2
t

Asumiendo, sin prdida de generalidad, que t2 = 1, sin ms que


normalizar el vector p, se tiene que:

102
Apndice al captulo 3. __________________________________________________

t2 = p T Vp = 1 (A1.22)

con lo que:


min * = min k2
2
k2 ,t ( ) 2

[
= min 2k p T v k v Tk p ] (A1.23)
k
k t2
k
k

ya que

2k,t = cov( x k ,t ) = p T v k (A1.24)

donde vk es la columna k-sima de la matriz de varianzas-covarianzas

XT X
V= (A1.25)
I 1

Como k
2
k es la traza de la matriz de varianzas-covarianzas, que es

constante, esta minimizacin equivale a la maximizacin de la expresin:

[ ]
max p T v k v k p = max p T v k v Tk

[
p = max p T V 2 p ] (A1.26)
k k

La nica restriccin realizada ha sido que

p T Vp = 1 (A1.27)

Para la primera componente,

(
= p T 1 V 2 p 1 1 p T 1 Vp 1 1) (A1.28)

= 2V 2 p 1 2 1 Vp 1 = 0 V 2 p 1 = 1 Vp 1 (A1.29)
p 1

103
SPC mediante MIA____________________________________________________

De esta manera,

( ) ( ) ( )
max p T 1 V 2 p 1 = max p T 1 1 Vp 1 = max 1p1T Vp 1 = 1 (A1.30)

donde p1 es el vector propio de V, ya que

Vp 1 = 1p 1 (A1.31)

Es decir, la primera componente o direccin principal es la asociada al


vector propio asociado al mayor valor propio, el cual no representa otra
cosa que la varianza de la primera componente.

Las siguientes componentes van asociadas a vectores propios ortogonales


a todos los previamente obtenidos, y que a su vez van ligados a los
siguientes mayores valores propios, que sern las varianzas explicadas
por cada una de las componentes.

Aunque el nmero mximo de componentes es igual al rango la matriz de


varianzas covarianzas, varias de estas componentes pueden, sin embargo,
tener poco inters en la prctica si el valor propio asociado es pequeo.

Los elementos pak de cada vector pa se denominan pesos (loadings) de la


variable k-sima en el factor a-simo, y permiten obtener los valores tia
de la componente a en cada observacin i a partir de la ecuacin:

K
t ia = x ik p ak (A1.32)
k =1

Existen diversos algoritmos que se utilizan para el clculo de las


componentes principales.

Por un lado, existe la descomposicin en valores singulares, SVD


(Singular Value Decomposition), pero sta presenta problemas cuando
las matrices tienen un elevado grado de colinealidad o cuando hay datos
faltantes.

104
Apndice al captulo 3. __________________________________________________

En su lugar, existen algoritmos secuenciales, como el NIPALS (Wold,


1966 a; Wold, 1966 b) que, aunque son menos precisos, funcionan bien
con datos faltantes y con estructuras de datos que presentan una elevada
correlacin entre sus variables.

En concreto, NIPALS (Nonlinear Iterative PArtial Least Squares),


funciona bien si los datos faltantes ocurren de manera aleatoria en la
matriz de datos X, necesitando un mnimo de 5A datos por fila/columna,
siendo A el nmero de variables latentes resultantes. Dicho algoritmo
consiste en el procedimiento secuencial que se describe a en la Tabla
A1.3.

De esta manera, y suponiendo X centrada,

X = t 1p T 1 + ......... + t A p T A + R (A1.33)

Este algoritmo se lleva a cabo sobre una dimensin cada vez (tA, pA),
pudiendo estudiar su significacin mediante diversos procedimientos. El
estudio de la significacin de cada una de estas dimensiones es lo que
determina en nmero de variables latentes a retener en el modelo.

105
SPC mediante MIA____________________________________________________

Tabla A1.3. Algoritmo del PCA.

Sea la matriz X de dimensiones IJ

1. Iniciar con t=xk (columna de X con mayor varianza)

2. Regresin lineal mltiple de las columnas de X sobre t

^
X = tb T (t T t ) 1 t T b' = (t T t ) 1 t T X = t T X / (t T t ) = p T

Se normaliza p de manera que ||p||=1

pk = tTxk/tTt es una combinacin lineal de I individuos con pesos ts

3. Regresin lineal mltiple de las filas de X sobre p

^T
X = pb (p p) p b = (pT p) 1 pT XT = pT XT /(pT p) = t T
T T T 1 T

t = Xp /(p T p) = Xp

ti = xTip es una combinacin lineal de K variables con pesos ps

4. En la convergencia p es un vector propio de XTX con valor propio =tTt


(suma de cuadrados de la nueva variable t)

5. Calcular los residuos R = X tpT

6. Volver al punto 2 haciendo X = R y repetir el proceso para a = 1,2,, A


componentes.

106
Apndice al captulo 3. __________________________________________________

2 MODELOS DE PREDICCIN

2.1 Unfod-PLS

El modelo PLS obtiene su nombre del algoritmo NIPALS a partir del cual
se obtiene, tal como indican Kresta et al. (1994). Para cada una de las a
dimensiones del modelo PLS, el algoritmo NIPALS calcula dos variables
latentes que definen la dimensin: ta, combinacin lineal del conjunto de
variables X, y ua, combinacin del conjunto de variables Y. Estas
variables se eligen de manera que se maximiza la covarianza entre ta y
ua.

El algoritmo del PLS se desarroll en un principio asumiendo que se


dispone de una sola variable de salida y (PLS-1). Segn explica Bro
(1996), para cada componente se construye un modelo PLS para X e y,
tras lo cual estos modelos se sustraen de X e y. A continuacin, se
construye un nuevo conjunto de componentes a partir de los residuos.

El clculo de estos componentes es la principal parte de este algoritmo, y


se presenta como un problema de determinacin de un vector de weights
w que maximiza una cierta funcin. Para calcular una componente en
PLS, se busca un modelo de una sola componente de X segn la
expresin:

^ ^
X = tw T de manera que x ij = t i w j (A1.34)

donde los escalares ti son los scores de t y las wj los weights de w, para la
nica componente calculada. Este modelo se calcula a partir de la
expresin:

I J
max cov(t , y ) min (x ij t i w j ) 2 w = 1 (A1.35)
i =1
w
j =1

107
SPC mediante MIA____________________________________________________

Esta expresin lleva a encontrar un w que proporcionar una solucin


mnimo-cuadrtica para el modelo de la expresin (A1.34), de manera
que se obtiene un vector de scores t con mxima covarianza con y.
Cuando w es conocido y de longitud unitaria, la solucin mnimo-
cuadrtica al problema de encontrar t se halla mediante la proyeccin de
X sobre w. Esto queda formulado mediante la expresin:

J

max cov(t , y ) t i = x ij w j w = 1 (A1.36)
w
j =1

La covarianza entre t e y puede expresarse como:

I J
max t i y i t i = x ij w j w = 1 (A1.37)
w
i =1 j =1

La ecuacin no es estrictamente correcta, dado que no hay correcccin


por los grados de libertad, pero como esta correccin es constante para un
componente dado, ello no afecta a la maximizacin. De esta manera, las
expresiones para la covarianza y la solucin de mnimos cuadrados para
hallar ti se pueden expresar como:

I J
max y x i ij w j w = 1 (A1.38)
w
i =1 j =1

Como X e y se conocen de antemano, el sumatorio a lo largo de i puede


hacerse realmente antes del clculo de w. Este sumatorio producir un
vector de tamao J1 llamado z, de manera que:

J
max z j w j w = 1 (A1.39)
w
j =1

Dado que w es de longitud unitaria, el valor mximo de la expresin


anterior se alcanza cuando w es un vector unitario y paralelo a z. Por lo
tanto la solucin de encontrar w lleva a la expresin:

108
Apndice al captulo 3. __________________________________________________

z XT y
w= = T (A1.40)
z X y

Si en lugar de tener slo una se dispone de diversas variables de salida, el


PLS pasa a denominarse PLS-2, siendo el criterio de maximizacin a
seguir, suponiendo un matriz Y con M variables de salida:

M
max cov 2 (t 1 , y m ) (A1.41)
m =1

es decir, que la funcin objetivo para w1 se puede entender como la


maximizacin de la suma de cuadrados de las covarianzas entre t1 y las
variables ym originales. El algoritmo NIPALS para el PLS-2 es el que se
presenta en la Tabla A1.4.

Tabla A1.4. Algoritmo NIPALS para el modelo PLS.

Algoritmo NIPALS para PLS

1. Centrar y escalar X e Y

2. Hacer u igual a una columna de Y

3. wT=uTX/uTu (regresin de las columnas de X sobre u)

4. Normalizar w a longitud unidad

5. t=Xw/wTw (calcular scores en X)

6. qT=tTY/tTt (regresin de las columnas de Y sobre t)

7. u=Yq/qTq (calcular scores en Y)

8. Comprobar la convergencia con u: si hay convergencia pasar a 9; si no la


hay, volver a 3.

9. Loadings de X: p=XTt/tTt

10. Calcular las matrices residuales RX=X-tpT y RY=Y-tqT

11. Si son necesarias ms dimensiones PLS, reemplazar X e Y por RX y RY,


respectivamente, y repetir los pasos de 2 a 10.
109
SPC mediante MIA____________________________________________________

2.1.1 SIMPLS

Una alternativa al clculo del PLS a partir del algoritmo NIPALS es la


utilizacin del algoritmo SIMPLS, presentado por de Jong (1993). La
principal razn para su utilizacin ha sido la mayor velocidad
computacional de este algoritmo, la cual aumenta con el tamao de X.

Ambos algoritmos proporcionan el mismo resultado cuando Y es


univariante, mientras que cuando Y es multivariante, los resultados son
ligeramente diferentes. Esta diferencia entre los dos algoritmos radica en
un cambio en el criterio de optimizacin, el cual consiste en este caso en
encontrar dos direcciones wa y qa, correspondientes al espacio de X y al
espacio de Y, respectivamente, que maximicen la expresin:

max (cov(t a , u a )) (A1.42)

donde ta=Xwa, y ua=Yqa, con lo que la expresin anterior queda:

I
t ia u ia
max (cov(t a , u a )) = max i =1
I -1
( )
max t T u =
a a
(A1.43)


T
( T
max w a X Yq a )
sujeta a que w Tj X T Xw h = 0 , para jh, es decir, que las variables latentes
de X son ortogonales entre s.

La principal diferencia con el algoritmo PLS estndar es que el proceso


de deflacin se aplica directamente a la matriz de productos cruzados
S = X T Y y no a las matrices de datos X e Y.

En cualquier caso, las implicaciones prcticas son mnimas, por lo que


los dos algoritmos se consideran igualmente vlidos. Sin embargo, la ya
comentada mayor velocidad del SIMPLS frente al PLS-2 ha sido

110
Apndice al captulo 3. __________________________________________________

determinante a la hora de la eleccin de este algoritmo. La Tabla A1. 5


muestra el algoritmo del SIMPLS.

Tabla A1. 5. Algoritmo del SIMPLS.

Algoritmo SIMPLS

1. Yo = Y media(Y)
2. S=XT*Yo
3. Desde a=1 hasta A
a. q = vector principal dominante de ST*S
b. r = S*q
c. t = X*r
d. t = t media (t)
e. norma(t) = (tT*t)1/2
f. t = t/norma(t)
g. r = r/ norma(r)
h. p = XT*t
i. q = YoT*t
j. u = Yo*q
k. v=p
si a>1, entonces: v = v V*(VT*p); u = u T*(TT*u); fin
l. v = v/(vT*v)1/2 normalizar los loadings ortogonales
T
m. S = S v*(v *S) deshinchar S
n. Almacenar r, t, p, q, u y v en R, T, P, Q, U y V,
respectivamente
Fin
4. B= R*QT coeficientes de regresin
T
5. h = diag(T*T )+1/n influencias de las observaciones

111
SPC mediante MIA____________________________________________________

2.2 N-PLS

Para extender el PLS a estructuras 3-way, primero es necesario centrarse


en el modelo PLS bivariante.

Este resultado se extiende al PLS 3-way en lo siguiente. El objetivo del


algoritmo es hacer la descomposicin del cubo X en triadas. Una triada
es equivalente a un factor bivariante, es decir, un modelo de rango
unitario de la estructura de calibracin multivariante. Una triada consiste
en un vector score t y dos vectores de weights, uno en el segundo modo
llamado wJ y otro en el tercer modo llamado wK. El modelo de una sola
triada de X viene dado por la ecuacin anloga a la A1.34:

( )
^ ^
X = T W K W J de manera que x ijk = t i w Jj w kK (A1.44)

donde ti son los escalares del vector de scores t, y wjJ y wkK los escalares
de los pesos correspondientes a los modos segundo y tercero, wJ y wK
respectivamente.

Por la misma razn que para el PLS bivariante, el modelo PLS trivariante
se expresa como un problema de encontrar los vectores wJ y wk que
satisfacen:

I J K
max cov(t , y ) min (x t i w Jj w kK ) 2 (A1.45)
i =1 ijk
wJ wK
j =1 k =1

Tanto wJ como wK son, como antes, de longitud unitaria pero se han


dejado fuera de la expresin por simplicidad.

La solucin mnimo cuadrtica al modelo se puede expresar de manera


similar a la del modelo bivariante, dando como resultado la expresin:

J K
max cov(t , y ) t i = x w Jj w kK (A1.46)
wJ w K
ijk
j =1 k =1

Esto implica

112
Apndice al captulo 3. __________________________________________________

I J K
max t i y i t i = x ijk w Jj w kK =
w J w K i =1
j =1 k =1
I J K
max y i x ijk w Jj w kK = (A1.47)
wJ wK i 1
= j =1 k =1
J K
max z jk w Jj w kK
wJ wK j 1 k 1
= =

donde Z es ahora una matriz en lugar de un vector. Para maximizar esta


expresin, se formula en trminos de matrices mediante la expresin:

max
J K
w w
[(
wJ )T
] ( )
Zw K w J , w K = SVD(Z) (A1.48)

donde SVD(Z) significa la utilizacin del primer conjunto de vectores


normalizados de una descomposicin en valores singulares de Z. El
problema de encontrar wJ y wK se consigue simplemente calculando este
conjunto de vectores.

El algoritmo del PLS trilineal se presenta a continuacin. Como los


vectores de scores de las distintas componentes no son ortogonales, el
clculo de los coeficientes de regresin del paso 4 se tiene que hacer
teniendo en cuenta todos los vectores de scores calculados. La matriz de
scores T tiene dimensin IF y contiene en la f-sima columna al vector
de scores f-simo.

Si no se centran X e y, se debe aadir una columna de unos a T para


incluir los valores medios en la regresin.

Es posible calcular los residuos de X mediante un conjunto extra de


vectores de loadings p como en el PLS ordinario. Para ello, se repiten los
pasos 1 y 2 del algoritmo, pero insertando t en lugar de y, y pJ y pK en
lugar de wJ y wK. En cualquier caso, esto no da lugar a vectores de scores
ortogonales, por lo que no se tiene en cuenta aqu. La Tabla A1.6 muestra
el algoritmo del PLS1 trilineal.

113
SPC mediante MIA____________________________________________________

Tabla A1.6. Algoritmo del PLS1 trilineal.

PLS1 trilineal

Centrar X e y, y sea f=1

1. Calcular la matriz Z

2. Determinar wJ y wK mediante SVD

3. Calcular t

4. b=(TTT)-1TTy

5. Cada muestra Xi se reemplaza por la expresin Xi-


tiwJ(wK)T e y=y-Tb

6. f=f+1. continuar desde el paso 1 hasta una correcta


aproximacin a y

El algoritmo presentado se corresponde con el PLS1 bilineal dado que


slo hay una nica variable dependiente y. Si se tienen varias variables
dependientes, es posible analizarlas separadamente mediante este
algoritmo, o bien calibrarlas todas de manera simultnea como en el
algoritmo PLS2. Este algoritmo para varias variables dependientes, el
cual es iterativo, se presenta a continuacin, en la Tabla A1.7. Se trata de
una extensin directa del algoritmo PLS2 e igual al PLS1 trilineal si slo
se modela una nica variable dependiente.

114
Apndice al captulo 3. __________________________________________________

Tabla A1.7. Algoritmo del modelo PLS2 trilineal.

PLS2 trilineal
Centrar X e Y

Sea u igual a una columna de Y, y f=1

1. Calcular la matriz Z (usar u en lugar de y)

2. Determinar wJ y wK mediante SVD

3. Calcular t

4. q=YTt/|YTt|

5. u=Yq

6. Si converge, continuar; si no, ir al paso 1

7. b=(TTT)-1TTu

8. Xi=Xi-tiwJ(wK)T e Y=Y-TbqT

9. f=f+1. Continuar desde el paso 1 hasta una correcta aproximacin a Y

115
Captulo 4. MIA y SPC___________________________________________________

Captulo 4. MIA y SPC

1 INTRODUCCIN

La aparicin en la industria de las cmaras en color ha posibilitado la


adquisicin de una gran cantidad de informacin en tiempo real con unos
costes asociados relativamente bajos, especialmente si se comparan con
la gran cantidad de sensores que seran necesarios para conseguir niveles
similares de informacin, y la posibilidad de que ni siquiera en esos casos
se pudiera obtener dicha informacin. Por otra parte, el control de la
calidad de determinadas piezas y/o la inferencia de propiedades de tipo
fsico, tales como la resistencia, necesita en algunos casos de ensayos
destructivos que, evidentemente, no pueden realizarse sobre todas las
piezas, llevando a un control de calidad off-line y basado en el muestreo,
y no en una inspeccin on-line 100%.

En este sentido, las estrategias que se proponen a continuacin permiten


controlar sobre el mismo proceso de produccin, on-line, las
caractersticas de las piezas producidas o inspeccionadas y su adecuacin
o no a uno o ms modelos, a la vez que la determinacin y localizacin
de posibles defectos. Todo ello con unos tiempos asociados relativamente
bajos.

El presente captulo presenta tres posibles estrategias de actuacin que se


pueden utilizar cuando se pretende realizar un control estadstico de
procesos a partir del anlisis multivariante de imgenes. Estas tres
posibles estrategias son:

1. Control y clasificacin automtica de procesos


Ajuste a un modelo
SIMCA

117
SPC mediante MIA____________________________________________________

PLS o N-PLS Discriminantes


PLS o N-PLS Inferencial

2. Localizacin de salidas de control inespecficas


Imagen de T2
Imagen de SCR

3. Seleccin de caractersticas de inters

La primera estrategia tiene como finalidad mantener los procesos de


produccin bajo control estadstico. Existen multitud de ejemplos donde
este tipo de control tiene aplicacin, tales como el control del proceso de
produccin de snacks (Yu y MagGregor, 2003 b)), el control de un
proceso de combustin (Yu y MagGregor, 2003 a)), la produccin de
piezas metlicas (Bharati y MacGregor, 2000), el control de la
floculacin de un mineral (Liu et al., 2005), etc.

La filosofa subyacente detrs de este control es la de detectar cualquier


desviacin respecto del comportamiento normal del proceso de
produccin en condiciones normales, lo que se conoce como NOC
(Normal Operating Conditions) dentro del mundo de la ingeniera. Este
concepto se encuentra estrechamente ligado al del Control Estadstico de
Procesos o SPC (Statistical Process Control), el cual asume que un
proceso se encuentra en condiciones estables y predecibles en el tiempo
cuando slo se halla sometido a causas comunes de variabilidad, de
manera que cualquier desviacin de dicho comportamiento puede ser
asignado a alguna causa especial que haya ocurrido en un momento o
lugar determinado. Para ello, es necesario construir un modelo que recoja
la informacin y fuentes de variabilidad del proceso, con el fin de poder
detectar cualquier comportamiento anmalo, ya sea debido a que el
proceso est fluctuando fuera de sus condiciones habituales de trabajo, o
porque haya ocurrido cualquier tipo de anomala que haya hecho que el
proceso haya cambiado su estructura de funcionamiento. Es decir, se
trata de mantener el Ajuste al Modelo construido en las condiciones
consideradas adecuadas para que el proceso proporcione un producto de
buena calidad, o bien comprobar si cada pieza producida o inspeccionada
se mantiene dentro de los lmites fijados a partir del modelo construido.

118
Captulo 4. MIA y SPC___________________________________________________

Este proceso de control se puede entender tambin, a partir de la ltima


consideracin expuesta, como un proceso de clasificacin de las piezas
producidas en base a su Ajuste al Modelo. Si se dispone de informacin
adicional, es decir, si la fase de produccin puede dar lugar a diferentes
tipos de piezas, es posible construir diferentes modelos que traten de
caracterizar las posibles piezas que pueden resultar del proceso de
produccin. As, se pueden construir diferentes modelos multivariantes,
tales como PCA o Tucker3 para cada tipo de pieza o producto en lo que
se conoce como enfoque SIMCA, o bien llevar a cabo la construccin de
un modelo PLS-DA, realizando la asignacin de las nuevas piezas del
proceso de produccin en funcin de su similitud a cada una de las
posibles piezas resultantes del mismo. En el caso de disponer de
informacin de variables respuesta asociadas a los pxeles de las
imgenes (edad, dureza, concentracin de ciertas sustancias, etc.) es
posible realizar directamente una prediccin inferencial a partir de la
construccin de modelos de prediccin sobre estructuras latentes, PLS o
N-PLS.

De igual manera, estos modelos se pueden utilizar para controlar un


proceso de produccin ajeno, es decir, para la fase de inspeccin de
productos procedentes de cualquier tipo de proveedor.

En cualquier caso, lo que se consigue es un proceso de control y/o


clasificacin que puede ser total o parcialmente automatizado y que,
sobre todo, es totalmente objetivo. Esta ltima consideracin es de
mucha importancia en tareas tales como la clasificacin de cermicas por
tonalidades, la cual se suele realizar siguiendo los criterios de personal
muy experimentado, pero que no deja de estar sujeto a factores tales
como la fatiga, el descuido o a la variabilidad existente entre las
caractersticas de cada operario (diferente percepcin de los colores),
aspectos relacionados con la repetibilidad, y la variabilidad entre las
clasificaciones realizadas por distintos operarios, concepto asociado a la
reproducibilidad.

Estos controles automatizados llevan de forma natural a la segunda


estrategia de actuacin, como es la Localizacin de salidas de control
inespecficas, la cual se basa en la deteccin de aquellos pxeles que han
mostrado valores fuera de lmites para los estadsticos utilizados como
herramienta de control, y su localizacin espacial en las dimensiones

119
SPC mediante MIA____________________________________________________

fsicas de la imagen original. De esta manera, se consigue determinar y


llevar a cabo una gradacin de la calidad final del producto con una
mayor precisin, puesto que en los sectores de produccin en los que
estas herramientas se han introducido en mayor medida, tales como el
cermico o el de produccin de piezas de piedra artificial, la localizacin
y el grado de agrupamiento o de dispersin de estos pxeles es un factor
relevante a la hora de decidir la calidad final del producto. Es ms,
siguiendo este criterio, puede llegar a darse el caso de que piezas que no
superen los lmites establecidos (a partir del porcentaje mximo de
pxeles de la imagen utilizada para construir el modelo que superan los
lmites de control para los estadsticos T2 y SCR) por la estrategia de
control queden clasificadas como No Aceptables si, por ejemplo en el
caso de una mancha, los pxeles defectuosos, aunque en un porcentaje
pequeo, se encuentren agrupados en una misma zona, y hagan de esa
pieza un producto inservible de cara a su venta al pblico. Por supuesto,
y al igual que en caso anterior, esta estrategia se puede llevar a cabo tanto
a un nivel interno, de cara al propio proceso de produccin, o desde un
punto de vista de inspeccin del producto procedente de los proveedores.

Por ltimo, si se conocen aqullas caractersticas o defectos que se desea


controlar, tales como el grado de corrosin en piezas cermicas, distintas
clases de enfermedades en frutas o tejidos animales o vegetales, o el
porcentaje del rea de una pieza ocupada por un tono o caracterstica
pictrica que se desea tener en una pieza cermica, es posible construir
herramientas que permiten controlar, cuantificar y localizar esos defectos
o caractersticas de inters, y que constituyen la tercera estrategia
estudiada en esta tesis, la Seleccin de caractersticas de inters.

Con el fin de ilustrar las tres estrategias expuestas con anterioridad y


poner de manifiesto el potencial del anlisis multivariante de imgenes,
stas han sido aplicadas sobre tres procesos reales y uno simulado:

a) Control e inspeccin de naranjas tras su recoleccin

El proceso se basa en el control de naranjas tras su recoleccin. Las


imgenes han sido proporcionadas por el equipo de E. Molt, del
departamento de mecanizacin del IVIA (Instituto Valenciano de
Investigaciones Agrarias).

120
Captulo 4. MIA y SPC___________________________________________________

Se dispone de imgenes del espectro visible en RGB de diferentes


tipos de naranjas que sufren, a su vez, distintas enfermedades, plagas,
o defectos de recoleccin.

En concreto, se han utilizado imgenes de las variedades:

Clemenules
Valencia
Navelina

Inspeccionndose los defectos:

Colletotrichum
Oleocelosis
Escaldado
Podrido
Fitotoxicidad
Cochinilla
Trips
Clareta
Serpgruesa

b) Control del proceso de produccin de cermicas

El estudio se ha llevado a cabo sobre imgenes de cermicas


proporcionadas por el profesor J. M. Valiente, del DISCA
(Departamento de Informtica de Sistemas y Computadores) de la
Universidad Politcnica de Valencia.

Las imgenes proporcionadas corresponden a los modelos:

Porcelnico negro
Sydney
Claro

c) Control del proceso de fabricacin de planchas de acero

121
SPC mediante MIA____________________________________________________

Dado que no se ha dispuesto de imgenes reales, se decidi, por la


importancia que tiene este tipo de producto y a partir de la
observacin de planchas de acero reales, llevar a cabo una simulacin
de las mismas mediante su programacin en Matlab, con la inclusin
de defectos de diferentes tipos, tales como defectos de mancha, rayas
y picadas.

d) Control del proceso de produccin de piezas de piedra artificial.

Finalmente, se ha dispuesto tambin de imgenes reales procedentes


de la fabricacin de piezas de piedra artificial, proporcionadas al
igual que en el caso de las cermicas por el profesor Valiente.

122
Captulo 4. MIA y SPC___________________________________________________

2 EL PROBLEMA DE LA DIMENSIN Y DEL FONDO

Las imgenes proporcionadas por el IVIA corresponden a imgenes de


768576 pxeles, del tipo mostrado en la Figura 4.1.

a) b)
Figura 4.1. Imagen de una naranja con un defecto de podrido (a), y con defecto de
cochinilla (b).

A fin de evitar la aparicin de direcciones principales que intenten


explicar el fondo, se decidi eliminarlo mediante la seleccin de zonas de
la imagen que recogieran slo la naranja, incidiendo adems en la mayor
parte posible del defecto, con el fin de aumentar la potencia del modelo
creado. La imagen seleccionada qued de 100100 pxeles, por razones
tanto de eliminacin del fondo como por posteriores motivos
computacionales. Para el caso de unas naranjas con podrido y con
cochinilla, se puede ver el ejemplo de la zona seleccionada en la Figura
4.2.

a) b)
Figura 4.2. Imgenes 100100 seleccionadas de las imgenes originales de las naranjas
con podrido (a) y con cochinilla (b).

123
SPC mediante MIA____________________________________________________

Una vez seleccionada la zona de inters, se importa a Matlab, donde se


disgrega en los tres canales de color: Rojo, Verde y Azul. De esta manera
se pasa a tres grficos bidimensionales de intensidades de cada banda de
color. A modo de ejemplo, la Figura 4.3 presenta la descomposicin
RGB correspondiente a la naranja afectada por cochinilla de la Figura 4.2
(b), realizada con el programa Corel Photo Paint.

a) b) c)

Figura 4.3. Canales Rojo (a), Verde (b) y Azul (c) para un detalle (100100) de la
imagen de la naranja afectada por cochinilla.

Una vez se dispone de los canales de color, el siguiente paso es crear la


estructura espectro-textural, para cada una de las imgenes que se van a
tener en cuenta a la hora de realizar el estudio, a partir de la metodologa
presentada por Bharati y MacGregor (2000), y expuesta en el captulo 2.

En el caso de las cermicas tambin se opt por la construccin de los


modelos a partir de imgenes 100100 derivadas de las originales, de
dimensiones aproximadas 10001000, en este caso por motivos
computacionales exclusivamente, ya que fueron proporcionadas sin
fondo.

124
Captulo 4. MIA y SPC___________________________________________________

3 CONTROL Y CLASIFICACIN AUTOMTICA DE


PROCESOS

Como ya se ha comentado en el apartado anterior, la primera estrategia a


estudiar es la del control y clasificacin automtica de procesos. Existen
bsicamente cuatro aproximaciones o enfoques que se van a comentar y
explicar a continuacin, si bien en la presente tesis slo se han aplicado
los tres primeros, debido a la ausencia de imgenes relacionadas con
valores de salida medidos de manera objetiva.

Una vez explicados los cuatro enfoques, se comenta la considerable


cantidad de factores que pueden influir a la hora de construir estos
modelos de control y clasificacin, y cmo los niveles de stos que
optimizan el porcentaje de acierto en la clasificacin pueden variar en
funcin del problema analizado. A fin de encontrar para cada problema
estudiado los niveles de los factores que maximizan al porcentaje de
acierto en la clasificacin, se propone una metodologa basada en el
Diseo ptimo de Experimentos y en la Regresin Logstica.

Asimismo, y con el objeto de poner de manifiesto la bondad de la


integracin de las informaciones de carcter espectral y textural en una
nica estructura de datos, se comparan los resultados obtenidos con los
derivados de la utilizacin nicamente de la informacin de carcter
espectral, tradicional del MIA.

3.1 Enfoques

3.1.1 Ajuste a un modelo

El enfoque de Ajuste a un modelo se centra en el hecho de aceptar o no


una nueva muestra, constituida por la nueva imagen, como perteneciente
o no a un determinado modelo, que son utilizados como patrn o modelo
de referencia. Consiste en, a partir de una imagen considerada patrn,
pues contiene una pieza, fruta o cualquier otro tipo de objeto clasificado

125
SPC mediante MIA____________________________________________________

como sin defectos, ajustar un modelo multivariante, ya sea del tipo 2-


way, caso de PCA, o bien N-way, caso de PARAFAC o Tucker3.

Previamente se habrn realizado las operaciones de preprocesado que se


hayan considerado adecuadas en cada caso, como son el centrado y/o
escalado; as como la compresin de la imagen. Esto es algo que se debe
hacer siempre de manera previa al estudio del problema desde cualquier
enfoque, por lo que ya no se volver a comentar ms en futuros
apartados.

Una vez obtenidas las matrices de cargas (loadings) del modelo, se


calculan los scores proyectando la nueva imagen, reconvertida en una
matriz multivariante, sobre la o las matrices de cargas (en funcin de que
se trabaje con un modelo 2-way o N-way). Multiplicando de nuevo la
matriz de scores de la nueva imagen por la o las matrices de cargas, se
obtiene la prediccin de la nueva imagen a partir del modelo patrn,
con lo que restndosela a la imagen nueva original, queda el residuo de la
misma.

A partir de los scores y de los residuos, se calculan los valores de T2 y


SCR de la nueva imagen y se construyen los grficos de control
explicados en el siguiente apartado. Si el porcentaje de pxeles de la
nueva imagen que exceden los lmites de control en los grficos T2 y
SCR superan los lmites establecidos bajo control, la imagen se clasifica
como mala, mientras que si no supera dichos lmites, se clasifica como
buena. Estos lmites se calculan como el porcentaje de pxeles de la
imagen patrn que superan los lmites de control para un cierto riesgo de
primera especie (normalmente el 5%) para cada uno de los dos
estadsticos empleados, T2 y SCR. El esquema se puede apreciar en la
Figura 4.4.

126
Captulo 4. MIA y SPC___________________________________________________

Anuevo = XnuevoB
X=ABT + E
PCA Patrn Xnuevo

Valor de T2 de los datos


150

Valor de T2
100

T2
50

0
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000

Valor de SCR de los datos


1500

Valor de SCR
SCR 1000

500

0
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000

Imagen
Patrn
Imagen Enuevo = Xnuevo - AnuevoBT
Nueva
Figura 4.4. Esquema del enfoque de Ajuste a un modelo con PCA.

3.1.1.1 Grficos de control multivariantes T2 y SCR

La validacin de las observaciones constituidas por los pxeles de la


imagen se lleva a cabo a partir de las matrices de scores y de residuos
resultantes de proyectar dicha imagen sobre el modelo construido.

A partir de la matriz de residuos, medida como la diferencia entre la


estructura de informacin de la imagen original y la prediccin de la
misma por parte del modelo, se define para cada pxel el estadstico Suma
de Cuadrados Residual,

K
SCR i = rik2 (4.1)
k =1

donde rik2 es el cuadrado del residuo asociado a la variable k-sima del


pxel i. Este estadstico mide la parte de la variabilidad total de las
variables registradas para cada pxel no explicada por el modelo, a travs

127
SPC mediante MIA____________________________________________________

del cuadrado de la distancia eucldea del pxel a su proyeccin en el


hiperplano formado por las nuevas A componentes del modelo. A partir
de la distribucin de este estadstico, se puede calcular el valor crtico
(lmite de control) a partir del cual dicha variabilidad puede considerarse
anmala para un riesgo de primera especie . Un elevado valor de SCR
es indicativo de que el pxel correspondiente no se ajusta al modelo.

Para el clculo de este lmite de control se ha utilizado la aproximacin


propuesta por Jackson y Mudholkar (1979), comentada a continuacin.

Asumiendo que el vector de residuos para el pxel i es normal


multivariante, r NK(0,V), donde V es la matriz de varianzas
covarianzas residual,

V = R T R / ( N 1) (4.2)

y i sus valores propios, una aproximacin de los lmites de control para


la forma cuadrtica SCR = rTr con nivel de significacin vendr dada
por:

1 / ho
h (1 h ) (2 2 h o2 )1 / 2
SCR = 1 1 2 o 2 o + z (4.3)
1 1

donde z es el percentil 100(1-) de una variable normal tipificada, y el


resto de los parmetros vienen definidos por las expresiones:

1 = i (4.4)

2 = i2 (4.5)

3 = 3i (4.6)

1 3
y ho = 1 2 (4.7)
3 22

128
Captulo 4. MIA y SPC___________________________________________________

1 = traza (V ) (4.8)

2 = traza (V 2 ) (4.9)

3 = traza (V 3 ) (4.10)

La parte de la variabilidad de cada pxel explicada por el modelo viene


A
dada por t
a =1
2
ia . La suma de los cuadrados de los scores tipificados se

denomina estadstico T2i.

A
t ia2
TA2 = 2
= t Ti diag (1 s t2a )t i (4.11)
s
a =1 t a

donde s2ta es la varianza de ta (variable latente a-sima en X).

T2i es la distancia estimada de Mahalanobis de la proyeccin del pxel


sobre el subespacio latente respecto del centro de gravedad (media) del
modelo, y representa una medida de la variacin de cada pxel dentro del
modelo. Un pxel con un elevado valor de T2i es indicativo de que su
proyeccin y, por tanto, alguna de las variables originales, presenta
valores muy alejados del valor medio.

Para calcular el valor crtico (lmite de control) de este estadstico


asociado a un riesgo de primera especie se utiliza la expresin
propuesta por Tracy et al (1992):

T2 = A( N 2 1) / ( N ( N A))FA,N A (4.12)

donde N es el nmero de pxeles de las imgenes utilizadas para la


construccin del modelo, y FA,N A es el percentil 100(1-) de la
distribucin FA,N-A.

129
SPC mediante MIA____________________________________________________

De una forma anloga se pueden calcular los lmites de control para estos
estadsticos en los modelos N-way, tal como exponen Louwerse y Smilde
(2000).

Dado que las imgenes estn constituidas por un conjunto de pxeles, los
grficos de control T2 y SCR para cada imagen van a contener los valores
de estos estadsticos para cada pxel de la imagen, indicando en rojo los
pxeles que superan los lmites de control para ambos estadsticos. Un
ejemplo se muestra la Figura 4.5.

100

80
Valor de T2

60

40

20

0
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000

4
Valor de SCR

0
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000

Figura 4.5: Representacin de los valores de T2 y de SCR de los pxeles.

A partir de esta representacin es posible calcular un lmite de control


para la imagen en su conjunto asociado a cada uno de los dos
estadsticos. La presente tesis ha establecido como dicho lmite el
porcentaje de pxeles de las imgenes utilizadas para construir los
modelos que superan los lmites de control establecidos para los
estadsticos T2 y SCR (max %T2 y max %SCR, respectivamente).

Una vez construidos los modelos, es posible empezar a controlar los


procesos mediante la adquisicin de nuevos datos y su proyeccin sobre
dichos modelos.

130
Captulo 4. MIA y SPC___________________________________________________

Cuando se monitoriza una nueva imagen y se obtienen los porcentajes de


pxeles que superan los lmites de control para SCR y T2, se pueden dar
diferentes situaciones:

1. %SCR<max %SCR y %T2<max %T2, es decir, la nueva imagen


verifica la estructura de covarianzas del modelo (la distancia al
modelo del conjunto de pxeles que la conforman es similar a la
que cabe esperar dada la imagen de referencia) y su proyeccin en
el espacio A-dimensional del modelo est dentro de la regin de
confianza definida por la imagen de referencia.

2. %SCR<max %SCR y %T2>max %T2, es decir, la imagen se ha


visto afectada por una causa especial de variacin que ha
originado valores extremos en algunas de las variables (canales de
color o direcciones espaciales), pero respetando las relaciones
bsicas entre las variables de la imagen.

3. %SCR>max %SCR, es decir, ha aparecido una causa especial,


consistente en un nuevo evento, no presente en la imagen de
referencia, no respetndose la estructura de covarianzas del
modelo.

En los casos en que se han detectado causas especiales (casos 2 y 3) es


necesario diagnosticar qu variables del proceso estn en el origen de las
mismas, para determinar los cambios oportunos en el mismo. De igual
forma, se pueden utilizar estos criterios con un fin clasificatorio,
quedando asignada como bajo control una imagen que cumple con los
requisitos del caso 1, mientras que en los casos 2 y 3 la imagen queda
clasificada como no acorde al modelo construido.

En los apartados siguientes se ilustra la aplicacin de este enfoque en


imgenes reales.

131
SPC mediante MIA____________________________________________________

3.1.1.2 Ejemplo de aplicacin a las naranjas

Supngase en una planta hortofrutcola que se pretende evitar que una


naranja afectada por, v.g., serpgruesa salga al mercado. Para conseguir
este objetivo se podra crear un modelo para dicho defecto de la naranja,
de manera que si una naranja lo tuviera, se retirara inmediatamente de la
calibradora, mientras que si no mostrara dicho defecto, se dejara en la
lnea para su posterior procesado.

Para crear el modelo se necesita una imagen que recoja el defecto, tal
como la mostrada en la Figura 4.6.

Figura 4.6. Detalle (100100) de una


naranja afectada por serpgruesa.

Asumiendo un modelo PCA, si se lleva a cabo una validacin cruzada se


obtienen los grficos de las Figura 4.7, explicativos del modelo a utilizar.

5
x 10 Representacion de Q2X y R2X
20 800 2
Q2X
0 R2X

-2
15 600
Eigenvalue of Cov(x) (p)

-4
RMSECV (s)

-6
10 400
-8

-10

5 200 -12

-14

-16
0 0
0 5 10 15 20 25 30
-18
Latent Variable 0 5 10 15 20 25 30
Numero de variables latentes

a)
b)
Figura 4.7. Grfico de los valores de los valores propios de las variables latentes (azul)
y del RMSECV (rojo) (a), y Grfico de R2X y de Q2X (b).

132
Captulo 4. MIA y SPC___________________________________________________

A partir de los modelos, construidos mediante validacin cruzada con el


nmero de componentes que maximizan Q2X o bien minimizan el
RMSECV (6 en este caso), se pueden establecer los lmites de T2 y de
SCR para el modelo patrn. La Figura 4.8 muestra los resultados de la
proyeccin de la imagen patrn sobre el modelo PCA creado a partir de
la misma.

250

200
Valor de T2
150

100

50

0
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000

Valor de SCR de los datos


50

40
Valor de SCR

30

20

10

0
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000

Figura 4.8. Valores de T2 y de Suma de Cuadrados Residuales de la imagen de naranja


afectada por serpgruesa (Fig. 4.6) utilizada para construir el modelo patrn. Los pxeles
en rojo son los que superan los lmites establecidos para T2 y SCR, respectivamente.

A partir de los pxeles de la imagen que superan los lmites establecidos


para T2 y SCR, es posible determinar el porcentaje mximo de pxeles
que pueden superar los lmites del modelo. En este caso, dichos lmites
son del 8,22% y 6,68%, respectivamente.

Una vez creado el modelo y establecidos los porcentajes mximos de


pxeles que pueden superar los lmites de T2 y SCR, se establecen las
distancias al mismo de distintas imgenes. Por ejemplo, si se selecciona
la imagen de una naranja afectada por un defecto de podrido tal como la
mostrada en la Figura 4.2.a) y se proyecta sobre el modelo creado con la
imagen de la naranja afectada por serpgruesa mostrada en la Figura 4.6,
aparecen los siguientes grficos de T2 y SCR que se ilustran en la Figura
4.9.

133
SPC mediante MIA____________________________________________________

250

200

Valor de T2
150

100

50

0
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000

40

30
Valor de SCR

20

10

0
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000

Figura 4.9. Valores de T2 y de Sumas de Cuadrados Residuales (SCR) de la imagen de


una naranja afectada por podrido (Figura 4.2.a), al proyectarla sobre el modelo PCA
creado a partir de la imagen afectada con serpgruesa de la Figura 4.6.

En estos grficos los pxeles que sobrepasan los lmites del 95% de
probabilidad, para el modelo creado, aparecen en rojo. A partir de este
grfico y tambin de los resultados numricos obtenidos, se puede
establecer que la imagen comparada no pertenece al modelo de
escaldado. Los porcentajes de pxeles que sobrepasan en este caso los
lmites de T2 son el 95,47%, mientras que el porcentaje para la Suma de
Cuadrados Residuales es del 34,27%.

Supngase ahora que se dispone de una imagen que corresponde con otra
naranja afectada por serpgruesa, tal como la mostrada en la Figura 4.10.

Figura 4.10. Detalle de una naranja con serpgruesa.

134
Captulo 4. MIA y SPC___________________________________________________

En este caso, es de esperar que al proyectar la nueva imagen sobre el


modelo patrn el porcentaje de pxeles por encima de los lmites sea del
mismo orden que los encontrados para la imagen patrn, ya que se trata
de una naranja con el mismo tipo de defecto.

La Figura 4.11 muestra los valores alcanzados para T2 y SCR por los
pxeles de la nueva imagen al proyectarlos sobre el modelo creado.

250

200
Valor de T2

150

100

50

0
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000

50

40
Valor de SCR

30

20

10

0
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000

Figura 4.11. Representacin de los valores de T2 y de las Sumas de Cuadrados


Residuales (SCR) para los pxeles de la imagen de la Figura 4.10 al proyectarla sobre el
modelo PCA de la Figura 4.6.

En este grfico, el 30,13% de los pxeles estn por encima de los lmites
para el grfico de T2 (superior al 8,22% de la imagen patrn), mientras
que hay un 4,10% por encima de los lmites para el grafico de SCR
(inferior al 6,68% de la imagen patrn). Esto significara que la naranja
presenta la estructura correspondiente a la enfermedad de serpgruesa, ya
que su porcentaje de pxeles por encima de los lmites establecidos a
partir de la imagen patrn no supera el mximo permitido por la SCR
(6,68%), pero con un grado de afectacin de la enfermedad diferente del
de la imagen patrn (puesto que el lmite s se traspasa en el caso del T2).

135
SPC mediante MIA____________________________________________________

3.1.1.3 Ejemplo de aplicacin a las cermicas

Supngase que se dispone de dos imgenes de cermicas de referencias


Porcelnico Negro, Figura 4.12 (a) y Sydney, Figura 4.12 (b).

a) b)
Figura 4.12. Imgenes de cermicas de los modelos Porcelnico Negro (a) y Sydney (b).

El modelo PCA creado a partir de la imagen del modelo Porcelnico


Negro (Figura 4.12 a)) dio como resultado las grficas de validacin
cruzada que se muestran en las Figuras 4.13.
6 Representacion de Q2X y R2X
x 10
20 1000 0.5
Q2X
R2X
0

-0.5
Eigenvalue of Cov(x) (p)

RMSECV (s)

-1
10 500

-1.5

-2

-2.5

0 0 -3
0 5 10 15 20 25 30 0 5 10 15 20 25 30
Latent Variable Numero de variables latentes

a) b)

Figura 4.13. Grfico de los valores propios de las variables latentes (azul) y del
RMSECV (rojo) (a), y Grfico de R2X y de Q2X (b).

A partir de estos resultados se decidi ajustar un modelo con 13


componentes y se llev a cabo la proyeccin de la nueva imagen,
correspondiente a una cermica Sydney, obtenindose los valores de T2 y
SCR mostrados en la Figura 4.14.

136
Captulo 4. MIA y SPC___________________________________________________

1500

Valor de T2
1000

500

0
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000

15

Valor de SCR
10

0
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000

Figura 4.14. Valores de T2 y de SCR para el modelo Sydney (Fig. 4.12 b) al proyectarlo
sobre el modelo PCA construido para el modelo de Porcelnico Negro (Fig. 4.12 a).

En la grfica de la Figura 4.14 se puede observar claramente cmo la


totalidad de los pxeles superan los lmites de probabilidad (zona de
rechazo) para los valores de T2, as como el 98,31% en el caso de la
Suma de Cuadrados Residuales (SCR), por lo que se pone claramente de
manifiesto que la nueva imagen (modelo Sydney) no debe clasificarse
como Porcelnico Negro, Figura 4.12 (a), ya que los porcentajes de
pxeles que superaban los lmites de este modelo estaban fijados en
7,62% en el caso de T2 y del 8,50% en el caso de SCR.

A continuacin, se lleva a cabo una nueva comparacin, para ver cmo


funciona el modelo a la hora de establecer diferencias respecto de piezas
del mismo tipo.

Se escogen dos piezas cermicas del modelo de Claro, mostradas en la


Figura 4.15. Tras ajustar un modelo Tucker3 a la imagen del modelo
Claro, se obtiene el grfico de validacin cruzada de la Figura 4.16.

En dicho grfico se puede observar que la metodologa empleada es tri-


variante, y el modelo es un [3 3 3], lo cual significa que la variabilidad
explicada queda recogida por las combinaciones de tres componentes en
el modo de las observaciones, tres componentes en el modo textural, y
tres en el modo espectral.

137
SPC mediante MIA____________________________________________________

a) b)
Figura 4.15. Imgenes de cermicas del modelo Claro.

Al proyectar la imagen del modelo Claro de la Figura 4.15 b) sobre el


modelo Tucker3 ajustado, las grficas de distancias al modelo, tanto en
trminos de valores residuales, como de T2 obtenidas en este caso son las
que aparecen en la Figura 4.17.

Figura 4.16. Grfico para la determinacin, mediante validacin cruzada, del


modelo 3-way ms adecuado a la imagen del modelo Claro de la Figura 4.15 (a).

Se puede comprobar cmo los resultados han sido obtenidos a partir de


un nico nivel de compresin, y que el porcentaje de pxeles que superan
los lmites de Sumas de Cuadrados Residuales es del 9,96%, mientras
que para T2 el porcentaje de pxeles que superan los lmites de
probabilidad es del 7,49%. En cualquier caso, este valor es del mismo
orden que el existente para la propia imagen utilizada como patrn,
donde el porcentaje de pxeles que superan los lmites de probabilidad es
del 8,49 % para T2 y del 10,95% para la SCR, por lo que la pieza se
asume perteneciente al modelo Claro.

138
Captulo 4. MIA y SPC___________________________________________________

30

20

Valor T2
10

0
0 500 1000 1500 2000 2500 3000
4
x 10
4

3
Valor SCR

0
0 500 1000 1500 2000 2500 3000

Figura 4.17. Valores de T2 y de SCR para la imagen del modelo Claro, Fig.4.15 (b) al
proyectarlo sobre el modelo Tucker3 construido para el modelo de Claro, Fig. 4.15 (a).

3.1.2 SIMCA

El segundo enfoque a estudiar es el mtodo SIMCA, Soft Independent


Modelling of Class Analogy (Wold et al., 1984), en el cual se pretende
diagnosticar si una imagen es buena o si bien tiene algn tipo de
caracterstica o defecto, en funcin de su parecido a los modelos
previamente creados para cada una de las imgenes patrn.

El procedimiento consiste en crear tantos modelos patrn como imgenes


patrn se disponga, correspondientes a objetos que tengan diferentes
caractersticas: pieza buena, pieza con un determinado defecto, pieza con
una caracterstica interesante, etc.

Cada uno de estos modelos viene caracterizado por una o varias matrices
de cargas, en funcin de que se haya creado un modelo 2-way o N-way.
Una vez calculados, se toma una nueva imagen, y se proyecta sobre cada
uno de los modelos patrn.

139
SPC mediante MIA____________________________________________________

El paso final es calcular los T2 y SCR para cada modelo, asignando la


nueva imagen al modelo ms cercano, determinado a partir del valor
mnimo del porcentaje de pxeles que superan los lmites de control para
los estadsticos T2 y SCR, siempre que el porcentaje de pxeles de la
imagen proyectada por encima de los lmites no supere el mximo
permitido para cada uno de los modelos.

Estos lmites de control se calculan como el porcentaje de pxeles por


encima de lmites, para cada uno de los dos estadsticos, en las imgenes
utilizadas para la construccin de cada uno de los modelos, de manera
anloga a la explicada en el enfoque de Ajuste a un modelo. La Figura
4.18 presenta el esquema.

Xnueva
X1 = A1B1T + E1
PCA Clase 1 Imagen nueva

X2 = A2B2T + E2 A1n = X nuevaB1 A2n = XnuevaB2 A3n = XnuevaB3


PCA Clase 2 E1n = Xnew A1nBT 1 E2n = Xnueva A2nB2T E3n = Xnueva A3nB3T

T2 para nuevos datos respecto modelo 1 T2 para nuevos datos respecto modelo 2 T2 para nuevos datos respecto modelo 3
1400 1400 1400

1200 1200 1200

1000 1000 1000

X3 = A3B3T + E3
Valor T2

Valor T2

Valor T2
800 800 800

T2 600 600 600

400 400 400

200 200 200

Imagen PCA Clase 3 0


0 1000 2000 3000
0
0 1000 2000 3000
0
0 1000 2000 3000

Clase 1 SCR para nuevos datos respecto modelo 1


14000
SCR para nuevos datos respecto del modelo 2
14000
SCR para nuevos datos respecto modelo 3
14000

12000 12000 12000

10000 10000 10000

SCR
Valor SCR

Valor SCR

Valor SCR

8000 8000 8000

6000 6000 6000

4000 4000 4000

2000 2000 2000

0 0 0
0 1000 2000 3000 0 1000 2000 3000 0 1000 2000 3000

Imagen
Imagen Clase 3
Clase 2
Asignacin al modelo
ms cercano
Figura 4.18. Esquema del enfoque SIMCA con PCA.

En el caso de que dos o ms modelos presentasen SCR iguales, se


estudiaran los valores de T2, para asignar definitivamente la pieza como
perteneciente al modelo respecto del cual presente una menor diferencia
en trminos de T2.

140
Captulo 4. MIA y SPC___________________________________________________

3.1.2.1 Ejemplo de aplicacin sobre las naranjas

Si se aplica el enfoque SIMCA con PCA sobre tres tipos de defectos, tales
como colletotrichum, escaldado y podrido (Fig. 4.19 (a), (b) y (c)), se
obtiene en primer lugar los grficos de las Figuras 4.20 y 4.21,
correspondientes a la validacin cruzada.

a) b)

c) d)
Figura 4.19. Imgenes utilizadas para la construccin de los modelos: colletotrichum
(a), escaldado (b) y podrido (c), y la utilizada para llevar a cabo la comparacin,
afectada por colletotrichum (d).

A partir de estos datos se puede saber cul es el nmero ptimo de


componentes principales para cada modelo o tipo (anlogamente sucede
para los mtodos 3-way), y una vez conocidos se determinan los mismos
mediante validacin cruzada con el objeto de poder llevar a cabo las
comparaciones.

141
SPC mediante MIA____________________________________________________

20 50
20 20 20 3

15 15 15 2.5

Eigenvalue of Cov(x) (p)


Eigenvalue of Cov(x) (p)

Eigenvalue of Cov(x) (p)

RMSECV (s)
RMSECV (s)

RMSECV (s)
10 10 10 2

5 5 5 1.5

0 0
0 0 0 1 0 5 10 15
0 5 10 15 0 5 10 15
Latent Variable
Latent Variable Latent Variable

a) b) c)
Figura 4.20. Grficos de los valores propios de las variables latentes (azul) y del
RMSECV (rojo) para las naranjas con colletotrichum (a), escaldado (b) y podrido (c).

Representacion de Q2X1 y R2X1 Representacion de Q2X2 y R2X2 Representacion de Q2X3 y R2X3


200 100 1000
Q2X1 Q2X2 Q2X3
R2X1 R2X2 R2X3
0
0
95

-1000

-200
90
-2000

-400
-3000
85

-600 -4000

80
-5000
-800

-6000
75
-1000

-7000

70
-1200
-8000

-1400 65 -9000
0 5 10 15 0 5 10 15 0 5 10 15
Numero de variables latentes Numero de variables latentes Numero de variables latentes

a) b) c)
Figura 4.21. Grficos de R2X y Q2X para los tres modelos: colletotrichum (a),
escaldado (b) y podrido (c).
Cuando se proyecta la nueva imagen de la Fig. 4.19 (d) sobre los
modelos construidos a partir de las imgenes 4.19 (a), (b) y (c), se
obtienen los resultados mostrados en la Figura 4.22.

Los porcentajes de pxeles para las imgenes utilizadas como patrn


fueron los que se muestran en la Tabla 4.1.

Tabla 4.1. Porcentajes de pxeles por encima de los lmites de control para las imgenes
utilizadas como patrn.

Enfermedad Colletortichum Escaldado Podrido


% T2 10,77 % 10,34% 8,38%
% SCR 11,19% 5,76% 7,42%

142
Captulo 4. MIA y SPC___________________________________________________

250 250 250

200 200 200

Valor T2

Valor T2

Valor T2
150 150 150

100 100 100

50 50 50

0 0 0
0 1000 2000 3000 0 1000 2000 3000 0 1000 2000 3000

3500 3500 3500

3000 3000 3000

2500 2500 2500


Valor SCR

Valor SCR

Valor SCR
2000 2000 2000

1500 1500 1500

1000 1000 1000

500 500 500

0 0 0
0 1000 2000 3000 0 1000 2000 3000 0 1000 2000 3000

a) b) c)
2
Figura 4.22. Valores de T y de SCR de la nueva imagen correspondiente a la naranja
con colletotrichum, Fig. 4.22 (d), respecto de los tres modelos PCA creados:
colletotrichum (a), escaldado (b) y podrido (c).

La imagen proyectada presentaba los porcentajes de pxeles por encima


de lmites respecto de cada uno de los modelos mostrados en la Tabla
4.2.

Tabla 4.2. Porcentajes de pxeles por encima de los lmites para de la imagen proyectada
afectada por colletrichum las imgenes utilizadas como patrn.

Enfermedad Colletortichum Escaldado Podrido


% T2 38,52% 69,82% 98,8%
% SCR 11,01% 14,76%% 19,84%

Estos resultados implican que se debe descartar las enfermedades de


podrido y escaldado, quedando como nica posible la enfermedad de
colletotrichum. Si se realiza la representacin de los porcentajes de
pxeles de la imagen proyectada que sobrepasan los lmites de control
para T2 y SCR sobre cada modelo, se obtiene una representacin de la
Tabla 4.2 como la mostrada en la Figura 4.23.

143
SPC mediante MIA____________________________________________________

100 20

90 18

80 16

70 14

% pixeles sobre SCR


% pixeles sobre T2
60 12

50 10

40 8

30 6

20 4

10 2

0 0
1 2 3 1 2 3
modelos modelos

a) b)
Figura 4.23. Porcentaje de pxeles sobre los lmites de control de T2 (a) y de SCR (b) de
la nueva imagen respecto de los tres modelos: colletotrichum (1), escaldado (2) y
podrido (3).

Dado que el porcentaje mnimo sin sobrepasar el lmite mximo sobre el


lmite de SCR se da para el modelo 1, creado a partir de la imagen de
colletotrichum, se deriva que el enfoque SIMCA asigna de manera
correcta la nueva imagen como una naranja contaminada por
colletotrichum, ya que SIMCA se basa primordialmente en las Sumas de
Cuadrados Residuales. Por otro lado, en este caso, era la nica posible
asignacin que hubiese resultado correcta, si bien en otros casos es
posible que no se superen los porcentajes mnimos de SCR para ms de
un modelo, con lo que la asignacin se realizara a partir del menor
porcentaje calculado, como ya se ha comentado.

Es posible encontrarse con situaciones como la presente, en las que el


SCR dictamine bien el modelo y T2 no. Esto sera un sntoma de que, si
bien se ha acertado en la clasificacin, la imagen muestra un grado de
afectacin de la enfermedad diferente al del correspondiente modelo
patrn.

Si se utilizan mtodos tri-variantes, la validacin cruzada utilizando el N-


way Toolbox for Matlab (Andersson y Bro, 2000) de los mismos da lugar
al grfico mostrado en la Figura 4.24, asociada a la construccin de un
modelo Tucker3.

144
Captulo 4. MIA y SPC___________________________________________________

Este grfico se repite para los tres tipos de defectos, dando lugar a los
modelos Tucker3 correspondientes (colletotrichum, escaldado y
podrido).

Figura 4.24. Grfico para la determinacin, mediante validacin cruzada, del modelo 3-
way ms adecuado (ejemplo para el modelo de naranja con defecto de colletotrichum).

Las imgenes a partir de las cuales se han creado los modelos han sido
las ya mostradas con anterioridad en la Figura 4.21. (a), (b) y (c),
mientras que la imagen a comparar en este caso ha sido, a fin de
comprobar la bondad de este tipo de anlisis independientemente de la
naturaleza del modelo multivariante empleado, la de una nueva naranja
con defecto de colletotrichum, mostrada en la Figura 4.25.

Figura 4.25. Imagen de la naranja a comparar, con defecto de colletotrichum.

Las grficas de Sumas de Cuadrados Residuales (SCR) y de T2 son las


que se muestran en la Figura 4.26.

145
SPC mediante MIA____________________________________________________

100 100 100

80 80 80

Valor T2

Valor T2

Valor T2
60 60 60

40 40 40

20 20 20

0 0 0
0 1000 2000 3000 0 1000 2000 3000 0 1000 2000 3000

4 4 4
x 10 x 10 x 10
3 3 3

2.5 2.5 2.5


Valor SCR

Valor SCR

Valor SCR
2 2 2

1.5 1.5 1.5

1 1 1

0.5 0.5 0.5

0 0 0
0 1000 2000 3000 0 1000 2000 3000 0 1000 2000 3000

a) b) c)
Figura 4.26. Valores de T2 y de SCR de la nueva imagen correspondiente a la naranja con
colletotrichum, Fig. 4.25, respecto de los tres modelos Tucker3 creados: colletotrichum (a),
escaldado (b) y podrido (c).

Los porcentajes de pxeles para las imgenes utilizadas como patrn han
sido los que se muestran en la Tabla 4.3, mientras que la imagen
proyectada presenta los porcentajes de pxeles por encima de lmites
respecto de cada uno de los modelos mostrados en la Tabla 4.4.

Tabla 4.3. Porcentajes de pxeles por encima de los lmites de control para las imgenes
utilizadas como patrn.

Enfermedad Colletortichum Escaldado Podrido


% T2 3,58% 4,54% 4,76%
% SCR 7,57% 9,73% 9,15%

Tabla 4.4. Porcentajes de pxeles por encima de los lmites de control establecidos a
partir de las imgenes patrn de la imagen proyectada, afectada por colletrichum, Fig.
4.25.

Enfermedad Colletortichum Escaldado Podrido


% T2 65,01% 85,12% 87,50%
% SCR 5,42% 97,27% 99,80%

146
Captulo 4. MIA y SPC___________________________________________________

De nuevo en este caso, la nica posible asignacin vlida es la de la


enfermedad de colletotrichum, dado que es la nica para la cual no se
supera el porcentaje mximo de SCR establecido a partir de las imgenes
utilizadas para crear los distintos modelos. En la Figura 4.27 se puede
observar la representacin de los porcentajes de la Tabla 4.4.
90 100

80 90

80
70
70
60

% pixeles sobre SCR


% pixeles sobre T2
60
50
50
40
40
30
30

20
20

10 10

0 0
1 2 3 1 2 3
modelos modelos

a) b)
Figura 4.27. Porcentaje de pxeles sobre los lmites de control de T2 (a) y de SCR (b)
de la imagen de la Figura 4.25 para los tres modelos Tucker3 ajustados.

3.1.2.2 Ejemplo de aplicacin sobre las cermicas

Para ilustrar este enfoque en el contexto de las cermicas, supngase que


se dispone de tras imgenes patrn correspondientes a los modelos
indicados en la Figura 4.28 (a), (b) y (c), correspondientes a cermicas de
las referencias Claro, Porcelnico Negro y Sydney, respectivamente.
Adems, se dispone de una nueva imagen correspondiente a la referencia
Sydney, la cual se presenta en la Figura 4.28 (d).

a) b)

147
SPC mediante MIA____________________________________________________

c) d)

Figura 4.28. Imgenes de las cermicas utilizadas para la aplicacin del enfoque SIMCA
con PCA: Claro (a) Porcelnico Negro (b) y Sydney (c); as como de la pieza de la
referencia Sydney a clasificar (d).

A continuacin se construyen los modelos PCA para cada una de las


imgenes patrn, obtenindose los siguientes grficos de las Figuras 4.29
y 4.30.

10 5
10 5 10 5
Eigenvalue of Cov(x) (p)

Eigenvalue of Cov(x) (p)

Eigenvalue of Cov(x) (p)


RMSECV (s)

RMSECV (s)

RMSECV (s)
0 0
0 5 10 15 0 0 0 0
0 5 10 15 0 5 10 15
Latent Variable
Latent Variable Latent Variable

a) b) c)
Figura 4.29. Grficos de los valores propios de las variables latentes (azul) y del
RMSECV (rojo) para las cermicas de los modelos Claro (a), Porcelnico Negro (b) y
Sydney (c).

Como en el caso de las cermicas, cada modelo se construye con el


nmero de componentes principales determinadas por el proceso de
validacin cruzada. Al proyectar la imagen de la nueva cermica del
modelo Sydney presentada en la Figura 4.28 (d) sobre los tres modelos
anteriores se obtienen los siguientes grficos de la Figura 4.31.

148
Captulo 4. MIA y SPC___________________________________________________

Representacion de Q2X1 y R2X1 Representacion de Q2X2 y R2X2 Representacion de Q2X3 y R2X3


100 100 100
Q2X1 Q2X2 Q2X3
R2X1 R2X2 R2X3

90 90
90

80 80
80

70 70

70

60 60

60

50 50

50
40 40

40
30 30

30 20 20
0 5 10 15 0 5 10 15 0 5 10 15
Numero de variables latentes Numero de variables latentes Numero de variables latentes

a) b) c)
2 2
Figura 4.30. R y Q para los tres modelos: Claro (a), Porcelnico Negro (b) y Sydney (c).

Las tablas 4.5 y 4.6 muestran, respectivamente, los porcentajes de pxeles


que superan los lmites establecidos para T2 y SCR, para las imgenes
patrn a partir de las cuales se han construido los modelos, y para la
imagen proyectada, de manera anloga a las tablas 4.1 a 4.4.

Tabla 4.5. Porcentajes de pxeles por encima de los lmites de control para las imgenes
utilizadas como patrn.

Modelo Claro Porcelnico Negro Sydney


% T2 14,53% 5,31% 6,27%
% SCR 8,61% 5,04% 7,96%

Tabla 4.6. Porcentajes de pxeles por encima de los lmites de control establecidos a
partir de las imgenes patrn de la imagen proyectada del modelo Sydney, Fig. 4. 28 d).

Modelo Claro Porcelnico Negro Sydney


% T2 100% 100% 8,50%
% SCR 99,19% 100% 7,34%

En este caso, la nica asignacin posible es la correspondiente al modelo


Sydney, ya que es el nico para el que el porcentaje de pxeles de la
imagen proyectada no supera el porcentaje mximo permitido de pxeles
sobre el lmite de SCR.

149
SPC mediante MIA____________________________________________________

2000 2000 2000

1500 1500 1500

Valor T2

Valor T2

Valor T2
1000 1000 1000

500 500 500

0 0 0
0 1000 2000 3000 0 1000 2000 3000 0 1000 2000 3000

50 50 50

40 40 40

Valor de SCR
Valor SCR

Valor SCR
30 30 30

20 20 20

10 10 10

0 0 0
0 1000 2000 3000 0 1000 2000 3000 0 1000 2000 3000

a) b) c)
Figura 4.31. Valores de T2 y de SCR de la nueva imagen correspondiente a la
cermica de referencia Sydney, Fig. 4.29 (d), respecto de los tres modelos creados:
Claro, Fig. 4.22 (a), Porcelnico Negro (b) y Sydney (c).

La Figura 4.32 ofrece la representacin de los porcentajes mostrados en


la Tabla 4.6.

100 100

90 90

80 80

70 70
% pixeles sobre SCR
% pixeles sobre T2

60 60

50 50

40 40

30 30

20 20

10 10

0 0
1 2 3 1 2 3
modelos modelos

a) b)
Figura 4.32. Porcentaje de pxeles sobre los lmites de control de T2 (a) y de SCR
(b) de la nueva imagen para los tres modelos: Claro (1), Porcelnico Negro (2) y
Sydney (3).

150
Captulo 4. MIA y SPC___________________________________________________

3.1.3 PLS-DA

El PLS-DA (Sjstrm et al., 1986) es similar al enfoque SIMCA en el


objetivo, ya que pretende clasificar nuevas imgenes en funcin de su
parecido a otras imgenes utilizadas como patrn; si bien en este caso se
utilizan algoritmos predictivos como el PLS o N-PLS.

Como en el caso anterior, se parte de varias imgenes, cada una de las


cuales recoge una determinada caracterstica, o bien su ausencia. Dichas
imgenes se colocan una debajo de la otra (previamente generada la
imagen multivariante y preprocesada como ya se ha comentado en
apartados anteriores), creando variables dummy para cada una de las
imgenes patrn. Una vez creadas las matrices correspondientes a las
imgenes y las variables dummy, se calcula un modelo PLS o N-PLS. A
continuacin, se obtiene el valor de SCR, para ver si la nueva imagen se
ajusta al modelo, o si existen algunas concentraciones de pxeles de
inters. En el caso de que la imagen presente un porcentaje de pxeles por
encima de lmites inferior al mximo permitido (definido por el modelo
ajustado), se puede llevar a cabo la prediccin, a partir de la matriz de
coeficientes, asignando la nueva imagen como perteneciente a aquella
clase para la cual muestra un valor medio predicho ms cercano a la
unidad. En la Figura 4.33 se aprecia el proceso a seguir para aplicar este
enfoque. 100
100

Clase 1 ..
100
010
010 Xnueva
010

Clase 2 .
. Nueva
010 Imagen
001
Imagen
001
Clase 1

Clase 3
100
.

001
Ypred = XBPLS 010

001
X Y
Imagen
Clase 2
Valor de T2 de los datos
150
Valor de T2

100

50
T2
Y = XBPLS + G 0
0 1000 2000 3000 4000 5000 6000

Valor de SCR de los datos


7000 8000 9000 10000

1500

Imagen Asignacin
Valor de SCR

1000

Clase 3
500

0
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000
SCR al modelo
ms cercano
Figura 4.33. Esquema del enfoque PLS-Discriminante, utilizando PLS.
151
SPC mediante MIA____________________________________________________

3.1.3.1 Ejemplo de aplicacin sobre las naranjas

A modo de ejemplo, se presenta la comparacin de una imagen con


colletotrichum, ya mostrada anteriormente en la Figura 4.19 (d), con los
mismos patrones utilizados en la construccin del modelo SIMCA-PCA,
mostrados en la Figuras 4.19 (a), (b) y (c). En primer lugar, la Figura
4.34 muestra los grficos de ajuste del modelo a cada una de las clases
modeladas.

Figura 4.34. Grficos R2Y y Q2Y de ajuste al modelo.

Como se puede apreciar en el grfico de la Figura 4.34, cada una de las


imgenes patrn muestra un grado diferente de poder predictivo en
funcin del nmero de componentes principales utilizado. A partir de
este resultado, se ha optado por elegir como nmero de componentes
principales del modelo la media del nmero de componentes principales
que maximizan el poder predictivo de cada uno de ellos, Q2.

Una vez proyectada la imagen la Figura 4.19 (d) sobre el modelo PLS-
DA construido a partir de las imgenes de las Figuras 4.19 (a), (b) y (c),
el modelo proporcion la salida que se presenta en la Figura 4.35.

A partir de la Figura 4.35, se puede observar cmo el enfoque PLS-DA


asigna la imagen de la naranja con colletotrichum de la Figura 4.21 (d)
como perteneciente a la clase 1, la cual est asociada a la enfermedad de
colletotrichum. La manera en que se lleva a cabo la asignacin se basa en

152
Captulo 4. MIA y SPC___________________________________________________

el hecho de que cuanto ms parecidos son los pxeles de la imagen


proyectada a una de las clases utilizadas en la construccin del modelo
PLS-DA, la prediccin de los mismos por parte del modelo ser cercana a
1, mientras que cuanto ms alejada se encuentre la imagen proyectada de
las distintas clases, ms cercana a cero ser la prediccin, fluctuando los
valores alrededor del cero.

Figura 4.35. Valores medios predichos del enfoque PLS-DA construido a partir de
las imgenes utilizadas como patrn, Figs. 4.21 (a), (b) y (c), cuando se proyecta la
imagen de la Fig. 4.22 (d).

3.1.3.2 Ejemplo de aplicacin sobre las cermicas

En el caso de tener una nueva imagen a clasificar, por ejemplo como la


cermica de la Figura 4.36, correspondiente a la referencia Claro, y se
utilizan las imgenes de las Figuras 4.28 (a), (b) y(c), correspondientes a
las referencias Claro, Porcelnico Negro y Sydney respectivamente, se
obtiene el grfico de asignacin mostrado en la Figura 4.37.

Figura 4.36. Imagen de la pieza del modelo Claro 426.


153
SPC mediante MIA____________________________________________________

En este caso, y de manera similar al de las naranjas, se ha llevado a cabo


la prediccin mostrada en la Figura 4.37.

Asignacin del modelo


0.8

0.7

0.6

0.5

0.4

0.3

0.2

0.1

0
1 2 3

Figura 4.37. Valores medios predichos del enfoque PLS-DA construido a partir de las
imgenes utilizadas como patrn, Figs. 4.28 (a), (b) y (c), cuando se proyecta la imagen
de la Fig. 4.36 (d).

Como ya se ha comentado, el modelo PLS-DA realiza una prediccin, de


manera que cuanto ms se considera que un pxel pertenece a una
determinada clase (modelo de cermica en este caso), mayor es la
aproximacin de la prediccin media realizada al valor 1. Por ello, la
asignacin de la nueva imagen como perteneciente a un determinado
modelo se lleva a cabo mediante el estudio de los valores alcanzados por
el grupo de pxeles respecto de cada una de las clases o modelos
utilizados a la hora de crear el modelo PLS-DA. De esta manera, la nueva
imagen proyectada se asignara a la clase codificada como 1,
correspondiente al modelo Claro.

3.1.4 Prediccin inferencial

Como ltimo enfoque de los que se presentan en esta tesis, aparece la


prediccin inferencial, la cual pretende, a partir de una imagen, conocer
caractersticas cuantificables de calidad en un determinado objeto (Geladi
y Esbensen, 1991).

154
Captulo 4. MIA y SPC___________________________________________________

Para ello, se trabaja de una forma similar a la anteriormente explicada,


con la diferencia de que en este caso no se crean variables dummy
asociadas a cada imagen, sino que en un nico vector se colocan los
valores medidos de la variable de calidad, para cada uno de los pxeles de
cada una de las imgenes.

Despus, al igual que antes, se ajusta un modelo PLS o N-PLS,


obteniendo la matriz de coeficientes, tras lo cual, a partir de una nueva
imagen, que se multiplica por dicha matriz, nos queda la prediccin de la
variable de salida.

Como siempre, se debe obtener los valores de T2 y SCR, para ver si la


nueva imagen se ajusta al modelo, o si existen algunas concentraciones
de pxeles de inters. La Figura 4.38 muestra el esquema de este enfoque.

10
10
10
20
20 Xnueva
20
30 Imagen
Dureza 10 30 nueva
30
Rockwell
X Y
D plot
60

50

XBPLS T2
40

D-value
30

20

10

Dureza 15
Y = XBPLS + G 0
0 500 1000 1500

RSS plot
2000 2500 3000

2000

Rockwell SCR
1500
Q-value

1000

500

0
0 500 1000 1500 2000 2500 3000

10 15 30
Dureza 30 Ypred= XBPLS
Rockwell

Figura 4.38. Esquema del enfoque de prediccin inferencial, con PLS.

El hecho de no disponer de imgenes con variables de calidad


cuantificables de manera objetiva ha imposibilitado la aplicacin de la
presente estrategia, quedando la misma como una lnea de investigacin
futura.

155
SPC mediante MIA____________________________________________________

3.2 Optimizacin de los factores: Diseo de Experimentos y


Regresin Logstica

Una vez descrita la metodologa a emplear segn el enfoque que se est


utilizando, el siguiente paso consiste en encontrar aquellos factores de
entrada que realmente influyen sobre el proceso de clasificacin a un
modelo y/o de deteccin de errores, as como los niveles de los mismos
que propician un mayor porcentaje de xito en la clasificacin.

Es fcil suponer que lo que interesa en el primer caso es poder determinar


si una naranja est sana, o bien tiene una determinada enfermedad; y de
manera anloga si una pieza de cermica es de un modelo determinado, o
bien a qu modelo pertenece. Esto se pretende llevar a cabo con la
mxima precisin y en el menor tiempo posible.

Se ha visto tambin a lo largo de los captulos anteriores que existe una


gran cantidad de actuaciones posibles a realizar sobre las imgenes a la
hora de estudiar su textura, de comprimirlas, de utilizar diversos modelos
(2-way o 3-way), etc.

Con el objeto de determinar, para cada tipo de problema (naranjas o


cermicas) y para cada enfoque utilizado (Ajuste a un modelo, SIMCA o
PLS-DA), los niveles y/o variantes de los diversos factores de entrada
utilizados que maximizan los niveles de acierto en la prediccin por parte
de los distintos modelos (2-way y 3-way), obtenidos siempre mediante
validacin cruzada, se llevaron a cabo seis diseos de experimentos: tres
sobre las imgenes procedentes de naranjas y otros tres sobre las
procedentes de cermicas.

De esta manera se presenta una metodologa que permite, en funcin del


problema que se est estudiando, obtener de manera eficiente los mejores
modelos posibles para el objetivo que se est persiguiendo.

Los factores de entrada estudiados que potencialmente pueden llevar a


que los modelos obtenidos y los enfoques aplicados sean ms o menos
potentes a la hora de clasificar las nuevas imgenes son los siguientes:

156
Captulo 4. MIA y SPC___________________________________________________

a) Tamao de la ventana (sugerido por Bharati y MacGregor


(2000)), para intentar conocer cul es el tamao idneo para cada
tipo de defecto o caracterstica, si es que dicho factor influye
sobre la potencia de los mtodos, y tal vez sobre la capacidad para
distinguir los distintos defectos, en funcin de la naturaleza de
cada uno de ellos. Esto ya ha sido expuesto anteriormente por
Haralick et al. (1973) y Albregsten (1995), quienes sugieren que
las ventanas de menor amplitud de vecindad van dirigidas a la
deteccin de defectos pequeos, mientras que las ventanas de
mayor tamao diferencian mejor texturas definidas de una manera
ms clara. En concreto, se han estudiado tres amplitudes de
ventana, correspondientes a los pxeles inmediatamente vecinos al
que constituye la muestra, la ventana que incluye a los situados
hasta una distancia de dos pxeles, y la formada por los situados
hasta una distancia de tres pxeles, y que van ligadas a las texturas
presentes en las imgenes. Con el fin de poder determinar el
tamao ptimo de la ventana que proporciona un mayor
porcentaje de acierto en la clasificacin, se ha desarrollado un
cdigo propio que permite ampliar a voluntad el amplitud de
dicha ventana de vecindad, sin tener que limitarse a los pxeles
inmediatamente vecinos a uno dado.

b) N patrones de un mismo tipo de defecto, lo cual es equivalente a


aumentar el tamao de la muestra poblacional, al aumentar el
nmero de pxeles (de distintas imgenes adems) que se asocian
a un determinado tipo de caracterstica o defecto. En este caso se
ha estudiado un patrn o tres patrones.

c) Metodologa 2-way o 3-way, es decir, utilizar PCA o Tucker3, en


el caso de los enfoques de Ajuste a un modelo y SIMCA, o bien
utilizar PLS-DA o N-PLS con un enfoque tambin discriminante.

d) Centrado: emplear un centrado previo de la imagen (de cada


canal) respecto de s misma, antes de pasar al preprocesado de la
imagen respecto de cada uno de los modelos. Se trata de una
metodologa empleada en el anlisis de imgenes, consistente en,
antes de llevar a cabo cualquier estudio sobre una imagen,
eliminar los valores medios de los canales de Rojo, Verde y Azul
de cada imagen.

157
SPC mediante MIA____________________________________________________

e) Estandarizado: preprocesar o no la imagen (estandarizado o no de


la imagen respecto de cada modelo, es decir, eliminar el valor
medio de cada columna de la estructura de datos resultante para
cada banda de color y direccin espacial, y dividir por la
desviacin tpica de la imagen patrn).

f) Tipo de wavelet utilizado, DWT o WPT, pues esto tambin puede


influir sobre la compresin llevada a cabo.

g) Nivel de compresin. Al emplear las wavelets como mtodo de


compresin y de eliminacin de ruido, se pueden utilizar diversos
niveles de compresin. El objetivo en este caso es determinar
hasta qu nivel de compresin se puede llegar, sin perder
capacidad de acierto en la clasificacin. Se han estudiado en este
caso tres niveles, correspondientes a uno, dos y tres niveles de
compresin.

h) Tipo de patrn: estudiar distintos tipos de patrn o modelo (tipo


de defecto o enfermedad), ya que es muy probable que cada
defecto quede caracterizado mejor por unos niveles de
compresin, un tipo de preprocesado y, sobre todo, por la
amplitud de la ventana que mejor defina sus caractersticas
(textura asociada a cada defecto, caracterstica o enfermedad). En
el caso de las naranjas, las enfermedades utilizadas han sido
colletotrichum vs escaldado, mientras que para las cermicas los
modelos contrastados han sido Porcelnico Negro y Claro.

Las variables de salida elegidas para conocer si los factores de entrada


influyen o no sobre el porcentaje de acierto en la clasificacin de los
mtodos, y poder as conocer cules son las condiciones ptimas de
trabajo para cada uno de ellos, dependen del enfoque utilizado. En el
caso del enfoque de Ajuste a un modelo se ha utilizado el porcentaje de
pxeles que superan los lmites de T2 y SCR. En el caso del SIMCA, se
estudia cul de los tres modelos es ms cercano a la imagen proyectada,
sin superarse los lmites de T2 ni SCR. En el caso de PLS-DA se
determina cul de las predicciones medias para cada categora modelada
presenta un valor ms elevado, cercano a la unidad.

158
Captulo 4. MIA y SPC___________________________________________________

Para ello, y con el objeto de minimizar el nmero de pruebas, se han


realizado tres diseos experimentales ptimos desde el punto de vista de
la D-eficiencia, llegndose a un diseo de 54 pruebas para el enfoque de
Ajuste a un modelo, donde los factores a controlar fueron los ocho ya
comentados, y dos diseos de 41 pruebas cada uno para los enfoques
SIMCA y PLS-DA, con los factores ya comentados, a excepcin del tipo
de patrn, ya implcito en los mismos enfoques, donde se estudian tres
tipos de enfermedades de naranjas o modelos de cermicas directamente.

La razn de haber utilizado un diseo D-ptimo ha sido la de minimizar


el nmero de pruebas, a la vez que se consegua determinar con la
mnima varianza el valor de los coeficientes asociados tanto a los factores
simples como a sus interacciones.

El nmero de pruebas requerido por un diseo factorial completo era de


3226 en el caso del enfoque de Ajuste a un modelo, y de 3225 en el caso
de los enfoques SIMCA y PLS-DA, es decir, de 576 y 288 pruebas,
respectivamente. Este elevado nmero de pruebas permite estudiar
interacciones de orden elevado (orden octavo y sptimo,
respectivamente) las cuales no suelen ser de inters tanto desde el punto
de vista del control del proceso como desde el punto de vista de la
interpretabilidad de los resultados. Adems, dentro del diseo de
experimentos, rara vez aparecen efectos importantes asociados a
interacciones de orden superior a dos.

Por otro lado, los diseos experimentales llevados a cabo empleaban


tiempos muy elevados de computacin (de orden de horas) cuando la
metodologa a emplear era 3-way, durante la fase de validacin cruzada;
a lo cual haba que aadir el hecho de que para cada modelo construido
haba que proyectar un total de 15 imgenes del conjunto de validacin
(test set).

Dado que el objetivo del diseo era fundamentalmente conocer la


significacin estadstica de los factores incluidos en el diseo, tanto a
nivel simple como cuadrtico para los factores de tipo cuantitativo; as
como la significacin de sus interacciones dobles, una opcin muy
interesante era la de utilizar un diseo experimental que, como ya se ha
comentado, redujese al mximo el nmero de pruebas a la vez que
permitiese conocer con la mxima precisin posible la significacin

159
SPC mediante MIA____________________________________________________

estadstica de los factores estudiados, para el nmero de pruebas


empleado.

La teora del diseo ptimo de experimentos permite hallar este tipo de


diseos experimentales, manteniendo adems un mnimo grado de
colinealidad en los efectos de los factores. Un diseo ideal, de manera
simultnea, minimizara la varianza generalizada de las estimaciones del
modelo, y minimizara la varianza de prediccin en la regin. Estas
propiedades deseables dan lugar a los criterios de D-optimalidad y G-
optimalidad (Atkinson y Donev, 1992).

Dado que en la prctica los diseos no son continuos, sino exactos, los
criterios de optimalidad derivan en los de D-eficiencia y G-eficiencia,
respectivamente, los cuales llevan a diseos que no son los mejores
posibles, pero que se aproximan ms o menos en funcin del ratio de
eficiencia definido. En este sentido, los diseos llevados a cabo en esta
tesis han sido creados en base a un criterio de D-eficiencia del 90%, por
considerar que este valor es un buen nivel de informacin.

Se ha elegido como criterio la D-eficiencia y no la G-eficiencia porque,


ms que minimizar la varianza de la prediccin final de los porcentajes
de acierto, lo que se ha pretendido es minimizar la varianza de las
estimaciones de los coeficientes del modelo, con el objeto de garantizar
con la mxima fiabilidad posible las conclusiones obtenidas en cuanto a
la significacin de los factores de entrada incluidos en el diseo, as
como sus interacciones.

A la hora de elegir el modelo, dado que la presente tesis pretende estudiar


interacciones, y que la prctica indica que interacciones de orden superior
a dos rara vez resultan estadsticamente significativas, se han elegido dos
modelos de segundo orden, el primero de los cuales ha estado formado
por tres factores cuantitativos, dos a tres niveles y uno a dos niveles; y
otros cinco factores cualitativos de dos variantes cada uno de ellos.

Si se definen los factores de entrada como:

X1 = Nivel de compresin
X2 = Tamao de la ventana (en nmero de pxeles)
X3 = Tipo de patrn

160
Captulo 4. MIA y SPC___________________________________________________

X4 = Nmero de patrones
X5 = Metodologa
X6 = Centrado previo de los canales de color
X7 = Estandarizado
X8 = Tipo de wavelet utilizado

El modelo queda de la siguiente manera:

E(Y) = 0 + 1X1 + 2X2 + 3X3 + 4X4 + 5X5 + 6X6 + 7X7 + 8X8 +


9X1X2 + 10X1X3 + 11X1X4 + 12X1X5 + 13X1X6 + 14X1X7 + 15X1X8 +
16X2X3 + 17X2X4 + 18X2X5 + 19X2X6 + 20X2X7 + 21X2X8 + 22X3X4
+ 23X3X5 + 24X3X6 + 25X3X7 + 26X3X8 + 27X4X5 +28X4X6 + 29X4X7
+ 30X4X8 + 31X5X6 + 32X5X7 + 33X5X8 + 34X6X7 + 35X6X8 +
36X7X8 + 38X12 + 39X22

El segundo modelo utilizado es muy similar al primero, con la nica


diferencia del empleo de un factor menos de tipo cualitativo,
correspondiente al Tipo de patrn, X3. El modelo queda entonces de la
siguiente manera:

E(Y) = 0 + 1X1 + 2X2 + 3X4 + 4X5 + 5X6 + 6X7 + 7X8 + 8X1X2 +


9X1X4 + 10X1X5 + 11X1X6 + 12X1X7 + 13X1X8 + 14X2X4 + 15X2X5 +
16X2X6 + 17X2X7 + 18X2X8 + 19X4X5 + 20X4X6 + 21X4X7 + 22X4X8
+ 23X5X6 +24X5X7 + 25X5X8 + 26X6X7 + 27X6X8 + 28X7X8 + 29X12
+ 30X22

La obtencin del diseo ptimo continuo se ha conseguido por medio de


la comparacin de la D-eficiencia con la G-eficiencia, a partir del
Teorema de la Equivalencia. En el caso del diseo ptimo para ocho
variables ha constado de 54 pruebas, y ha tenido una D-eficiencia del
91% aproximadamente, y una G-eficiencia aproximada del 49,7%. En el
caso del diseo ptimo para siete variables ha constado de 41 pruebas, y
ha tenido una D-eficiencia del 92,5% aproximadamente, y una G-
eficiencia aproximada del 51,1%.

Una vez planteados los niveles y variantes de cada una de las pruebas, se
llevaron a cabo las mismas, recogindose los resultados correspondientes
a las diversas variables de salida.

161
SPC mediante MIA____________________________________________________

Para la realizacin de las pruebas, se han utilizado dos conjuntos de


imgenes: uno de entrenamiento (training sets) y otro de validacin (test
sets), indicados en la Tabla 4.7.
Tabla 4.7. Imgenes de los conjuntos de entrenamiento y validacin para las naranjas y
las cermicas. Tipo A corresponde a escaldado, B a colletotrichum y C a podrido en el
caso de las naranjas, mientras que para las cermicas dichos tipos se corresponden con
las referencias Porcelnico Negro, Claro y Sydney, respectivamente.

NARANJAS CERMICAS
Entrenamiento Validacin Entrenamiento Validacin
Tipo N Tipo N Tipo N Tipo N
A 3 A 4 A 3 A 5
B 3 B 4 B 3 B 5
C 3 C 1 C 3 C 5
D-I 1

Las imgenes de tipo A, B y C de los conjuntos de entrenamiento son


diferentes a aqullas utilizadas para la creacin de los conjuntos de
validacin. Adems, en el conjunto de validacin en el caso de las
naranjas, se han incluido seis nuevos tipos de enfermedades, codificadas
como tipos D a I.

Una vez seleccionados los conjuntos de entrenamiento, se construy un


modelo mediante validacin cruzada para cada una de las condiciones
experimentales determinadas por la matriz del diseo ptimo,
proyectando a continuacin las 15 imgenes del conjunto de validacin
sobre cada uno de los modelos, y recogiendo para cada una de las
imgenes el acierto o fallo en la clasificacin alcanzado por cada modelo
al trabajar en cada una de las condiciones experimentales
correspondientes: 54 en el caso del enfoque de Ajuste a un modelo, o 41
en el caso de los enfoques SIMCA o PLS-DA pruebas realizadas, tanto
para las naranjas como para las cermicas.

La variable respuesta, porcentaje de acierto en la clasificacin en cada


condicin experimental (tipo de modelo creado), se obtuvo siguiendo
procedimientos ligeramente distintos para cada uno de los diferentes
enfoques. Para el enfoque de Ajuste a un modelo, se recogieron dos
variables respuesta: una para el estadstico T2 y otra para el estadstico

162
Captulo 4. MIA y SPC___________________________________________________

SCR, de manera independiente. Se decidi que cada uno de estos


estadsticos acertaba en la clasificacin cuando la clase de la imagen
proyectada se corresponda con la clase de la imagen (o imgenes)
utilizada para la creacin del modelo y el porcentaje de pxeles por
encima de los lmites de control del estadstico correspondiente (T2 o
SCR) no exceda el porcentaje mximo permitido para cada uno de ellos;
o cuando la imagen proyectada no perteneca a la misma clase que la
utilizada para la creacin del modelo, y el porcentaje de pxeles por
encima de los lmites de control exceda los mximos permitidos.

Para el enfoque SIMCA se utiliz la misma filosofa. Se registraron los


valores de los estadsticos T2 y SCR para las imgenes proyectadas y se
calcularon los porcentajes de pxeles por encima de los lmites de control.
El enfoque acert, para cada estadstico, si la nueva imagen presentaba el
mnimo porcentaje de pxeles por encima de los lmites de confianza para
el modelo al que perteneca (siempre que estuviese por debajo del
porcentaje mximo pre-establecido); o si todos los modelos presentaban
porcentajes de pxeles por encima de los lmites de confianza superiores a
los pre-establecidos para los estadsticos, en el caso en que la imagen no
se correspondiese con ninguna de las clases modelizadas.

Estos porcentajes mximos de pxeles por encima de lmites se


obtuvieron de las imgenes del conjunto de entrenamiento (training set)
como el porcentaje de pxeles por encima del lmite de control al 95%
para T2 y SCR, para cada una de las condiciones experimentales
ensayadas (tratamientos).

Finalmente, para el enfoque PLS-DA slo se registr una variable


respuesta, obtenida promediando la prediccin para todos los pxeles de
la nueva imagen correspondientes a cada una de las clases estudiadas y
clasificando la nueva imagen a partir del mximo valor promediado, ms
prximo a uno. Con el fin de controlar la adecuacin al modelo de las
imgenes proyectadas, se registr asimismo el mximo porcentaje de
pxeles por encima del lmite de control al 95% para el estadstico SCR
para cada tratamiento. De esta manera, cualquier imagen que no
estuviese contemplada en el modelo PLS-DA podra ser rechazada,
aplicando la misma metodologa expuesta en los prrafos anteriores. Para
dicho enfoque, por tanto, se han realizado modelos basados tanto en la
utilizacin de dicho estadstico como en la no utilizacin del mismo, con

163
SPC mediante MIA____________________________________________________

las restricciones asociadas que ello implica, y que se comentan en el


apartado de resultados.

Como ya se ha comentado, para cada uno de los modelos construidos a


partir de cada condicin experimental (tratamiento), se proyectaron 15
imgenes del conjunto de validacin (test set). De esta manera, el
porcentaje de acierto p en la clasificacin se estableci como el nmero
de aciertos dividido por 15.

Cuando se tiene este tipo de variable respuesta, la manera adecuada de


estudiar el efecto de una serie de variables explicativas Xi es emplear
modelos de regresin logstica (Christensen, 1997), en los que se aplica
la transformacin logit a la variable respuesta, log[p/(1-p)], expresndose
el modelo como:

log[ p (1 p )] = 0 + i X i (4.13)

Por medio de esta transformacin, se eliminan las discontinuidades en 0


y 1, que pueden provocar problemas de estimacin y de interpretacin, ya
que un pequeo incremento en el vector de valores de entrada produce en
los extremos un salto muy grande. As, mediante esta transformacin, la
evolucin en el intervalo [0,1], expresada en la Figura 4.39, queda
suavizada tal como se muestra en la Figura 4.40.

1 1

0.9 0.9

0.8 0.8

0.7 0.7

0.6 0.6

0.5 0.5

0.4 0.4

0.3 0.3

0.2 0.2

0.1 0.1

0 0
0 100 200 300 400 500 600 700 800 900 1000 -8 -6 -4 -2 0 2 4 6 8

Figura 4.39. Evolucin de p Figura 4.40 Evolucin de log[p/(1-p)]

El modelo de regresin logstica tambin puede expresarse de forma


alternativa como:

164
Captulo 4. MIA y SPC___________________________________________________

e
0 + i X i
p = E( Y / X ) = (4.14)
1+ e
0 + i X i

donde la expresin 0 + i X i se denomina alfa.

A partir de la ecuacin (4.13) se deduce que, considerando constante los


valores para el resto de las variables explicativas:

Si Xi es una variable continua, un valor positivo para el


coeficiente i indica que a medida que Xi toma valores mayores,
la probabilidad de clasificacin correcta p tambin aumenta;
mientras que si i es negativo, la interpretacin es la contraria.

Si Xi es una variable dummy asociada a una de las categoras de


una variable tipo cualitativo, un valor positivo de i indica que la
probabilidad de clasificacin correcta es mayor en esa categora
que en el promedio de todas las categoras de la variable
cualitativa. Un valor negativo de i indica justo lo contrario.

Dada la complejidad de los modelos ajustados y la existencia de un cierto


grado de colinealidad en los regresores, el ajuste de los modelos se ha
realizado mediante tcnicas stepwise en su versin forward y backward,
que aaden o eliminan trminos al modelo hasta que se consigue el mejor
ajuste segn el criterio estadstico elegido.

El mtodo de forward selection, o de seleccin en avance, consiste en, a


partir de un modelo inicial, ir incorporando el trmino cuya significacin
estadstica es mayor mientras el nivel de significacin es inferior a un
riesgo de primera especie determinado, el cual suele oscilar entre el 5 y el
10%. Es decir, que se parte de un modelo, y se le aaden todos los
posibles trminos, pero de uno en uno, y se estudia cul de ellos aporta
un mayor grado de informacin, cul de ellos es ms significativo. Ser
entonces este trmino el que pase a formar parte del modelo, y a partir de
aqu se repite el proceso, pero considerando como modelo inicial el que
incluye el nuevo trmino. Este proceso contina hasta que ningn nuevo
trmino tiene un nivel de significacin por debajo del riesgo de primera
especie elegido, por lo que no se incorpora al modelo.

165
SPC mediante MIA____________________________________________________

Por su parte, el mtodo de backward elimination, o de eliminacin hacia


atrs, consiste en la creacin de un modelo que contiene todos los
factores posibles (simples e interacciones), a partir del cual se estudia
eliminar uno a uno cada uno de los trminos del modelo, y se decide
eliminar aqul que tiene un menor grado de significacin estadstica
(mayor p-value), siempre que supere un determinado riesgo de primera
especie. Es decir, se estudia cul de los factores influye menos sobre el
modelo en caso de ser eliminado, y se elimina siempre que su p-value sea
superior al riego de primera especie establecido. Este proceso se repite
hasta que el nivel de significacin estadstica de todos los trminos del
modelo es en todos los casos inferior al riesgo de primera especie,
quedando por tanto el modelo que se est estudiando en ese momento
como definitivo.

Cuando se utilizan los mtodos de seleccin comentados anteriormente,


no necesariamente se obtienen los mismos modelos finales. Recordando
la frase del profesor G.E.P. Box todos los modelos son falsos, pero
algunos son tiles, en esta tesis se ha evaluado la simplicidad
(parsimonia) e interpretabilidad de los modelos ajustados por cada
mtodo de seleccin, eligiendo en general los modelos obtenidos
mediante el procedimiento forward selection.

A partir de la ecuacin 4.13, una vez ajustados los modelos y obtenidas


las estimaciones de los coeficientes bs, es posible predecir, para unos
ciertos valores de las variables de entrada, el porcentaje de acierto en la
^
clasificacin p mediante la ecuacin:

^ e
b0 + bi X i
p= (4.15)
1+ e
b0 + bi X i

Los diseos realizados, as como los modelos derivados de los mismos,


se han llevado a cabo de manera separada para las naranjas y para los
azulejos. En el siguiente apartado se presentan, para cada uno de los
enfoques, los resultados obtenidos. El programa estadstico utilizado ha
sido Statgraphics vr 5.1.

166
Captulo 4. MIA y SPC___________________________________________________

3.3 Resultados

3.3.1 Estrategia de integracin de la informacin espectro-textural

La Tabla 4.8 muestra los resultados finales con las expresiones


correspondientes de alfa para cada uno de los problemas analizados
(naranjas o cermicas), en cada uno de los enfoques aplicados. Alfa est
formada por los factores e interacciones estadsticamente significativos
(p-valor < 0,05) as como por sus correspondientes coeficientes. La
capacidad predictiva de los modelos ha sido calculada a partir del
porcentaje de la devianza ajustada, que es un estadstico similar al R2
utilizado en los modelos clsicos de regresin.
Tabla 4.8. Expresiones de alfa para cada problema analizado, y para cada enfoque
aplicado. Alfa est formada por los factores estadsticamente significativos (p-valor <
0,05) y sus correspondientes coeficientes.
Capacidad
predictiva del
Problema Enfoque Alfa
modelo
(p-valor)
0,385995 1,26664X3 + 1,29937X5 + 55,55%
Ajuste a T2
0,226213X1X3 (0,0000)
un
-1,0116 + 0,975553X5 + 1,27986X7 - 70,63%
modelo SCR
1,19575X5X7 (0,0000)
NARANJAS

-1,17695 -1,18823X4 + 0,889437X6 + 60,97%


T2
0,642882X5X7 + 0,518222X6X8 (0,0000)
SIMCA
-1,81607 + 0,970413X5 + 27,81%
SCR
0,233282X1X7 (0,0000)
Lmite -0,40135 - 0,00985526X2X5 - 40,98%
SCR 0,71382X4X5 (0,0001)
PLS-DA Sin 64,51%
0,996149 + 0,463814X1 -
lmite
1,65626X4X6 -1,0232X4X7 (0,0000)
SCR
74%
T2 1,37148 -2,38308X3 + 2,3979X3X6
(0,0000)
Ajuste a
0,215736 -0,316436X1 -0,815983X3 +
un
0,927073X4 + 1,6842X7 + 61,59%
modelo SCR
0,0151943X2X5 + 0,570167X3X6 - (0,0000)
1,39662X3X7 -1,17487X5X7
CERMICAS

-1,77492 + 1,0143X6 + 58,82%


T2
0,00875293X1X2 (0,0000)
-0,649276 + 2,90141X6 - 1,32523X7
SIMCA
-0,937957X1X5 + 0,0268293X2X6 - 78,70%
SCR
1,18353X4X7 - 2,24614X5X6 + (0,0000)
1,6008X5X7 -1,53804X6X7
Lmite -18,6924 + 16,8314X5 + 1,75592X6 + 84,42%
SCR 0,714401X4X8 (0,0000)
PLS-DA Sin 0,0148846 + 18,0789X6 -
89,80%
lmite 0,536666X1X4 - 0,0339836X2X6
(0,0000)
SCR 14,4544X6X7
167
SPC mediante MIA____________________________________________________

La Tabla 4.9 presenta las condiciones operativas de trabajo para los


factores estadsticamente significativos, derivados a partir de las
expresiones de alfa de la Tabla 4.8, con el fin de maximizar el porcentaje
de acierto en la clasificacin para cada uno de los enfoques aplicados
tanto a las naranjas como a las cermicas. Estas condiciones operativas
han sido elegidas con el fin de satisfacer de manera simultnea la
maximizacin del xito en la clasificacin por parte de los estadsticos T2
y SCR.

Tabla 4.9. Condiciones operativas propuestas para los factores estadsticamente


significativos.

Ajuste a un modelo SIMCA PLS-DA

A B Lmite SCR Sin lmite SCR

Nivel de Nivel de Nivel de


compresin compresin compresin
NARANJAS

elevado elevado elevado

Tres imgenes Tres imgenes Tres imgenes Tres imgenes


patrn patrn patrn patrn
Modelo 2-way Modelo 2-way Modelo 2-way Modelo 2-way
No centrado No centrado No centrado
previo previo previo
No pre-procesado No pre-procesado No pre-procesado
DWT

A B Lmite SCR Sin lmite SCR

Nivel de
Nivel de Nivel de
compresin
compresin bajo compresin bajo
CERMICAS

elevado
Tamao grande de Tamao grande de Tamao grande de Tamao pequeo
la ventana la ventana la ventana de la ventana
Tres imgenes Una imagen patrn Tres imgenes
patrn patrn
Modelo 2-way Modelo 2-way Modelo 3-way Modelo 3-way
No centrado No centrado No centrado previo No centrado
previo previo previo
No pre-procesado No pre-procesado No pre-procesado No pre-procesado
DWT

A partir de la Tabla 4.9 se pueden observar algunos resultados


interesantes. En primer lugar, y como aspecto primordial, se deduce que
la optimizacin de esta variable respuesta es dependiente del problema
estudiado, no slo en cuanto al tipo de imagen, sino tambin del enfoque

168
Captulo 4. MIA y SPC___________________________________________________

aplicado. De todas formas, para los casos analizados, parece razonable en


general utilizar tres imgenes como patrn y no llevar a cabo un centrado
de los canales de color previo a la construccin de los modelos. En el
caso particular de los enfoques SIMCA y PLS-DA, se podra recomendar
un elevado nivel de compresin, mientras que en el caso de Ajuste a un
modelo parece conveniente la utilizacin de modelos 2-way.

En 6 de los 10 anlisis la metodologa preferida ha sido la 2-way,


mientras que slo en dos casos un modelo 3-way ha sido una mejor
opcin. Para los dos casos restantes, ninguna de las dos metodologas ha
sido preferida frente a la otra. Este resultado indica que no siempre un
modelo N-way es una mejor opcin que un modelo 2-way. El tamao de
la ventana de vecindad tambin depende del problema estudiado.

En cualquier caso, el centrado previo de los canales de color y el pre-


procesado parecen ser los factores ms importantes, ya que aparecen
como significativos en la mayora de los resultados con un elevado valor
de sus coeficientes en las expresiones de alfa. Esto refuerza la idea de la
importancia de un buen tratamiento preliminar de los datos con el fin de
obtener buenos resultados en cualquier tipo de estudio.
Tabla 4.10. Imgenes de los conjuntos de evaluacin para las naranjas y para las
cermicas.
NARANJAS CERMICAS
Evaluacin Evaluacin Evaluacin Evaluacin
Tipo N Tipo N Tipo N Tipo N
A 6 F 5 K 4 A 24
B 4 G 5 L 5 B 24
C 5 H 5 M 12 C 24
D 3 I 5
E 3 J 5

Con el fin de evaluar la eficacia de las condiciones operativas propuestas


mostradas en la Tabla 4.9, se construyeron dos conjuntos de evaluacin
(validation) (uno para las naranjas y otro para las cermicas) con
imgenes diferentes a las utilizadas en la construccin de los conjunto de
entrenamiento (training) y validacin (test), y se proyectaron sobre los
modelos construidos. Dichos conjuntos de evaluacin (validation)
aparecen en la Tabla 4.10. Los resultados correspondientes se muestran

169
SPC mediante MIA____________________________________________________

en la Tabla 4.11 para el caso de las naranjas y en la Tabla 4.12 para el


caso de las cermicas.

Es necesario hacer una serie de comentarios con el fin de facilitar una


adecuada comprensin de estas tablas. En primer lugar, cuando se aplica
el enfoque de Ajuste a un modelo, el hecho de disponer nicamente de 6
imgenes de tipo A y 4 de tipo B (que fueron los tipos de imgenes
utilizados para construir los modelos) provoc que la eficacia de los
modelos construidos estuviese influenciada por el porcentaje de acierto
en el rechazo de las imgenes No A (codificadas como A) o de las
imgenes No B (codificadas como B). Por ello, se decidi mostrar dos
tipos distintos de porcentajes de acierto, uno relativo a la aceptacin de
imgenes de tipo A (o tipo B) codificadas como P(A/A) (o P(B/B)); y
otro asociado al rechazo de las imgenes de tipo No A (o No B),
codificadas como P(A/A) (o P (B/B)). Aplicando el Teorema de la
Probabilidad Total, es posible calcular la Probabilidad Global de acierto
como:

P( AciertoGlobal ) = P( X ) P( X / X ) + P( X ) P( X / X ) (4.16)

Asimismo, al aplicar los enfoques SIMCA y PLS-DA aparece un hecho


anlogo, relativo a la proyeccin de los tipos de imgenes utilizados en la
construccin de los modelos (tipos A, B y C), codificado como Caso 1; y
a la proyeccin de tipos de imgenes no utilizados en la construccin de
los modelos (tipos D, E, F, G, H, I, J, K, L, M), codificados como Caso 2.
Las probabilidades correspondientes de acierto en la clasificacin han
sido calculadas a partir de la expresin 4.16.

Para el enfoque SIMCA, se ha intentado mejorar los resultados por medio


de la no utilizacin de los correspondientes lmites para los estadsticos
T2 y SCR, clasificando, por tanto, las imgenes a partir de su mnima
distancia a cada uno de los modelos. Obviamente, este procedimiento
obliga a proyectar nicamente imgenes que pertenezcan a los tipos
utilizados en la construccin de los modelos, convirtiendo as al Caso1
como el nico procedimiento factible. De esta manera, el Caso 2 ha sido
codificado como Incorrecto en este escenario.

170
Captulo 4. MIA y SPC___________________________________________________

Tabla 4.11. Porcentajes de acierto en la clasificacin de los conjuntos de evaluacin


para cada enfoque bajo las condiciones operativas propuestas, para el caso de las
naranjas, al integrar la informacin de tipo espectral y espacial. Caso 1 indica la
proyeccin de imgenes correspondientes a los tipos utilizados en la construccin de los
modelos, mientras que Caso 2 indica la proyeccin de imgenes de tipos no utilizados
en la construccin de los modelos.

Ajuste a un modelo

A B

P(A/A) A/
P( A) P(B/B) B/
P( B)

T2 SCR T2 SCR T2 SCR T2 SCR

83,33% 83,33% 67,21% 34,42% 75% 50% 66,66% 69,84%

Probabilidad Global Probabilidad Global


2 2
T SCR T SCR

68,66% 38,81% 67,16% 68,66%

SIMCA PLS-DA

Caso 1 Caso 2 Caso 1 Caso 2


2 2
T SCR T SCR
0% 100%
53,33% 26,66% 63,46% 44,23%

Probabilidad Global Probabilidad Global

T2 SCR
77,61%
61,19% 40,30%

Caso 1, sin lmites Caso 2, sin lmites Caso 1, sin lmite SCR Caso 2, sin lmite SCR

T2 SCR
Incorrecto 93,33% Incorrecto
66,66% 66,66%

Finalmente, las mismas consideraciones, codificacin y clculos han sido


aplicadas al enfoque PLS-DA. Para el caso de las cermicas (Tabla 4.12),
la nica opcin posible fue la constituida por el Caso 1, ya que el
conjunto de evaluacin (validation) dispona slo de imgenes tipo A, B
y C. De esta manera, el Caso 2 ha sido codificado como No disponible.

A partir de la Tabla 4.11, las conclusiones ms importantes son, por una


parte, los resultados similares proporcionados por los enfoques de Ajuste
a un modelo y SIMCA, como se puede observar en las correspondientes

171
SPC mediante MIA____________________________________________________

probabilidades globales, principalmente para el estadstico T2, con


porcentajes de acierto en la clasificacin entre el 61,19% y el 68,66%; y
por otro lado, el comportamiento diferente del enfoque PLS-DA, el cual
muestra resultados completamente diferentes, no slo con respecto a los
enfoques anteriores, sino tambin en cuanto a los Casos 1 y 2.

Para el enfoque de Ajuste a un modelo, el estadstico SCR se comporta de


manera diferente para las imgenes de tipo A y B, al comparar P(A/A) y
P(A/A) frente a P(B/B) y P(B/B). Adems, el estadstico T2
consigue mejores resultados, siendo algo ms efectivo en la aceptacin
de imgenes de tipo A o B (porcentajes de acierto del 83,33% y 75%,
respectivamente) que en el rechazo de imgenes de tipo No A o No B
(con porcentajes de acierto del 67,21% y 66,66%, respectivamente.

Para el enfoque SIMCA, ambos estadsticos T2 y SCR muestran una


tendencia a ser ms efectivos en el rechazo de imgenes de tipos no
utilizados en la construccin de los modelos (imgenes Caso 2), ya que
los porcentajes de acierto son consistentemente ms elevados para este
Caso. El procedimiento de proyectar slo aquellas imgenes
pertenecientes a los tipos utilizados en la construccin de los modelos,
recogida por la celda Caso 1, sin lmites, mejora los resultados de Caso 1
y tambin los resultados de probabilidad global. Este procedimiento es
equivalente a modelizar todos los tipos posibles de imgenes a proyectar,
y entonces aplicar el enfoque SIMCA, lo cual es una posibilidad factible
en procesos de produccin, ya que todos los tipos fabricados son
conocidos a priori y pueden ser modelizados e introducidos en el SIMCA
de manera previa a su proyeccin. En este caso, al aplicar este
procedimiento, hay que asegurar que todos los tipos posibles de naranjas
han sido modelizados, con el fin de evitar cualquier clasificacin errnea
asociada a imgenes del Caso 2.

El enfoque PLS-DA es el que muestra los mejores resultados globales,


aunque con grandes diferencias segn los casos. Cuando se utiliza el
lmite de SCR con el fin de rechazar aquellas imgenes con un porcentaje
de pxeles por encima del lmite de control al 95% para el estadstico
SCR superior al mximo predefinido a partir de las imgenes utilizadas
en la construccin del modelo, el 77,61% de acierto global es engaoso.
De hecho, al inspeccionar las probabilidades correspondientes al Caso 1

172
Captulo 4. MIA y SPC___________________________________________________

y Caso 2, se puede comprobar cmo el modelo rechaza todas las


imgenes, independientemente del tipo que sean. El hecho de que el
77,61% de las imgenes del conjunto de evaluacin (validation) no
pertenezcan a los tipos utilizados en la construccin de los modelos es lo
que proporciona dicho resultado. En este caso, la aplicacin del
procedimiento consistente en proyectar nicamente aquellas imgenes
previamente incluidas en el modelo y no utilizar el criterio del lmite del
estadstico SCR proporciona resultados completamente diferentes,
llegando al 93,33% de acierto en la clasificacin para el Caso 1, sin
lmite SCR. De todas formas, hay que indicar que para este
procedimiento se construyeron nuevos modelos de regresin, ya que el
modelo general proporcion resultados completamente inaceptables.

La Tabla 4.12 muestra que, para las imgenes de cermicas, aparecen


algunas diferencias entre los distintos enfoques, pero los resultados
parecen ser bastante buenos, espacialmente al aplicar algunas
modificaciones comentadas en los siguientes prrafos.

El enfoque de Ajuste a un modelo no funcion bien para la referencia tipo


A, tal como se puede derivar del los resultados de P(A/A) y P(A/A),
debido a que mostr cierta tendencia al rechazo de nuevas imgenes.
Mediante la inspeccin de los resultados del conjunto de evaluacin
(validation), se comprob que ninguna de las imgenes del tipo A
presentaba un porcentaje de pxeles por encima de los lmites
establecidos superior al 50%, ni para el estadstico T2 ni para el de SCR,
mientras que para los otros dos tipos estos porcentajes fueron siempre del
100%. Mediante esta propuesta, por tanto, es posible modificar, a partir
de los resultados del conjunto de evaluacin existente, los porcentajes de
pxeles que sobrepasan los lmites establecidos para los diferentes
estadsticos, obteniendo buenos modelos de clasificacin.

Si se lleva a cabo la misma accin sobre la referencia de tipo B,


modificando el porcentaje mximo de pxeles por encima de lmites del
9,96% al 20% para T2, se puede observar cmo los resultados mejoran
claramente los previos, llegando al 100% de acierto en la clasificacin
para el estadstico T2. Para el estadstico SCR, no fue posible realizar
ninguna accin efectiva, debido a que los porcentajes de pxeles por

173
SPC mediante MIA____________________________________________________

encima de los lmites para SCR eran similares para las imgenes de los
tipos B y No B.

Tabla 4.12. Porcentajes de acierto en la clasificacin de los conjuntos de evaluacin


para cada enfoque bajo las condiciones operativas propuestas, para el caso de las
cermicas, al integrar la informacin de tipo espectral y espacial. Caso 1 indica la
proyeccin de imgenes correspondientes a los tipos utilizados en la construccin de los
modelos, mientras que Caso 2 indica la proyeccin de imgenes de tipos no utilizados
en la construccin de los modelos.

Ajuste a un modelo

A B

P(A/A) A/
P( A) P(B/B) B/
P( B)

T2 SCR T2 SCR T2 SCR T2 SCR

54,17% 29,17% 100% 100% 66,67% 100% 100% 39,58%

Probabilidad Global Probabilidad Global


2 2
T SCR T SCR

84,72% 76,39% 88,89% 59,72%

P(A/A) , modificado A/
P( A), modificado P(B/B), modificado B/
P( B), modificado
2 2 2
T SCR T SCR T SCR T2 SCR

100% 100% 100% 100% 100% 100% 100% 39,58%

Probabilidad Global Probabilidad Global


2 2
T SCR T SCR

100% 100% 100% 59,72%

SIMCA PLS-DA

Caso 1 Caso 2 Caso 1 Caso 2

T2 SCR
No disponible 79,17% No disponible
69,72% 94,44%

Caso 1, sin lmites Caso 2, sin lmites Caso 1, sin lmite SCR Caso 2, sin lmite SCR

T2 SCR
Incorrecto 100% Incorrecto
94,44% 94,44%

174
Captulo 4. MIA y SPC___________________________________________________

Para el enfoque SIMCA, a pesar de que los resultados son bastante


buenos para el estadstico SCR, se pueden mejorar para el estadstico T2
si no se tienen en cuenta sus lmites a la hora de clasificar las referencias
de cermicas, llegando hasta un porcentaje de acierto del 94,44%. Como
estas referencias estn ligadas a un proceso de produccin, parece
razonable actuar de esta manera, ya que ninguna referencia de cermica
ser proyectada si no ha sido creada previamente, de manera que siempre
ser posible incorporarla al enfoque SIMCA.

Finalmente, el enfoque PLS-DA proporciona resultados similares en la


clasificacin cuando se compara los resultados promediados del enfoque
SIMCA (1/2(69,72%+94,44%)=82,08% aprox.). Tambin en esta
ocasin se cre un nuevo modelo de regresin logstica, como en el caso
de las naranjas, sin utilizar el criterio del lmite del estadstico SCR. De
esta manera, slo pueden ser proyectadas referencias de los tipos
utilizados en la construccin de los modelos, y las mismas
consideraciones comentadas para el enfoque SIMCA deben tenerse en
cuenta. Los resultados obtenidos llegan al 100% de acierto en la
clasificacin, que es el mejor resultado conseguido por parte de los tres
enfoques aplicados.

3.3.2 Estrategia MIA tradicional

Una vez estudiados los buenos resultados en la clasificacin obtenidos


mediante de la integracin de la informacin de tipo espacial y espectral
para el anlisis de imgenes, en este apartado se va a aplicar la estrategia
MIA tradicional, analizando nicamente la informacin de carcter
espectral, relativa a los canales RGB, con objeto de comparar los
resultados con los obtenidos en la estrategia espectro-textural. Al igual
que en el punto anterior, se realizaron varios diseos experimentales
ptimos, pero excluyendo el factor relativo al tamao de la ventana
(asociado a la informacin de tipo espacial) y el factor relativo a la
metodologa, ya que en este caso slo es posible utilizar modelos 2-way
para el anlisis de los datos.

175
SPC mediante MIA____________________________________________________

Tabla 4.13. Expresiones de alfa para cada problema analizado, y para cada enfoque
aplicado, al emplear slo la informacin de carcter espectral, con los factores
estadsticamente significativos (p-valor < 0.05) y sus correspondientes coeficientes.

Capacidad
predictiva del
Enfoque Alfa
modelo
(p-valor)
-0,896912 + 1,55193X6 +
0,374967X1X4 +
64,17%
T2 1,11023X4X3
Ajuste a un (0,0000)
0,636455X4X8
modelo
1,25043X3X6
NARANJAS

0,106542 + 0,595469X6 + 31,15%


SCR
0,28683X1X4 (0,0003)
T2
-0,619039 - 2,32535X4 + 54,53%
2,06514X4X6 (0,0000)
SIMCA
SCR -0,807915 + 0,554722X6
2,66%
(0,0337)
46,85%
PLS-DA, sin lmite
1,3633 1,40776X4X6
SCR (0,0002)
0,64625 -0,387882X1X3 + 31,73%
Ajuste a T2
1,09273X3X6 (0,0001)
un
CERMICAS

modelo 0,739667 -0,552456X4 + 8,86%


SCR
0,941254X4X6 (0,0175)
-0,285007 -0,792019X1 60,61%
T2
0,697718X1X6 (0,0000)
SIMCA
-1,67068 + 2,99542X6 - 63,65%
SCR
0,964291X1X6 (0,0000)
PLS-DA, sin lmite 95,06%
-0,730882 + 18,2152X6
SCR (0,0000)

El objeto de este apartado no es encontrar las condiciones ptimas de


trabajo al aplicar la estrategia MIA, sino estudiar el beneficio marginal en
el xito en la clasificacin al aadir la informacin de carcter espacial a
los modelos. Teniendo este comentario en cuenta, la Tabla 4.13 muestra
las expresiones de alfa para cada problema analizado, y para cada
enfoque aplicado, de manera anloga a la Tabla 4.8, al utilizar slo la
informacin de carcter espectral.

La Tabla 4.14 presenta las condiciones operativas de trabajo para los


factores estadsticamente significativos, derivados a partir de las
expresiones de alfa de la Tabla 4.13, con el fin de maximizar el

176
Captulo 4. MIA y SPC___________________________________________________

porcentaje de acierto en la clasificacin para cada uno de los enfoques


aplicados tanto a las naranjas como a las cermicas. De nuevo, estas
condiciones operativas han sido elegidas con el fin de satisfacer de
manera simultnea la maximizacin del xito en la clasificacin por parte
de los estadsticos T2 y SCR. Adems, salvo en el caso de las cermicas
con SIMCA y PLS-DA, en el resto se obtienen modelos con capacidad
predictiva inferior a los obtenidos por medio de la integracin de la
informacin espectro-textural, como se puede apreciar en la Tabla 4.8.

Tabla 4.14. Condiciones operativas propuestas para los factores estadsticamente


significativos.

Ajuste a un modelo SIMCA PLS-DA

A B Sin lmites

Nivel de Nivel de
NARANJAS

compresin elevado compresin elevado

Empleo de un solo Empleo de un solo Nmero elevado de Nmero elevado de


patrn patrn patrones patrones

No centrado No centrado No centrado

WPT WPT

A B Sin lmites

Nivel de Nivel de
CERMICAS

compresin bajo compresin bajo

Empleo de un solo Empleo de un solo


patrn patrn

No centrado No centrado No centrado No centrado

Al igual que en la estrategia previa de integracin de la informacin, los


mismos conjuntos de evaluacin (validation) fueron proyectados sobre
los modelos construidos utilizando slo la informacin de carcter
espectral. Los resultados correspondientes se muestran en la Tabla 4.15
para el estudio llevado a cabo sobre las naranjas, y en la Tabla 4.16 para
el estudio sobre las cermicas, a partir de las condiciones de trabajo
mostradas en la Tabla 4.14.

177
SPC mediante MIA____________________________________________________

Tabla 4.15. Porcentajes de acierto en la clasificacin de los conjuntos de evaluacin


para cada enfoque bajo las condiciones operativas propuestas, para el caso de las
naranjas, al utilizar slo la informacin de carcter espectral. Caso 1 indica la
proyeccin de imgenes correspondientes a los tipos utilizados en la construccin de los
modelos, mientras que Caso 2 indica la proyeccin de imgenes de tipos no utilizados
en la construccin de los modelos.

Ajuste a un modelo

A B

P(A/A) A/
P( A) P(B/B) B/
P( B)
2 2 2 2
T SCR T SCR T SCR T SCR

0% 0% 100% 95,08% 0% 0% 98,41% 95,24%

Probabilidad Global Probabilidad Global


2 2
T SCR T SCR

91,04% 86,57% 92,54% 89,55%

SIMCA PLS-DA

Caso 1 Caso 2 Caso 1 Caso 2


2 2
T SCR T SCR
No posible No posible
46,67% 40% 19,23% 63,46%

Probabilidad Global Probabilidad Global


2
T SCR
No posible
25,37% 58,21%

Caso 1, sin lmites Caso 2, sin lmites Caso 1, sin lmite SCR Caso 2, , sin lmite SCR
2
T SCR
Incorrecto 66,66% Incorrecto
66% 60%

Para el enfoque de Ajuste a un modelo, los resultados son muy pobres, ya


que los modelos siempre rechazan las imgenes proyectadas,
independientemente de su pertenencia a los tipos utilizados en la
construccin de los modelos o no. Estos resultados son los mismos tanto
para las enfermedades de tipo A o B, e incluso la propuesta de buscar
porcentajes mximos dentro del conjunto de evaluacin (validation) no
es una opcin vlida, ya que para la enfermedad de tipo A se alcanzan
porcentajes de pxeles por encima de lmites del 100% para el estadstico

178
Captulo 4. MIA y SPC___________________________________________________

T2 y del 99,69% para SCR; y para la enfermedad de tipo B estos


porcentajes han sido del 72,84% y 93,21%. Comparando estos resultados
con los obtenidos en la Tabla 4.11 se concluye que, para el enfoque de
Ajuste a un modelo, la integracin de ambos tipos de informacin,
espectral y espacial, parece ser una buena opcin, ya que los resultados
proporcionados son bastante mejores, especialmente cuando se
inspeccionan las probabilidades condicionales.

Para el enfoque SIMCA, los resultados son bastante similares a los


obtenidos al integrar la informacin de carcter espectral y espacial
mostrados en la Tabla 4.11, teniendo mejores resultados para los
estadsticos T2 o SCR dependiendo del tipo de informacin utilizada
cuando se tienen en cuenta los porcentajes de pxeles por encima de
lmites. En cualquier caso, los resultados son ligeramente mejores para la
integracin de ambos tipos de informacin cuando dichos porcentajes no
se tienen en cuenta (recordando en este caso que cualquier tipo de
naranja debe ser conocida a priori e incluida en el enfoque).

Finalmente, para el enfoque PLS-DA, slo se han podido proyectar


imgenes del mismo tipo a las utilizadas en la construccin del modelo,
ya que no ha sido posible construir un modelo de regresin al considerar
el lmite basado en el estadstico SCR, debido a que cualquier imagen del
conjunto de validacin (test) fue rechazada en todos los tratamientos
posibles. Este hecho ha sido codificado en la Tabla 4.15 como No
Posible. En cualquier caso, a pesar de la nica aplicacin de la versin
restringida de este enfoque al utilizar slo la informacin de carcter
espectral, incluso en este caso la integracin de ambos tipos de
informacin proporciona mejores resultados, como se puede observar en
la Tabla 4.11.

Por tanto, se puede considerar que, de manera general y para el caso de


las naranjas, la integracin de la informacin de carcter espectral y
espacial en una sola estructura de datos ofrece mejores resultados que las
estructuras formadas nicamente por informacin de carcter espectral.

Al analizar los porcentajes de cada enfoque aplicado construido a partir


de la informacin espectral para el caso de las cermicas (Tabla 4.16), los
resultados ms importantes son los siguientes, al compararlos con los de
la Tabla 4.12.

179
SPC mediante MIA____________________________________________________

Tabla 4.16. Porcentajes de acierto en la clasificacin de los conjuntos de evaluacin


para cada enfoque bajo las condiciones operativas propuestas, para el caso de las
cermicas, al utilizar slo la informacin de carcter espectral. Caso 1 indica la
proyeccin de imgenes correspondientes a los tipos utilizados en la construccin de los
modelos, mientras que Caso 2 indica la proyeccin de imgenes de tipos no utilizados
en la construccin de los modelos.

Ajuste a un modelo

A B

P(A/A) A/
P( A) P(B/B) B/
P( B)
2 2 2 2
T SCR T SCR T SCR T SCR

0% 0% 100% 100% 70,83% 54,16% 100% 100%

Probabilidad Global Probabilidad Global

T2 SCR T2 SCR

66,67% 66,67% 90,28% 84,72%

P(A/A) , modificado A/
P( A), modificado P(B/B), modificado B/
P( B), modificado
2 2 2
T SCR T SCR T SCR T2 SCR

100% 100% 100% 100% 100% 100% 100% 100%

Probabilidad Global Probabilidad Global


2 2
T SCR T SCR

100% 100% 100% 100%

SIMCA PLS-DA

Caso 1 Caso 2 Caso 1 Caso 2


2
T SCR
No disponible No posible No disponible
66,66% 30,56%
Caso 1, sin lmite
Caso 1, sin lmites Caso 2, sin lmites Caso 2, sin lmite SCR
SCR
2
T SCR
Incorrecto 100% Incorrecto
100% 100%

El enfoque de Ajuste a un modelo proporciona peores resultados para la


referencia tipo A si se utiliza nicamente informacin espectral y se
tienen en cuenta los lmites originales, en contraste con la integracin de

180
Captulo 4. MIA y SPC___________________________________________________

ambos tipos de informacin. Pero si se modifican los lmites a partir de la


inspeccin del conjunto de evaluacin (validation), cambiando los lmites
del 3,84% al 20% para el estadstico T2 y del 4,87% al 25% para el
estadstico SCR, los porcentajes de acierto en la clasificacin son los
mismos, tal como se muestra en la Tabla 4.16. Para la referencia de tipo
B, modificando los lmites de un 5,34% a un 7% para T2 y de un 7,69% a
un 10% para SCR, de nuevo se consiguen porcentajes de acierto en la
clasificacin del 100%.

Para el enfoque SIMCA, los resultados obtenidos al tener en cuenta los


lmites pre-establecidos son bastante peores que los proporcionados por
la integracin de ambos tipos de informacin, principalmente para el
estadstico SCR. Pero si se eliminan los lmites, se consiguen porcentajes
de acierto del 100% utilizando slo la informacin de carcter espectral,
lo cual puede deberse a las considerables diferencias de color entre las
tres referencias de cermicas. En cualquier caso, la estructura espectro-
textural parece proporcionar modelos ms consistentes desde un punto de
vista terico, ya que se consiguen resultados aceptables sin la necesidad
de eliminar los lmites basados en los estadsticos T2 y SCR.

Finalmente, para el enfoque PLS-DA, slo se ha podido construir la


versin restringida del modelo (sin tener en cuenta el lmite de SCR) ya
que de nuevo todos los tratamientos rechazaron todas las imgenes del
conjunto de validacin (test). Si se asume esta restriccin, todas las
imgenes del conjunto de evaluacin (validation) quedan bien
clasificadas. De todas formas, parece claro que la integracin de ambos
tipos de informacin proporciona unos resultados ms fiables.

As que, de nuevo en el estudio sobre las cermicas, la integracin de


ambos tipos de informacin da un mejor resultado que la utilizacin de la
informacin de carcter espectral exclusivamente.

3.4 Comentarios y conclusiones

En este apartado se ha presentado una metodologa para el diseo


eficiente de procesos de clasificacin automtica basados en el anlisis
de imgenes. De esta manera, se han utilizado imgenes procedentes de

181
SPC mediante MIA____________________________________________________

cmaras RGB para la clasificacin automtica de naranjas con diferentes


enfermedades y cermicas de diferentes referencias.

Como las imgenes RGB disponen nicamente de tres intervalos de


longitudes de onda, es recomendable mejorar y reorganizar estos datos en
una estructura de informacin ms completa. Dicha mejora se ha llevado
a cabo a partir de la propuesta de Bharati y MacGregor (2000),
incorporando la informacin espacial relativa a cada canal de color RGB,
obteniendo as una estructura espectro-textural 3-way, la cual se puede
analizar por medio de modelos 2-way o N-way.

Al intentar analizar estas estructuras 3-way, principalmente por medio de


modelos N-way, aparece un nuevo problema, asociado a la gran cantidad
de datos presentes, lo cual ha hecho imposible llevar a cabo una
validacin cruzada de los modelos a partir de los equipos informticos
disponibles. Por ello, se han utilizado las wavelets como herramientas de
compresin eficiente de los datos.

Se han aplicado tres enfoques de clasificacin con el fin de determinar la


adecuacin de las imgenes a los diferentes tipos utilizados para la
construccin de los modelos: Ajuste a un modelo, SIMCA y PLS-DA. A
partir de cualquiera de estos enfoques se pueden estudiar diferentes
factores a diferentes niveles: nivel de compresin, amplitud o tamao de
la ventana de vecindad, modelos 2-way o 3-way, etc.

Con el fin de encontrar de una manera eficiente aquellos factores


estadsticamente significativos y sus correspondientes condiciones
operativas que maximizan el porcentaje de acierto en la clasificacin, es
conveniente encontrar una herramienta capaz de reducir el nmero de
pruebas, y al mismo tiempo proporcionar estimaciones fiables del
modelo ajustado. La presente tesis propone el uso del diseo D-ptimo,
el cual ha reducido el nmero de pruebas de 576 (3226) a 54 en el caso
del enfoque de Ajuste a un modelo, y de 288 (3225) a 41 en el caso de
los enfoques SIMCA y PLS-DA, al mismo tiempo que es capaz de estimar
el valor de los coeficientes con la mnima varianza para ese nmero de
factores. Los datos resultantes han sido analizados por medio de modelos
de Regresin Logstica, desde la naturaleza de la variable respuesta.

182
Captulo 4. MIA y SPC___________________________________________________

La conclusin ms importante es que la optimizacin del porcentaje de


acierto depende del problema analizado, no slo en trminos de las
imgenes estudiadas, sino tambin en cuanto al enfoque de clasificacin
utilizado. De todas formas, los factores Centrado previo de los canales
de color de las imgenes respecto de sus propios valores medios y el
Pre-procesado de los datos parecen ser los factores ms significativos
desde el punto de vista estadstico en todos los modelos ajustados,
indicando la importancia de estas etapas de tratamiento previo de los
datos.

Para evaluar la eficacia (porcentaje de acierto) de los diferentes modelos,


se han construido dos conjuntos de evaluacin (validation) (uno para
cada problema analizado), y se han proyectado sobre los modelos
construidos bajo las condiciones operativas propuestas para cada enfoque
e imgenes estudiados.

Asimismo, se recomienda que los conjuntos de entrenamiento (training)


y de validacin (test) estn formados por todos los tipos posibles de
imgenes que se puedan considerar en un determinado problema (por
ejemplo, todas las referencias comerciales de cermicas). De esta
manera, es posible llevar a cabo el proceso de clasificacin sin ningn
tipo de lmites basados en los estadsticos T2 o SCR, y se pueden
conseguir mejores resultados.

A partir de los resultados obtenidos, con el fin de construir modelos


capaces de conseguir elevados porcentajes de acierto en el rechazo de
imgenes de tipos no utilizados y la aceptacin de nuevas imgenes de
los tipos utilizados en la construccin de los mismos, es conveniente
formar conjuntos de validacin (test) con tantas imgenes como sea
posible, asegurando un porcentaje equilibrado de imgenes para cada
enfoque aplicado (50% de imgenes de tipos modelizados vs 50% de
imgenes de tipos no modelizados para el enfoque de Ajuste a un
modelo; (100/N)% para SIMCA y PLS-DA, al tratar con N tipos de
imgenes).

Esta misma metodologa se ha aplicado tambin sobre la estrategia


tradicional del MIA, con el fin de determinar los beneficios de la
integracin de la informacin espectral y espacial frente a la utilizacin
de estructuras de carcter exclusivamente espectral.

183
SPC mediante MIA____________________________________________________

Los resultados muestran que la integracin de ambos tipos de


informacin mejora los proporcionados por los modelos construidos
nicamente a partir de estructuras de informacin espectral.

184
Captulo 4. MIA y SPC___________________________________________________

4 DETECCIN Y LOCALIZACIN DE DEFECTOS


INESPECFICOS

La estrategia anterior ha presentado la forma en que se puede llevar a


cabo de una manera ptima un control de procesos basado en la
clasificacin automtica en tiempo real de cualquier tipo de pieza que se
est produciendo o inspeccionando (ya sea de tipo industrial o vegetal).

Sin embargo, existen muchas situaciones en las que la deteccin y


localizacin de defectos de cualquier tipo constituye un punto crtico a la
hora de determinar la calidad final, ya que no es slo el rea ocupada por
un determinado defecto, sino tambin su localizacin o distribucin
espacial en la pieza a controlar o inspeccionar, la que determina dicha
calidad final.

Un ejemplo es la deteccin y localizacin en frutas de zonas de la misma


afectadas por plagas, enfermedades u otros defectos. La cantidad y
distribucin de lo zona afectada en la superficie de la fruta determina su
calidad. Blasco (2001) ha trabajado el problema de la clasificacin y
localizacin de defectos en naranjas, a partir de informacin de carcter
espectral, si bien los defectos correspondan a enfermedades especficas.

Otro problema bien conocido es la deteccin de bordes en piezas


cermicas, que ha sido tradicionalmente abordado y resuelto en el campo
del anlisis clsico de imgenes (Lpez et al. 1997), as como la
deteccin de defectos en cermicas de patrn fijo (Acebrn et al., 2002;
Valiente et al., 2002 b)).

Dentro del campo de la deteccin de defectos de carcter aleatorio,


tambin aparece algn trabajo, como el de Boukovalas et al. (1998),
Fioravanti et al. (1995) o Song et al. (1995), relacionados con la
deteccin de defectos, principalmente grietas, en piezas de tipo cermico.
En cualquier caso, estos trabajos se basan en complejos clculos a partir
de modelos basados en transformaciones, en concreto de Distribuciones
Wigner con modificaciones subjetivas de las ventanas, que producen
como resultado una imagen en la que los defectos aparecen aislados. En

185
SPC mediante MIA____________________________________________________

este sentido, la revisin bibliogrfica indica que es mejor utilizar las


wavelets como herramienta de extraccin de caractersticas texturales.

Otro mbito de inters es el relacionado con la industria del acero, en el


que la aparicin de defectos tales como picadas, manchas o rayas puede
tambin afectar a la calidad de las planchas, que en muchos casos son
enrolladas formando bobinas de grandes dimensiones y tonelaje que
despus deben ser desenrollados para su inspeccin visual por personal
cualificado. Este proceso de inspeccin posterior lleva asociados unos
costes considerables, por lo que no se realiza en el 100% de la
produccin, sino a travs de un muestreo, a la vez que no garantiza que
dicha inspeccin se lleve a cabo de manera ptima, debido a los ya
comentados fallos producidos por la subjetividad y fatiga de los operarios
encargados de las tareas de inspeccin, y a la dificultad para el ojo
humano de localizar determinados tipos de defectos, lo que puede
provocar una pobre repetibilidad y reproducibilidad de este sistema de
inspeccin.

Por ltimo, un importante problema ligado a la deteccin de diferentes


clases de defectos es el relativo al proceso de produccin de bancadas de
piedra artificial para cocinas. Defectos del tipo de manchas y rayas son
causa de la retirada de piezas con elevados costes de fabricacin. Por
ello, es muy importante disponer de sistemas de deteccin que sean
capaces de localizar los diferentes tipos de defectos que pueden aparecer,
de una manera eficaz.

La deteccin de esta gran variedad de defectos, localizados de manera


aleatoria a lo largo de la pieza no es una tarea fcil, ya que los mismos
pueden tener diferente color, posicin, orientacin e incluso textura,
puesto que en una misma pieza pueden encontrarse diferentes tipos de
defectos, por ejemplo una mancha y una grieta. Todos estos aspectos
indican la necesidad de encontrar algn tipo de herramienta de fcil
manejo e interpretacin que permita abordar la deteccin y localizacin
de este tipo de defectos.

Una posibilidad es, a partir del enfoque de Ajuste a un modelo, construir


modelos de control multivariante para piezas que se consideren como
representativas del proceso de produccin en condiciones normales de
operacin, NOC (Normal Operating Conditions). Una vez construidos

186
Captulo 4. MIA y SPC___________________________________________________

estos modelos, mediante la proyeccin de nuevas imgenes, tal como se


ha detallado en el apartado correspondiente a dicho enfoque, y la
obtencin de los valores correspondientes a los estadsticos T2 y SCR
para cada pxel de la imagen, es posible crear nuevas imgenes, a las que
se ha denominado Imagen T2 e Imagen SCR, las cuales representan, para
cada pxel de la imagen que supere los lmites establecidos, el valor de T2
o SCR alcanzado por el mismo. De esta manera, es posible aislar y
conocer qu zonas de la imagen presentan valores alejados del
comportamiento medio del proceso o caractersticos de una pieza
(Imagen T2), y qu zonas de la imagen no se ajustan a lo que debera ser
un comportamiento normal del proceso o una pieza en condiciones
estndar (cermica, acero o piedra sin defectos, o fruta sana) (Imagen
SCR).

Wise y Geladi (2000) proponen la localizacin espacial de los valores de


diferentes estadsticos en el espacio de la imagen original, pero de esta
manera se confunden los pxeles que no muestran valores por encima de
lmites con los que s lo hacen, no permitiendo una deteccin clara de
posibles anomalas en las imgenes.

Sin embargo, las imgenes propuestas y desarrolladas en la presente tesis


permiten aislar de manera bastante clara los defectos inespecficos
presentes en las imgenes, como se presenta a continuacin.

Un aspecto diferenciador del enfoque de Ajuste a un modelo respecto de


esta nueva propuesta es que, a diferencia del primero, donde slo
aquellas piezas cuyo porcentaje de pxeles por encima de los lmites
establecidos a partir de las imgenes utilizadas para la construccin de
los modelos supera el mximo permitido son clasificadas como
defectuosas, en el caso de la deteccin y localizacin de defectos
inespecficos es necesario construir siempre las Imgenes T2 y SCR, ya
que aunque un tipo de defecto afecte a un porcentaje de pxeles por
encima de lmites inferior a los mximos establecidos para cada
estadstico, su distribucin espacial puede ser determinante para la
clasificacin de la pieza como defectuosa, como, por ejemplo, en el caso
de la aparicin de manchas o rayas en las imgenes inspeccionadas.

En los apartados siguientes se va a ilustrar esta estrategia aplicndola a


diversas imgenes reales. Es importante resear que esta estrategia no

187
SPC mediante MIA____________________________________________________

debe entenderse como una alternativa a la aplicacin de la estrategia de


clasificacin, sino como una ayuda complementaria, que permite reforzar
de manera global toda la metodologa del control estadstico de procesos.

4.1 Deteccin y localizacin de defectos inespecficos en naranjas

La aplicacin real de este tipo de estrategia sera a partir de la


construccin de modelos basados en imgenes de naranjas sanas, y la
determinacin de las zonas que no presentan un comportamiento sano.
Sin embargo, el conjunto de imgenes disponible no constaba de naranjas
sanas, por lo que realmente se van a detectar aquellas zonas de las
naranjas cuyo comportamiento no es similar al de la naranja utilizada
para construir el modelo. A fin de comprender mejor la diferencia
existente entre la aplicacin del enfoque de Ajuste a un modelo y la
aplicacin de esta estrategia, a la vez que se comprueba la utilidad de la
aplicacin conjunta de ambas estrategias, este estudio se presenta sobre la
base de los modelos construidos para el enfoque de Ajuste a un modelo,
expuestos en el apartado anterior.

Cabe recordar aqu que durante la aplicacin del enfoque de Ajuste a un


modelo al problema de las naranjas se supuso, a modo de ejemplo, que se
pretenda crear un modelo que permitiese distinguir aquellas naranjas que
no presentasen ciertos defectos, v.g. serpgruesa, de las que s los tenan.
La Figura 4.41 presenta de nuevo la imagen de la naranja utilizada para
construir el modelo.

Figura 4.41. Detalle de una naranja


afectada por serpgruesa.

188
Captulo 4. MIA y SPC___________________________________________________

Tambin se comprob cmo, una vez construidos los modelos, se podan


calcular los valores de T2 y SCR para cada uno del los pxeles. La Figura
4.8, representada de nuevo aqu en la Figura 4.42 por motivos prcticos
de cara al lector, mostr la representacin del valor de los pxeles,
indicando en rojo aqullos que superaban los lmites establecidos para un
riesgo de primera especie del 5%. Sin embargo, en dicho enfoque se
extraa slo una pequea parte de la informacin generada, dado que
simplemente se registraba el porcentaje de pxeles por encima de los
lmites establecidos para cada estadstico, pero no el valor alcanzado por
los mismos. De hecho, se puede comprobar en la Figura 4.42 que para el
estadstico SCR existen determinados pxeles con valores muy superiores
al resto de los pxeles de la imagen.

250

200
Valor de T2

150

100

50

0
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000

Valor de SCR de los datos


50

40
Valor de SCR

30

20

10

0
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000

Figura 4.42. Valores de T2 y de Suma de Cuadrados Residuales de una imagen


de naranja afectada por serpgruesa respecto de s misma.

Mediante la construccin de las Imgenes de T2, Figura 4.43 (a) y de


SCR, Figura 4.43 (b), es posible localizar y aislar espacialmente aquellos
pxeles que sobrepasan los lmites establecidos por el modelo. De esta
manera, se puede comprobar cmo, para la imagen utilizada como patrn
y representada en la Figura 4.41, los pxeles que muestran un
comportamiento alejado del modelo son los relacionados con los defectos
que muestra la naranja.

189
SPC mediante MIA____________________________________________________

(a) (b)
2
Figura 4.43. Representacin sobre la propia imagen de las T (a) y de las SCR (b) del
modelo patrn.

Cuando en lugar de la propia imagen se proyect la imagen de la naranja


mostrada en la Figura 4.2 (a), mostrada de nuevo en la Figura 4.44, se
comprob cmo los porcentajes de pxeles que sobrepasaban los lmites
de T2 y de la Suma de Cuadrados Residuales eran muy elevados.

Figura 4.44. Imagen de la naranja


afectada por podrido.

Las Figuras 4.45 (a) y 4.45 (b) muestran la localizacin de los pxeles y
el valor alcanzado por los mismos para los estadsticos T2 y SCR, a
travs de la construccin de las Imgenes de T2 y SCR. Se puede
comprobar cmo prcticamente el total de la imagen supera los lmites
para T2, mientras que los valores de los pxeles para SCR no son muy
elevados, si bien el rea o porcentaje de la imagen ocupada por los
mismos es considerable.

190
Captulo 4. MIA y SPC___________________________________________________

a) b)
Figura 4.45. Representacin sobre la propia imagen de las T2 (a) y SCR (b) de la imagen
comparada.

En cambio, si se proyecta la imagen de la Figura 4.10, mostrada de nuevo


en la Figura 4.46, los resultados son los que se muestran en las Figuras
4.47 (a) y (b).

Figura 4.46. Detalle de la nueva naranja


con serpgruesa.

Como se puede observar a partir de las Figuras 4.47 (a) y (b), lo que
parece ocurrir es que, por un lado y a partir de las conclusiones del
enfoque de Ajuste a un modelo, la naranja presenta un ajuste adecuado al
modelo, como se puede desprender de la visualizacin y localizacin de
los valores de los pxeles que superan los lmites establecidos. Sin
embargo, la Imagen de T2 indica que la zona derecha parece mostrar un
grado de afectacin diferente de la imagen patrn.

191
SPC mediante MIA____________________________________________________

a) b)

Figura 4.47. Imgenes T2 (a) y SCR (b) para la nueva imagen con serpgruesa.

4.2 Deteccin y localizacin de defectos inespecficos en cermicas

Al igual que en el caso de las naranjas, se va a comentar la aplicacin de


esta estrategia en el caso de las cermicas como una ampliacin a partir
de los ejemplos vistos en el caso del enfoque de Ajuste a un modelo.

En el primer caso se haba construido un modelo PCA a partir de la


imagen de la referencia Porcelnico Negro que aparece en la Figura 4.48
(a), sobre el cual se iba a proyectar la imagen de la referencia Sydney de
la Figura 4.48 (b).

a) b)
Figura 4.48. Imgenes de cermicas de los modelos Porcelnico Negro (a) y Sydney (b).

La proyeccin de la imagen de la Figura 4.48 (b) sobre el modelo creado


a partir de la Figura 4.48 (a) determin claramente que la imagen
proyectada no perteneca al modelo Porcelnico Negro. Si se representan

192
Captulo 4. MIA y SPC___________________________________________________

los valores de T2 y de SCR de los pxeles sobre la imagen original, se


puede observar en qu y dnde se diferencian las dos piezas de cermica
comparadas, tal como muestran las Figuras 4.49 (a) y 4.49 (b).
Representacion de los valores de T2 de cada pixel en la imagen Representacion de los valores de SCR de cada pixel en la imagen
1200 14

10 10
12
1000
20 20

30 30 10
800
40 40
8

Valor SCR
Valor T2

50 600 50
6
60 60
400
70 70 4

80 80
200
2
90 90

0 0
10 20 30 40 50 60 70 80 90 10 20 30 40 50 60 70 80 90

a) b)
2
Figura 4.49. Imagen T (a) e Imagen SCR (b) para la referencia Sydney al proyectarla
sobre el modelo construido a partir de la referencia Porcelnico Negro.

El segundo ejemplo compar dos imgenes de la misma referencia, en


concreto de la referencia Claro, al aplicar el enfoque a partir de un
modelo Tucker3. Dichas imgenes se vuelven a presentar en la Figura
4.50.

a) b)
Figura 4.50. Imgenes de cermicas de la referencia Claro.

En este caso se observ que la imagen proyectada, correspondiente a la


Figura 4.50 (b) se ajustaba al modelo. Si se representan los valores de T2
y de SCR de los pxeles sobre la imagen original, se puede observar en
qu y dnde se diferencian las dos piezas de cermica comparadas, tal
como se presenta en la Figura 4.51.

193
SPC mediante MIA____________________________________________________

a) b)

Figura 4.51. Imagen T2 (a) e Imagen SCR (b) para una imagen de la referencia Claro al
proyectarla sobre el modelo construido a partir de otra imagen de la misma referencia.

4.3 Deteccin y localizacin de defectos inespecficos en acero

En este apartado se han generado imgenes virtuales de lminas de acero


a partir de una matriz de 200 200, de manera que cada celda de la
misma simula el valor de intensidad de gris del pxel correspondiente. A
partir de ellas se han construido imgenes multivariantes siguiendo el
enfoque de Bharati y MacGregor (2000), que han sido posteriormente
analizadas mediante PCA, a partir de la aplicacin de la estrategia MIA.

La simulacin se ha llevado a cabo asumiendo que las intensidades de


gris de los pxeles siguen una distribucin uniforme [5,55], tratando de
generar imgenes simuladas, como la de la Figura 4.52 (b) lo ms
parecidas posibles a imgenes reales de planchas de acero como la de la
Figura 4.52 (a).

A partir de estas imgenes simuladas, se pueden aadir distintos tipos de


defectos, tales como picadas de distinto grosor y profundidad (o
intensidad), reas sucias o rayas de distinta longitud, grosor e inclinacin.

194
Captulo 4. MIA y SPC___________________________________________________

Simulacion de una plancha de acero


200 50

180 45

160 40

140 35

120 30

100 25

80 20

60 15

40 10

20 5

0
20 40 60 80 100 120 140 160 180 200

a)
b)

Figura 4.52. Imagen de una plancha de acero real (a) y de la generada por medio de la
simulacin llevada a cabo (b).

4.3.1 Estudio de picadas sobre una plancha de acero simulada

En la produccin de acero, las planchas de buena calidad tienen un


pequeo nmero de picadas distribuidas de manera aleatoria, mientras
que el aumento de stas tanto en trminos de cantidad como de severidad
van ligadas a un decremento de la calidad final del acero. Como se
observa en la Figura 4.53, donde se muestra una plancha simulada con
defecto de picadas, mediante la simple inspeccin visual resulta muy
difcil detectar estos fallos.
Plancha con defecto de picadas
200 50

180 45

160 40

140 35

120 30

100 25

80 20

60 15

40 10

20 5

0
20 40 60 80 100 120 140 160 180 200

Figura 4.53. Simulacin de una plancha con picadas


A partir del enfoque de Ajuste a un modelo, se establecen las distancias a
los modelos tanto en trminos de ajuste propiamente dicho, como de
localizacin de los defectos a partir de las Imgenes T2 y SCR.

195
SPC mediante MIA____________________________________________________

El modelo a utilizar como control se determina mediante validacin


cruzada, y se construye a partir de una imagen simulada sin defectos de
ningn tipo, tal como la de la Figura 4.54. Una vez creado el modelo, ya
es posible comenzar a proyectar sobre el mismo las nuevas imgenes,
con el objeto de determinar la localizacin espacial de aquellos pxeles
que superan los lmites de control establecidos para T2 y SCR.
Plancha sin defectos
200 50

180 45

160
40

140
35
120
30
100
25
80
20
60
15
40

20 10

20 40 60 80 100 120 140 160 180 200

Figura 4.54. Simulacin de una nueva plancha de


acero sin defectos

Si se proyecta una imagen sin defectos, como la presentada en la Figura


4.54, se obtienen los siguientes grficos de distancias, tanto en trminos
de T2 como de Sumas de Cuadrados Residuales (SCR), tal como se
muestra en la Figura 4.55.
Representacion de los valores de T2 alcanzados por los pixeles
20

15
Valor de T2

10

0
0 0.5 1 1.5 2 2.5 3 3.5 4
4
Representacion de los valores de SCR alcanzados por los pixelesx 10
5000

4000
Valor de SCR

3000

2000

1000

0
0 0.5 1 1.5 2 2.5 3 3.5 4
4
x 10

Figura 4.55. Valores de T2 y de SCR para los pxeles de la imagen sin defectos (Fig. 4.54) al
proyectarla sobre el modelo construido a partir de la imagen de la Figura 4.52 (b).

196
Captulo 4. MIA y SPC___________________________________________________

Los porcentajes de pxeles que superan los lmites establecidos para T2 y


SCR son, respectivamente, 4,84% y 0,46%, aproximadamente del mismo
orden de los hallados para la imagen de la Figura 4.52 (b). Este ltimo
resultado, alejado del valor terico del 5%, es debido a la falta de
normalidad de los datos, ya que la simulacin se ha llevado a cabo a
partir de una distribucin uniforme. En cualquier caso, el objetivo de esta
estrategia no es la determinacin del porcentaje, sino la localizacin
espacial de los pxeles que superan los lmites establecidos para T2 y
SCR. Estos pxeles se pueden localizar en la imagen original a travs de
las Imgenes T2 y de SCR, como se muestra en las Figuras 4.56 (a) y (b).

a) b)
Figura 4.56. Localizacin de los pxeles de la Figura 4.54 que superan los lmites de T2
(a) y de los pxeles que superan los lmites de SCR (b).

Si se proyecta ahora la imagen con picadas mostrada en la Figura 4.53, se


obtiene la Figura 4.57 y los resultados que se comentan a continuacin.

En este caso el porcentaje de pxeles que superan el lmite para T2 se


sita en el 5,04%, mientras que slo el 0,61% superan los lmites
establecidos para SCR. La localizacin de estos pxeles en la imagen
original se muestra en las Imgenes T2 y SCR, mostradas en las Figuras
4.58 (a) y (b).

La imagen simulada con picadas presenta 20 picadas de profundidad 15 y


rea 16 (44 pxeles), y se puede intentar localizar en la imagen a partir
de aquellos pxeles que muestran mayores valores de T2. En cualquier
caso, hay que hacer notar la presencia de ruido que dificulta esta
localizacin.

197
SPC mediante MIA____________________________________________________

Representacion de los valores de T2 alcanzados por los pixeles


20

15

Valor de T2
10

0
0 0.5 1 1.5 2 2.5 3 3.5 4
4
Representacion de los valores de SCR alcanzados por los pixelesx 10
5000

4000
Valor de SCR

3000

2000

1000

0
0 0.5 1 1.5 2 2.5 3 3.5 4
4
x 10

Figura 4.57. Valores de T2 y de SCR para la imagen con picadas de la Figura 4.53 al
proyectarla sobre el modelo construido a partir de la imagen de la Figura 4.52 (b).

a) b)

Figura 4.58. Imgenes T2 (a) y SCR (b) para la imagen con picadas de la Figura 4.53.

Para la Imagen SCR, la localizacin resulta todava ms difcil, y el bajo


porcentaje de pxeles que superan los lmites establecidos hace pensar
que en este caso dicho grfico no resulta muy adecuado para localizar
este tipo de defectos. Adems, hay que tener en cuenta el problema
detectado a la hora de establecer los lmites de control.

198
Captulo 4. MIA y SPC___________________________________________________

Con el objetivo de intentar eliminar el ruido, se procede a continuacin a


comprimir la imagen mediante la utilizacin de wavelets del tipo DWT, y
el estudio de la imagen LL, que concentra la informacin ms importante
de la imagen original.

Al comprimir la imagen de la Figura 4.54, y proyectarla sobre el modelo


creado a partir del canal LL de la imagen de la Figura 4.52 (b), el
porcentaje de pxeles que superan el lmite para T2 se mantiene
prcticamente invariable (4,74%), mientras que para SCR, el porcentaje
de pxeles que superan el lmite aumenta de manera muy importante,
llegando al 4,49%, lo cual parece mucho ms adecuado desde el punto de
vista terico. Para la propia imagen de entrenamiento, Fig. 4.52 (b), los
lmites correspondientes son del 4,89% para T2 y del 3,98% para SCR.

Esto hace pensar en el hecho comentado de que los valores de los pxeles
se haban simulado a partir de una distribucin uniforme, mientras que al
comprimir la imagen y realizar el estudio sobre el canal LL, que integra
la informacin existente en la imagen original, los pxeles obtienen
valores que, al ser combinacin de valores de una Uniforme, por el
teorema central de lmite convergen hacia la Normal.

De todas formas, estos valores lmite siguen sin ser superados de manera
clara por la imagen de la plancha con picadas (Fig. 4.54), la cual muestra
unos valores, al ser proyectada sobre el nuevo modelo construido, del
5,31% para T2 y del 4,82 para SCR.

Esto se puede comprobar en el grfico de la Figura 4.59, donde se


representan los valores de T2 y SCR de todos los pxeles de la nueva
imagen comprimida. La desventaja de este tipo de grfico es que nos
indica qu pxeles superan los lmites establecidos, pero no su
localizacin, punto clave en este estudio.

199
SPC mediante MIA____________________________________________________

Representacion de los valores de T2 alcanzados por los pixeles


20

15

Valor de T2
10

0
0 2000 4000 6000 8000 10000 12000

Representacion de los valores de SCR alcanzados por los pixeles


8000

6000
Valor de SCR

4000

2000

0
0 2000 4000 6000 8000 10000 12000

Figura 4.59. Valores de T2 y de SCR para la imagen con picadas de la


Figura 4.53 comprimida, al proyectarla sobre el modelo construido a partir
de la imagen de la Figura 4.52 (b).
Sin embargo, si se representan los pxeles en los grficos de localizacin
Imagen T2 e Imagen SCR, se puede observar cmo en este caso s
aparecen de una manera ms clara las picadas presentes en la plancha.

De esta manera, no slo se consigue localizar los defectos, sino que se


trabaja con estructuras de datos ms reducidas (un 25% de la original en
este caso).

La Figura 4.60 (a) presenta la Imagen T2 correspondiente a la


localizacin de los pxeles en la imagen comprimida de la simulacin de
la plancha con defectos. Se puede comprobar cmo aparecen de una
manera bastante ms clara las picadas que se deseaba encontrar,
habindose eliminado gran parte del ruido que dificultaba esta tarea.

En la Imagen T2 todava aparecen ms de 20 agrupaciones de pxeles,


que son las correspondientes a las 20 picadas introducidas en la
simulacin, si bien resulta sencillo localizar gran parte de ellas.

200
Captulo 4. MIA y SPC___________________________________________________

a) b)
2
Figura 4.60. Imagen T (a) y SCR (b) de la plancha con picadas, comprimida.

Por otra parte, la Imagen SCR para la imagen comprimida de la


simulacin de la plancha con picadas, Figura 4.60 (b), tambin parece
localizar las picadas, si bien con un mayor grado de confusin que en el
caso de la Imagen T2.
Plancha con defecto de picadas
200 50

180 45

160 40

140 35

120 30

100 25

80 20

60 15

40 10

20 5

0
20 40 60 80 100 120 140 160 180 200

Figura 4.61. Imagen simulada de una plancha con picadas, ampliacin de la Figura 4.53.

201
SPC mediante MIA____________________________________________________

A fin de intentar estudiar cul de las dos figuras proporciona una mejor
informacin, se muestra de nuevo en la Figura 4.61, ampliada, la
simulacin de la plancha con picadas, ya mostrada en la Figura 4.53.

4.3.2 Simulacin de un rea sucia

El siguiente tipo de defecto a estudiar ha sido el de un rea sucia, como


puede ser el caso de una mancha de aceite o de una zona donde por
cualquier motivo se haya dado una composicin diferente del acero, que
d lugar a una tonalidad distinta respecto del resto. Un ejemplo de este
defecto aparece en la Figura 4.62.

Plancha con defecto de area sucia


200 60

180 55

160 50

45
140
40
120
35
100
30
80
25
60
20

40 15

20 10

20 40 60 80 100 120 140 160 180 200

Figura 4.62. Simulacin de una plancha con defecto de rea sucia.

Utilizando el modelo PCA de la imagen patrn de la Figura 4.52 (b), se


puede proyectar esta nueva imagen sobre l. Dicha imagen presenta un

202
Captulo 4. MIA y SPC___________________________________________________

rea sucia de grado 10, inferior al grado 15 de las picadas del ejemplo
anterior.

Si no se comprime, y utilizando como ventana de vecindad los pxeles


inmediatamente vecinos a uno dado (amplitud de la ventana de vecindad
de un pxel), se obtienen las Imgenes T2 y SCR que se muestran en las
Figuras 4.63 (a) y (b), respectivamente.

a) b)
Figura 4.63. Imgenes T2 (a) y SCR (b) para una plancha con rea sucia, sin comprimir
y con mnima informacin espacial.

En el caso de la Imagen T2, el defecto de rea sucia se detecta, si bien


con la presencia de ruido, debido a aquellos pxeles que presentan valores
por encima de los lmites establecidos. Adems, existen zonas dentro del
propio rea sucia que no son detectadas como tales. En el caso de la
Imagen SCR, el resultado no es nada bueno, ya que sta no es capaz de
detectar el defecto.

Si se comprime a un nivel, y se utiliza un nico pxel de vecindad, las


imgenes correspondientes son las que se muestran en la Figura 4.64. En
dicha figura se puede comprobar fcilmente cmo el rea sucia queda
bien determinada por parte de la Imagen T2.

Sin embargo, la Imagen SCR sigue sin mostrarse potente a la hora de


detectar el defecto. ste se puede adivinar, pero no determinar de manera
clara. En cualquier caso, hay que indicar que, al comprimir, se normaliza
el porcentaje de pxeles por encima de los lmites establecidos.

203
SPC mediante MIA____________________________________________________

a) b)
2
Figura 4.64. Representacin conjunta de la Imagen T (a) e Imagen SCR (b),
comprimiendo a un nivel y con mnima informacin espacial (amplitud de la ventana de
vecindad de 1 pxel).

Si se aumenta el tamao de vecindad a un pxel ms, se obtienen las


representaciones grficas de la Figura 4.65.

a)
b)
2
Figura 4.65. Representacin conjunta de la Imagen T (a) e Imagen SCR (b),
comprimiendo a un nivel y con una amplitud de la ventana de vecindad de 2 pxeles.

En ellas se puede apreciar claramente cmo, mientras la Imagen T2 sigue


detectando el rea sucia, la Imagen SCR aumenta su capacidad de
deteccin.

204
Captulo 4. MIA y SPC___________________________________________________

La Imagen SCR ha cobrado algo de fuerza a la hora de detectar el cambio


de brillo, el borde del rea sucia, ya que la textura de base se mantiene
tanto en el rea sucia como en el rea limpia, es decir, se mantiene la
estructura del modelo en ambas zonas; pero el cambio brusco de brillo en
el borde, que de hecho se puede considerar como una textura adicional,
no se adecua al modelo creado, el cual slo recoge la textura de base.

En cambio, la Imagen T2 no capta el cambio de brillo, sino la mayor


intensidad de la zona, que son las desviaciones existentes dentro del
modelo. Es decir, que la capacidad de detectar nuevas texturas ha ido
asociada en este caso al hecho de crear un modelo donde se ha
aumentado el amplitud de la ventana de vecindad, lo cual ha supuesto
una relacin en el tamao de la estructura de datos de [9696253]/
[989893] = 2.67. La razn de esta relacin est en que un amplitud
de ventana de un pxel implica registrar la informacin de los 8 pxeles
inmediatamente vecinos, con lo que se tiene la informacin de 8 + 1 = 9
pxeles; mientras que si se ampla la ventana hasta una distancia de 2
pxeles, se registra la informacin de 1 + 8 +16 =25 pxeles, y as
sucesivamente. Pero al mismo tiempo, conforme se aumenta el amplitud
de la ventana de vecindad, el nmero de pxeles en los bordes se reduce
de la misma manera, es decir, que se pasa de 100 a 98 pxeles si se
escoge un amplitud de la ventana de vecindad de 1 pxel, de 100 a 96 si
se elige un amplitud de 2 pxeles, y as sucesivamente.

Dado que las wavelets comprimen la informacin espacial de manera


eficiente, una posible alternativa es comprimir la imagen un nivel ms, y
utilizar un nico pxel de vecindad de nuevo, ya que el incremento de
informacin espacial asociado a la ventana de mayor tamao debe ser
equivalente de alguna manera a la integracin de la informacin espacial
que hace la DWT en el canal LL cuando se comprime la imagen (recoge
la informacin espacio-frecuencial, lo que equivale a la deteccin de
cambios en la variacin del brillo en una determinada zona, en el
espacio).

De esta manera, se obtienen las imgenes de la Figura 4.66. En ellas se


puede observar cmo el suavizado producido mantiene la deteccin del
rea por parte de la Imagen T2. Sin embargo, la deteccin del borde por
parte de la Imagen SCR ha aumentado bastante. En este caso, se ha

205
SPC mediante MIA____________________________________________________

conseguido una mayor deteccin de la nueva textura, y con ello del borde
relacionado con el rea sucia, con una relacin entre la nueva estructura
de datos y el tamao de la estructura de datos sobre la original de
[494993]/ [989893] = 0.25, es decir, un 25% de la estructura
original.

a) b)
Figura 4.66. Representacin conjunta de la Imagen T2 (a) e Imagen SCR (b), para dos
niveles de compresin y una amplitud de la ventana de vecindad de 1 pxel.

Pero si se quiere comparar con la estructura a partir de la cual se ha


detectado bien el cambio de textura, la relacin es de [494993]/
[9898253] = 0.09, o lo que es lo mismo, un 9% de la estructura que
proporciona los resultados equivalentes. Esto puede dar una idea de la
potencia de estas herramientas a la hora de comprimir de manera
eficiente la informacin. Adems, el hecho de trabajar con imgenes
comprimidas posibilita un aumento de la rapidez a la hora de presentar
los resultados, puesto que cuanto menor es el nmero de pxeles a
representar, menor es el tiempo que emplea el software en obtener los
valores de T2 y SCR, as como en crear las Imgenes T2 y SCR.

Por ello, la utilizacin de imgenes comprimidas resulta una opcin


interesante a la hora de exportar este tipo de estrategias a la industria,
donde las restricciones de tiempo son muy importantes.

Los resultados anteriores se han obtenido mediante modelos sin


estandarizar. Si se estandariza, es necesario llegar a un nivel de
compresin de 2 para obtener un buen resultado ya que, en caso

206
Captulo 4. MIA y SPC___________________________________________________

contrario, independientemente del amplitud de la ventana de vecindad


utilizada los resultados proporcionados por la Imagen T2 no son buenos.
En cambio, la Imagen SCR parece mantenerse bastante robusta frente a
la estandarizacin. Esto puede apreciarse en las Figuras 4.67 y 4.68,
donde se muestra el caso de una imagen comprimida a dos niveles con un
amplitud de ventana de vecindad mnimo (1 pxel), y una imagen
comprimida un solo nivel con un amplitud de ventana de vecindad de dos
pxeles, respectivamente.

a) b)

Figura 4.67. Imagen T2 (a) e Imagen SCR (b) para una imagen estandarizada con dos
niveles de compresin y una amplitud de ventana de vecindad de 1 pxel.

a) b)
2
Figura 4.68. Imagen T (a) e Imagen SCR (b) para una imagen estandarizada con un
nico nivel de compresin y dos pxeles de vecindad.

207
SPC mediante MIA____________________________________________________

En este ltimo caso, 1 nivel de compresin, amplitud de la ventana de


vecindad de 2 pxeles y estandarizado, la interpretacin no es tan clara en
la Imagen T2, si bien se refuerza la Imagen SCR como herramienta de
deteccin. La zona asociada al rea sucia queda principalmente recogida
por la Imagen SCR, de manera que ahora es toda la zona, y no slo los
bordes, la que parece romper la estructura de correlacin existente en el
modelo.

Por tanto, en este caso parece conveniente no estandarizar para conseguir


buenos resultados en general.

4.3.3 Simulacin de una plancha de acero rayada

El ltimo caso que se presenta es el de la deteccin de superficies


rayadas. La imagen creada como ejemplo se presenta en la Figura 4.69,
donde se han simulado 19 rayas de longitud 15 pxeles orientados a 30,
de grosor 2 pxeles, y una gravedad o profundidad de grado 5.

Plancha con defecto de rayas


200 50

180 45

160
40

140
35
120
30
100
25
80
20
60
15
40

20 10

5
20 40 60 80 100 120 140 160 180 200

Figura 4.69. Simulacin de una plancha de acero con defecto de rayas.

208
Captulo 4. MIA y SPC___________________________________________________

A fin de conseguir unos niveles aceptables de porcentaje de pxeles que


superan los lmites establecidos para el 95%, sobre todo en el caso de la
SCR, se trabajar con imgenes comprimidas 1 nivel. Se consiguen as
los lmites establecidos en el apartado 4.3.1 para una imagen buena
comprimida a un nivel, del 4,89% para T2 y 3,98% para SCR.

El porcentaje de pxeles que superan en este caso los lmites establecidos


en las mismas condiciones (un nivel de compresin, una amplitud de la
ventana de vecindad de 1 pxel y sin estandarizar) al proyectar la imagen
con rayas de la Figura 4.69 sobre el modelo creado a partir del canal LL
con un nivel de compresin de la imagen de la Figura 4.52 (b) son del
7,46% para T2 y 7,60% para SCR.

Las imgenes correspondientes a las Imgenes T2 y SCR se muestran en


la Figura 4.70. En ellas, aunque se pueden distinguir las rayas, stas
aparecen de una manera bastante grosera, sobre todo en la Imagen SCR.

a) b)
2
Figura 4.70. Representacin de la Imagen T (a) e Imagen SCR (b) para la simulacin de
la plancha de acero con rayas.

Es evidente que la deteccin por parte de la Imagen SCR, centrada en el


cambio de brillo no recogido por el modelo creado a partir de la imagen
de entrenamiento, es mucho ms fuerte, lo cual da lugar a su vez a
representaciones ms gruesas; mientras que, al igual que en el caso

209
SPC mediante MIA____________________________________________________

anterior, la Imagen T2 da unas representaciones ms finas, basadas en el


cambio de intensidad.

Si se estandariza, tambin para un solo pxel de vecindad, la deteccin de


las rayas se hace ms fina en la Imagen SCR, mientras que empeora
bastante para la Imagen T2. Esto se puede comprobar en la Figura 4.71.

a) b)
Figura 4.71. Imagen T2 (a) e Imagen SCR (b) en el caso de haber estandarizado la
imagen original.

En este caso, el hecho de aumentar la ventana de vecindad no ha


mejorado la capacidad de deteccin por parte del modelo. Ello tal vez
haya sido debido a que las rayas tenan un grosor de 2 pxeles, con lo que
quedaban bien caracterizadas por una ventana de un solo pxel de
vecindad, al registrar la informacin de los pxeles inmediatamente
contiguos a uno dado.

Tampoco el hecho de haber utilizado las imgenes de detalle


correspondientes a las direcciones horizontal HL, vertical LH o diagonal
HH ha mejorado la deteccin, sino ms bien al contrario. De hecho, la
nica imagen que ha detectado algo mejor las rayas ha sido la imagen de
detalle vertical, lgico si se tiene en cuenta que las rayas tienen una
orientacin ms horizontal que vertical, lo cual hace que esta imagen de
detalles capte mejor los cambios de brillo que la horizontal. En cualquier
caso, hay que repetir que la imagen que mejor ha funcionado ha sido la
imagen comprimida.

210
Captulo 4. MIA y SPC___________________________________________________

Para finalizar, se presenta en la Figura 4.72, a modo de comprobacin de


lo expuesto en la pgina anterior, un ejemplo con una imagen que
presenta rayas de las mismas caractersticas que la simulacin de la
Figura 4.69, salvo con la diferencia de que ahora el grosor es de 5 pxeles
en lugar de 2.
Plancha con defecto de rayas
200 50

180 45

160
40

140
35
120
30
100
25
80
20
60
15
40

20 10

5
20 40 60 80 100 120 140 160 180 200

Figura 4.72. Simulacin de una plancha con rayas de 5 pxeles de espesor.

La Figura 4.73 presenta la Imagen T2 y la Imagen SCR para modelos


creados a partir la imagen comprimida con un nivel de compresin, sin
estandarizar y con un solo pxel de vecindad; mientras que la Figura 4.74
presenta las mismas imgenes para el mismo modelo, pero utilizando una
ventana con una amplitud de dos pxeles de vecindad. En ellas se puede
apreciar cmo la deteccin parece menos basta con un solo pxel de
vecindad (Fig. 4.73), aunque en ambos casos aparece de manera clara la
propiedad de la Imagen SCR de detectar los cambios de brillo, ya que
son stos los que definen la textura no recogida en el modelo.

En la Imagen SCR de la Figura 4.73 se pueden apreciar los huecos


existentes dentro de las rayas, ya que, como el modelo slo tiene en
cuenta un pxel vecino a la hora de definir la textura y las rayas presentan

211
SPC mediante MIA____________________________________________________

un grosor de cinco pxeles, existe una zona interior donde, aunque la


intensidad sigue siendo mayor que fuera de las rayas (cambio detectado
por la Imagen T2 si no se estandariza), como la textura no cambia dentro
de ellas (es la de la plancha sin defectos original), el modelo valida dicha
zona interior como buena.

a) b)
Figura 4.73. Imagen T2 (a) e Imagen SCR (b) para una amplitud de la ventana de
vecindad de 1 pxel.

Por supuesto, no sucede lo mismo con los bordes, caracterizadores de la


nueva textura presente en la imagen, que s son detectados por el modelo.

a) b)

Figura 4.74. Imagen T2 (a) e Imagen SCR (b) para una amplitud de la ventana de
vecindad de 2 pxeles.

212
Captulo 4. MIA y SPC___________________________________________________

Sin embargo, la Imagen SCR de la Figura 4.74, al aumentar la amplitud


de la ventana de vecindad de uno a dos pxeles, como el grosor de las
rayas es de cinco pxeles y cada pxel registra la informacin de los 24
pxeles que le rodean, aumenta el rea de pxeles que tienen informacin
del cambio de la estructura de correlacin debida a la raya, con lo que el
estadstico SCR es mayor para un mayor porcentaje de pxeles dentro de
la raya y es su contorno. De manera general, se puede comprobar cmo la
deteccin con una amplitud de ventana mayor (mayor nmero de pxeles
de vecindad) produce imgenes ms bastas.

Por ltimo, se presenta en la Figura 4.75 las imgenes correspondientes a


un modelo creado sobre la imagen comprimida, estandarizando y con un
amplitud de la ventana de vecindad de un solo pxel. La deteccin es
clara por parte de la Imagen SCR, mientras que es peor por parte de la
Imagen T2. La conclusin es la misma para tamaos mayores de la
ventana de vecindad, simplemente con la diferencia de una deteccin ms
grosera por parte de la Imagen SCR.

a) b)

Figura 4.75. Imagen T2 (a) e Imagen SCR (b) para un modelo creado a partir de la
imagen comprimida, estandarizada y amplitud de la ventana de vecindad de 1 pxel.

213
SPC mediante MIA____________________________________________________

4.4 Deteccin y localizacin de defectos inespecficos en piedra


artificial

La ltima aplicacin de esta estrategia ha sido sobre un conjunto de


imgenes RGB procedentes de un proceso de fabricacin de piezas de
piedra artificial para bancadas de cocina.

Dichas piezas se realizan bajo altos estndares de calidad, a partir de un


aglomerado de cuarzo natural y cristal, pigmentadas y ligadas con resina
de polister. Se fabrican con diferentes dimensiones, siendo sus
principales propiedades fsicas: bajo coeficiente de absorcin de lquidos,
buena resistencia frente a cidos, gran coeficiente de flexin, gran
resistencia al rayado y gran resistencia al impacto. Por ello, es
fundamental que cualquier pieza que salga de la fbrica hacia el cliente
est libre de cualquier tipo de defecto, principalmente los asociados a
manchas y rayas.

Se dispone de imgenes de tres de las referencias de la marca,


codificadas como Tipo A, Tipo B y Tipo C, que van a utilizarse para
ilustrar la capacidad de deteccin de defectos (manchas y rayas) por
medio de la metodologa de deteccin de defectos inespecficos
propuesta en la tesis.

4.4.1 Tipo A

La primera referencia estudiada ha sido la codificada como Tipo A. Se


decidi utilizar como imagen patrn la mostrada en la Figura 4.76 (a),
mientras que la imagen con un defecto de rea sucia es la que se muestra
en la Figura 4.76 (b).

La estructura de datos creada a partir de las imgenes ha utilizado una


amplitud de la ventana de vecindad de 2 pxeles, que integra la
informacin de los 24 pxeles que rodean a uno dado, asumiendo que el
defecto a analizar est asociado a reas de tamao medio, y que el hecho
de emplear ciertos niveles de compresin implica una reduccin del
tamao de la ventana, dado que los pxeles resultantes del proceso de
compresin quedan asociados a un rea mayor de la imagen. Por

214
Captulo 4. MIA y SPC___________________________________________________

supuesto, estas suposiciones deben realizarse cuando se tiene un cierto


conocimiento a priori del fenmeno a estudiar y de la resolucin de la
cmara utilizada, debido a la relacin entre la misma y el rea de la pieza
asociada a cada pxel.

a) b)

Figura 4.76. Imagen de la pieza del Tipo A utilizada como patrn (a) y de la pieza Tipo
A con un defecto de mancha o rea sucia (b).

Con el fin de comprimir las imgenes y eliminar algo del ruido que pueda
existir en las mismas, se ha empleado para el estudio los canales LL de
las DWT. Tras la construccin de un modelo PCA, y aplicando el enfoque
de Ajuste a un modelo, se obtienen los valores de T2 y SCR para cada
uno de los pxeles de la imagen, los cuales dan lugar a la Imagen T2 y
SCR mostradas en la Figura 4.77, correspondientes a la pieza de la
Figura 4.76 (b).

Las principales diferencias conceptuales, y por tanto el tipo de deteccin


realizada por cada uno de los estadsticos T2 y SCR se pone de manifiesto
en la Figura 4.77. La Imagen T2 detecta el defecto de rea sucia debido a
que sta mantiene la estructura general del modelo, pero con una
modificacin en la intensidad de los canales R, G y B, hecho que debera
estar asociado a que bajo el defecto de rea sucia, la zona afectada es la
misma que la correspondiente a la referencia Tipo A, y por tanto debe
mantener la misma estructura. Este mismo razonamiento explica por qu
la Imagen SCR no detecta el defecto de rea sucia de una manera clara.

215
SPC mediante MIA____________________________________________________

a) b)
2
Figura 4.77. Imagen T (a) e Imagen SCR (b) correspondientes a la pieza de la Figura
4.76 (b), con un nivel de compresin y una amplitud de la ventana de vecindad de 2
pxeles.

Si no se comprimiesen las imgenes de la Figura 4.76, los resultados


seran los que se muestran en la Figura 4.78. En este caso, la amplitud de
la ventana de vecindad utilizada ha sido de 3 pxeles, con el fin de
analizar un rea de la pieza dentro de cada ventana similar a la recogida
por la amplitud de la ventana de vecindad de 2 pxeles cuando se lleva a
cabo una compresin a un nivel de la imagen original. Como se puede
observar, no existen prcticamente diferencias con las imgenes
proporcionadas en la Figura 4.77, con la salvedad de que ahora la Imagen
SCR muestra ms ruido que en el caso anterior, dificultando ms el
proceso de deteccin.

a) b)
Figura 4.78. Imagen T2 (a) e Imagen SCR (b) para la pieza de la Figura 4.76 (b) sin
comprimir y con una amplitud de la ventana de vecindad de 3 pxeles.

216
Captulo 4. MIA y SPC___________________________________________________

4.4.2 Tipo B

Otro ejemplo es el relacionado con la referencia Tipo B. de nuevo, el


objetivo es detectar los defectos de rea sucia, y se ilustra debido a la
mejora de los resultados obtenidos al emplear las imgenes comprimidas
frente a las no comprimidas. Las imgenes utilizadas son las que se
muestran en la Figura 4.79.

a) b)
Figura 4.79. Imgenes originales de la pieza utilizada como patrn (a) y la
correspondiente a la pieza proyectada, con defecto de rea sucia.

La Figura 4.80 muestra las Imgenes T2 correspondientes a la imagen


proyectada comprimida (a) y sin comprimir (b). Como se puede observar,
la deteccin llevada a cabo por la imagen comprimida en bastante mejor
que la conseguida por la imagen sin comprimir.

b)
a)

Figura 4.80. Imgenes T2para la imagen de la Figura 4.79 (b) comprimida (a) y sin
comprimir (b).

217
SPC mediante MIA____________________________________________________

Como ya se ha comentado, la principal razn para utilizar imgenes


comprimidas es la necesidad de emplear estructuras de datos ms
pequeas, que permitan la aplicacin de estas estrategias en tiempo real,
on-line, en entornos industriales. En este sentido, se podra argumentar, a
fin de conseguir mejores resultados con imgenes sin comprimir, la
utilizacin de amplitudes de ventana mayores de los utilizados en este
caso, dado que el hecho de comprimir aumenta el rea efectiva asociada a
cada ventana, y si se emplea el mismo tamao de ventana para la imagen
comprimida y sin comprimir, es lgico que la primera consiga mejores
resultados a la hora de detectar este tipo de defectos. De hecho, para cada
nivel de compresin, el rea resultante queda multiplicada por 4. Pero el
hecho de incrementar el amplitud de la ventana de vecindad utilizado de
3 a 4 pxeles provoca un colapso en la memoria del ordenador con el
hecho aadido de que el rea resultante se ve aumentada en una relacin
81/49 en lugar de por 4.

De esta manera, para una determinada capacidad del ordenador, mediante


la utilizacin de imgenes comprimidas mediante las DWT es posible
mejorar la capacidad de deteccin de las Imgenes T2 y SCR. La Figura
4.81 muestra las Imgenes SCR para las imgenes comprimidas y sin
comprimir de la pieza de la Figura 4.79 (b).

a) b)

Figura 4.81. Imgenes SCR para la imagen de la Figura 4.79 (b) comprimida (a) y sin
comprimir (b).

Para las Imgenes SCR se pueden hacer los mismos comentarios,


teniendo en cuenta que la deteccin realizada por este estadstico tiene un

218
Captulo 4. MIA y SPC___________________________________________________

significado distinto que el asociado al estadstico T2. Esto significa que la


Imagen SCR no detecta valores extremos dentro del rea, sino algn tipo
de comportamiento diferente de la estructura en trminos de la
informacin espectro-textural.

4.4.3 Tipo C

El ltimo ejemplo tiene por objetivo detectar un defecto de rayas, tal


como aparece en la Figura 4.82 (b).

a) b)
Figura 4.82. Imgenes de la pieza Tipo C empleada para la construccin del modelo (a),
y la pieza con el defecto de raya (b).

Cuando se construyeron los modelos en base a los canales LL de las


imgenes RGB comprimidas por medio de las DWT, no se pudo aislar el
defecto de rayas en la Imagen T2 ni en la Imagen SCR, tal como se
muestra en la Figura 4.83.

Debido a estos malos resultados, se haca necesario buscar otros canales


de las DWT que pudiesen extraer el defecto de rayas de la imagen. Como
las rayas son defectos finos y de pequea modificacin de la intensidad,
deberan quedar bien contenidas en las imgenes de detalles,
correspondientes a los canales LH, HL y HH. Dado que en este caso la
raya de la imagen era diagonal, se decidi trabajar con el canal de detalle
HH. Bharati et al. (2004) tambin proponen la utilizacin de este canal,
indicando que es el que recoge los cambios de frecuencia que se
producen en cada escala.

219
SPC mediante MIA____________________________________________________

a) b)
2
Figura 4.83. Imagen T (a) e Imagen SCR (b) para el canal LL de la pieza de la Figura
4.82 (b).

De todas formas, en aquellos casos en los que no se conoce la posicin de


las rayas, deberan estudiarse los diferentes canales de detalle, con el fin
de poder detectar el defecto en otras direcciones. La Figura 4.84 muestra
los resultados correspondientes a las Imgenes T2 y SCR, para las
condiciones de trabajo de un nivel de compresin, canal HH de la DWT,
amplitud de la ventana de vecindad de 4 pxeles y no estandarizado. Es
de destacar la claridad en la deteccin de la raya por parte de la imagen
T2 de la Figura 4.84 (a).

a) b)
2
Figura 4.84. Imagen T (a) e Imagen SCR (b) para el canal HH de la imagen de la pieza
rayada de la Figura 4.82 (b).

220
Captulo 4. MIA y SPC___________________________________________________

Los resultados obtenidos refuerzan la idea de los beneficios asociados a


la compresin y segregacin de la informacin contenida en una imagen
en los canales de escala-frecuencia proporcionados por las wavelets, con
el fin de encontrar diferentes tipos de defectos.

Una alternativa adicional consiste en buscar espacios alternativos de


color (Liu et al., 2005) que sean capaces de aislar el defecto de rayas en
un reducido nmero de canales. Hay que tener en cuenta que, cuanto ms
sencilla es la estructura de datos a analizar, menor ser el tiempo
empleado en el clculo de los estadsticos y su representacin en las
Imgenes T2 y SCR. A modo de ejemplo, se presenta el empleo de los
canales correspondientes al espacio HSB, ligados al tono, saturacin y
brillo. La Figura 4.85 presenta los resultados correspondientes a las
mismas condiciones de operacin utilizadas en el caso mostrado
anteriormente: canal HH, amplitud de la ventana de vecindad de 4
pxeles (que integran la informacin de los 80 pxeles alrededor de uno
dado) y no estandarizado.

a) b)
2
Figura 4.85. Imgenes T (a) y SCR (b) para el canal HH de la imagen comprimida para
la pieza de la imagen 4.82 (b), al trabajar en el espacio HSB.

Como se observa, el modelo creado no es capaz de detectar el defecto de


raya. Realmente este modelo creado mediante validacin cruzada slo
tiene una componente principal, cuyo grfico de pesos (Loading Plot) se
muestra en la Figura 4.86. Como comenta Bharati (2002), el estudio de
los pesos en cada componente principal ayuda a interpretar la

221
SPC mediante MIA____________________________________________________

informacin capturada por el modelo, pudiendo asignar a cada


componente qu tipo de informacin est proporcionando.

Como se puede comprobar en este caso, la primera y nica componente


principal est asociada al canal H del espacio HSB, puesto de los valores
mayores de las cargas corresponden a los primeros 81 pxeles, relativos a
la informacin espacial asociada al mencionado canal H.

Loading Plot para la primera componente principal


0.25

0.2

0.15

0.1

0.05

-0.05

-0.1

-0.15

-0.2

-0.25
0 50 100 150 200 250

Figura 4.86. Loading Plot para la primera componente principal.

Si se fuerza al modelo a incluir un mayor nmero de componentes, no se


obtiene ningn resultado positivo hasta que se incluyen ms de 81
componentes principales, lo cual indica una gran influencia del canal H
del espacio HSB en las variables espaciales (valores de intensidad del
canal H de los pxeles vecinos).
Loading Plot para las 148 pc's Loading Plot para las pc's 82 a 148
0.5 0.4

0.4 0.3

0.3 0.2

0.2
0.1

0.1
0
0
-0.1
-0.1
-0.2
-0.2

-0.3
-0.3

-0.4 -0.4
0 50 100 150 200 250 0 50 100 150 200 250

a) b)
Figura 4.87. Loading Plots para el modelo forzado con 148 pcs (a) y las componentes
82 a 148 (b).

222
Captulo 4. MIA y SPC___________________________________________________

Este comentario se puede corroborar en la Figura 4.87, donde se muestra


el grfico de pesos (Loading Plot) correspondiente a un modelo con 148
componentes principales (a), as como el correspondiente a las
componentes 82 a la 148 (Fig. 4.87 b), las cuales estn precisamente
asociadas al canal S.

Las imgenes T2 y SCR correspondientes se presentan en la Figura 4.88.


En ellas se puede observar cmo, a pesar de que se gana algo al
compararla con la Imagen T2 asociada al modelo construido mediante
validacin cruzada con una sola componente principal, Fig. 4.85 (a), la
Imagen T2 actual, Fig. 4.88 (a), no es tan clara como la correspondiente
al modelo construido con las imgenes RGB, Fig. 4.84 (a)

a) b)
Figura 4.88. Imagen T2 (a) e Imagen SCR (b) derivadas del modelo forzado con 148
componentes principales, para el canal HH de la imagen comprimida para la pieza de la
imagen 4.82 (b), al trabajar en el espacio HSB.

Estos resultados derivaron en la decisin de estandarizar la estructura de


datos construida a partir del canal HH wavelet, con el fin de que los
distintos canales de color del espacio HSB tuviesen la misma
oportunidad de contribuir al modelo. De esta manera, el modelo
construido mediante validacin cruzada proporcion las Imgenes T2 y
SCR presentadas en la Figura 4.89.

223
SPC mediante MIA____________________________________________________

a) b)

Figura 4.89. Imagen T2 (a) e Imagen SCR (b) derivadas del modelo estandarizado y
construido mediante validacin cruzada para el canal HH de la imagen comprimida para
la pieza de la imagen 4.82 (b), al trabajar en el espacio HSB.

El grfico de pesos (Loading Plot) correspondiente para todas las


componentes del modelo construido se muestra en la Figura 4.90, donde
se puede comprobar cmo los canales que ms influyen sobre el modelo
son ahora los S y B del espacio HSB.

Loading Plot para las pc's del modelo estandarizado y validado


0.25

0.2

0.15

0.1

0.05

-0.05

-0.1

-0.15

-0.2

-0.25
0 50 100 150 200 250

Figura 4.90. Loading Plot correspondiente a las componentes principales del modelo
estandarizado construido mediante validacin cruzada.

Los resultados previos derivados tanto del modelo forzado como del
estandarizado construido mediante validacin cruzada, parecen apuntar al
canal S como el ms relacionado con el defecto de rayas. De acuerdo con

224
Captulo 4. MIA y SPC___________________________________________________

esta asuncin, se pas a estudiar por separado los diferentes canales HSB
de la imagen rayada de la Figura 4.82 (b), los cuales aparecen en la
Figura 4.91, separados mediante Corel Photo Paint.

En las imgenes de la Fig. 4.91 se puede observar cmo es el canal S el


que mejor describe el defecto de rayas, integrando de alguna manera la
informacin incluida en los canales del espacio RGB. De esta manera se
tienen dos argumentos para realizar el anlisis simplemente con el canal
S del espacio HSB. Desde un punto de vista tcnico aparecen los
resultados derivados de los diferentes modelos PCA construidos, los
cuales han apuntado al canal S como el ms relacionado con el defecto de
rayas. Desde un punto de vista intuitivo, la inspeccin visual de los
diferentes canales del espacio HSB, si bien este aspecto no debe ser
decisivo, ya que pueden haber defectos o caractersticas en las imgenes
que no se detecten mediante el ojo humano.

a) b) c)
Figura 4.91. Canales H (a), S (b) y B (c) para el canal HH de la imagen de la pieza 4.82
(b).

Mediante este razonamiento, se decidi analizar las imgenes rayadas a


partir nicamente del canal S del espacio HSB. Esto permite construir
estructuras de datos mucho ms sencillas, lo cual implica una mayor
rapidez a la hora de mostrar los resultados on-line.

Las Imgenes T2 y SCR que se muestran en la Figura 4.92 fueron


obtenidas utilizando un nivel de compresin, una amplitud de la ventana
de vecindad de 4 pxeles y el canal HH de la DWT correspondiente al
canal S del espacio HSB, sin centrar y sin escalar dado que no hay
ningn otro canal de color a analizar. Los aceptables resultados deberan

225
SPC mediante MIA____________________________________________________

estar asociados al hecho de que las ventanas sin rayas deben tener
intensidades de valores cercanas a cero con pequea variabilidad
(debemos estar hablando de ruido, puesto que analizamos el canal HH
del primer nivel de compresin); mientras que las ventanas con rayas
deben presentar zonas en las que la estructura de datos se rompe, ya que
hay una variacin de los niveles de intensidad que no se corresponde con
la estructura general, y adems dichos valores deben ser superiores a los
niveles a partir de los cuales se ha construido el modelo. Estos dos
razonamientos se ven apoyados por las Imgenes T2 y SCR de la Figura
4.92, donde se puede observar que la Imagen SCR detecta mejor en este
caso la raya.

a) b)

Figura 4.92. Imagen T2 (a) e Imagen SCR (b) obtenidas del modelo construido con el
canal HH de la imagen correspondiente al canal S del espacio HSB, Fig. 4.91 (b).

El hecho de que las rayas aparezcan mejor detectadas por la Imagen SCR
parece lgico desde un punto de vista terico, ya que las rayas son como
bordes que rompen la estructura de correlacin en la textura de la imagen
sin defectos de este tipo. Es decir, que este tipo de defecto no est ligado
a un cambio de intensidad en una determinada regin, pero manteniendo
la estructura espacial dentro de la misma, como sera el caso de un rea
sucia ya que, si ste fuera el caso, debera quedar mejor detectada por la
Imagen T2, como han mostrado los resultados correspondientes al
ejemplo del Tipo A.

226
Captulo 4. MIA y SPC___________________________________________________

En cualquier caso, se puede observar cmo el defecto tambin ha


quedado captado por parte de la Imagen T2, aunque no de una manera tan
clara como en el caso de la Imagen SCR. De todas formas, la deteccin
conseguida por la Imagen T2 de la Figura 4.84 (a) correspondiente al
espacio de color RGB tambin es buena, por lo que los valores anormales
de intensidad tambin deben resultar importantes en este tipo de defectos.

A modo de resumen, indicar que el estudio exploratorio previo es muy


importante a la hora de conseguir las mejores condiciones de trabajo que
permiten una estructura de datos los ms pequea posible, con el fin de
conseguir tiempos mnimos de computacin que permitan integrar estas
estrategias en procesos reales de produccin e inspeccin.

4.5 Comentarios y conclusiones

Las principales conclusiones de esta estrategia de deteccin y


localizacin de defectos inespecficos han sido las siguientes:

Se han presentado las Imgenes T2 y SCR, como grficos eficaces para


llevar a cabo una deteccin de los defectos presentes en una imagen,
independientemente de la naturaleza de las mismas, y del tipo de defecto
objeto de estudio.

Se ha visto la utilidad de las wavelets como herramientas de compresin


de la informacin y de eliminacin de ruido presente en las imgenes, si
bien en este caso el grado de compresin puede depender del problema
que se est analizando, y de las caractersticas de los defectos que se
pretendan localizar.

Se ha presentado en el ltimo ejemplo la posibilidad de buscar la


informacin de inters por medio del anlisis de otros espacios de color,
con el fin de simplificar la estructura de los datos en aquellos casos en los
que sea posible, para conseguir tiempos mnimos de computacin y
graficacin de las Imgenes T2 y SCR, permitiendo as la integracin de
esta estrategia en entornos reales de produccin.

227
SPC mediante MIA____________________________________________________

El estudio de los pesos para las distintas componentes principales en


conjuncin con las Imgenes T2 y SCR ha ayudado a determinar los
canales asociados a un determinado tipo de defecto, as como a conseguir
utilizar el mnimo de informacin posible que consigue maximizar la
comentada velocidad de presentacin de resultados.

La relacin de las waveletes con la textura, si se entiende sta como el


cambio de intensidades de cada canal de color dentro de cada escala
estudiada, ha permitido mejorar la deteccin de defectos inespecficos
por medio de la utilizacin del canal HH de la DWT.

Esta estrategia se puede aplicar tanto a partir de modelos 2-way como 3-


way, si bien la mayor velocidad de los primeros hace recomendable su
uso.

228
Captulo 4. MIA y SPC___________________________________________________

5 SELECCIN DE CARACTERSTICAS DE INTERS

La presente estrategia consiste en, a partir de una imagen que contiene


algn tipo de caracterstica o defecto que se desea estudiar o controlar,
crear un modelo para poder conocer en nuevas imgenes la cantidad y
localizacin de dicha caracterstica o defecto presente en las mismas.

Esto puede ser de utilidad en estudios de imgenes mdicas, para


encontrar la localizacin de tumores, y el tamao de los mismos, en
procesos industriales, para localizar defectos y determinar el grado de los
mismos en una pieza; o en estudios fitosanitarios siguiendo la misma
filosofa de localizacin y cuantificacin de zonas afectadas.

De esta manera, no se trata slo de un enfoque de control, sino tambin


de estudio de caractersticas y de establecimiento de zonas de control en
el espacio de las variables latentes, que posteriormente ayuden a localizar
determinados defectos o caractersticas, as como a cuantificarlos.

Para conseguir esto, lo primero que se debe hacer es crear un modelo


multivariante a partir de una imagen que contenga aquellas caractersticas
o defectos que se desea controlar, calculando los scores y las matrices de
pesos o loadings.

En la prctica, la deteccin de las zonas correspondientes a cada


caracterstica o defecto no es tan sencilla como podra parecer en un
principio. Hay recordar que determinadas caractersticas o defectos
pueden quedar bien definidas por direcciones que en un principio pueden
parecer poco relevantes para la informacin a nivel global, pero que
recogen una parte importante de una caracterstica o defecto concreto.

Por ello, es conveniente visualizar los scores o valores alcanzados por


cada pxel de la imagen en cada una de las direcciones principales, pero
no en el espacio latente del modelo, sino en representaciones grficas que
utilizan el espacio original de la imagen, denominadas Imgenes Score
(conocidas en el mbito del MIA como Score Images), y que se presentan
a continuacin.

229
SPC mediante MIA____________________________________________________

5.1 Visualizacin de la informacin

5.1.1 Imgenes Score

De forma anloga a como se han definido en la estrategia anterior de


deteccin y localizacin de defectos inespecficos las Imgenes T2 y SCR
asociadas a una imagen al proyectarla sobre un modelo, es posible
representar en el espacio de la imagen original los valores alcanzados por
cada pxel en cada una de las componentes principales del modelo, dando
lugar a lo que se denomina Imagen Score, que tienen el mismo tamao
que las imgenes de la escena, y contienen informacin ortogonal, es
decir, complementaria.

Estas matrices de scores pueden mostrarse como imgenes de niveles de


gris para cada componente latente, o bien como composiciones de color
RGB para tres componentes principales cualesquiera (Esbensen y Geladi,
1989). De esta forma puede determinarse si las componentes latentes
elegidas resaltan bien el defecto o caracterstica a controlar (Bharati,
2002). La Figura 4.93 muestra la imagen de una zona de una naranja
afectada por cochinilla (a), mientras que la (b) muestra un ejemplo de
una Imagen Score correspondiente a la primera componente principal de
dicha imagen, tras la aplicacin de un PCA.
Imagen de una naranja afectada por cochinilla

20

40

60

80

100

120

140

160

180

200
50 100 150 200 250

a) b)
Figura 4.93. Imagen original de una naranja afectada por cochinilla (a) y Score Image
de la primera componente principal de una imagen (b), tras la aplicacin de un PCA.

230
Captulo 4. MIA y SPC___________________________________________________

A la hora de almacenar este tipo de imgenes pueden aparecer diversos


problemas. El primero de ellos es que los valores calculados no tienen
por qu ser enteros como en la imagen original, lo que obliga a realizar
algn tipo de redondeo o truncamiento sobre los mismos, tal como se ha
hecho en la presente tesis.

El segundo problema, asociado a la representacin grfica por medio del


programa Matlab, es que los scores toman valores negativos. Como las
intensidades son todas positivas, es necesario cambiar estos valores
mediante la adicin de una constante lo suficientemente grande como
para hacer positivos los valores negativos. En este trabajo el problema se
ha solucionado sumando a cada score de cada componente de cada
imagen el valor mnimo correspondiente.

La ventaja de observar las Imgenes Score (que no son ms que


intensidades) en vez de las imgenes de la escena, radica en el hecho de
que los modelos multiway tienden a concentrar la informacin en unas
pocas imgenes, sobre todo si hay muchas variables.

Una vez determinadas las Imgenes Score que mejor definen un


determinado defecto o caracterstica de inters, el siguiente paso es ver
cmo se agrupan los pxeles asociados a dicho defecto o caracterstica en
el espacio latente definido por las componentes principales asociadas a
las Imgenes Score. Esto se realiza mediante representaciones grficas
denominadas Score Plots, que se explican en el siguiente apartado.

5.1.2 Score Plots: seleccin de caractersticas

Un Score Plot es una representacin bidimensional de los valores


alcanzados por los pxeles de la imagen sobre una pareja de componentes
principales.

En este grfico los pxeles con caractersticas similares en la imagen


original se sitan prcticamente en la misma posicin en el Score Plot,
por lo que muchos de ellos se superponen en el mismo punto. El grfico
proporciona diferentes intensidades y/o tonos segn la densidad de

231
SPC mediante MIA____________________________________________________

pxeles en cada zona. Se puede as construir una imagen que representa el


nmero de pxeles en cada punto del espacio de scores.

Los Score Plots dan una buena idea de las densidades de los pxeles y de
su localizacin en el espacio multivariante, permitiendo detectar, de una
manera sencilla, pxeles anmalos fuera de las regiones de alta densidad
(Geladi et al, 1992), as como las distintas agrupaciones de pxeles. De
esta manera, es posible estudiar propiedades, caractersticas o defectos
existentes en las imgenes, as como visualizar puntos anmalos,
gradientes y agrupaciones de pxeles.

Adems, si se conocen las caractersticas espaciales de un pxel de inters


(coordenadas en la imagen de la escena), y se conoce su proyeccin en el
espacio de los Score Plots (simplemente conociendo los valores
alcanzados por dicho pxel sobre las direcciones principales estudiadas),
se pueden conocer los pxeles que le son vecinos, y mediante su
seleccin, determinar dnde se sitan en la imagen de la escena.

Mediante esta tcnica se consigue una segmentacin multivariante de los


datos, a partir de la seleccin de aquellos pxeles pertenecientes a cada
una de las distintas agrupaciones, tal como se ilustra en el siguiente
apartado.

5.1.3 Seleccin de las caractersticas de inters

Una vez conocida la situacin de cada caracterstica o defecto de inters


en el nuevo espacio, el siguiente paso consiste en determinar su situacin
en el espacio original. Para ello, se utiliza la tcnica del masking,
consistente en seleccionar una determinada zona de un Score Plot
mediante un polgono o mscara (funcin proporcionada por el paquete
Matlab), de manera que todos los pxeles que hay bajo la mscara queden
seleccionados.

De esta manera es posible estudiar la severidad de los pxeles defectuosos


en funcin de los scores que alcancen, y de la cantidad que haya en una
determinada posicin o zona del Score Plot.

232
Captulo 4. MIA y SPC___________________________________________________

Una vez seleccionados los pxeles bajo la mscara, se llevan a sus


posiciones espaciales en la imagen original. As se consigue saber
dnde se sitan las distintas caractersticas o defectos, y cul es su rea
ocupada.

Cuando ya se ha estudiado suficientemente la imagen, y determinadas las


distintas zonas de las posibles combinaciones de Score Plots donde se
sitan las caractersticas o defectos de inters, el siguiente paso es
estudiar nuevas imgenes correspondientes

Para ello, y a partir de una nueva imagen a estudiar o controlar, se


calculan los nuevos scores de las componentes a partir de la proyeccin
de la misma sobre el espacio latente ya definido formado por las matrices
de cargas del modelo que contiene aquellas caractersticas que se desea
estudiar, y se representan aquellos Score Plots preseleccionados
anteriormente que van a concentrar mejor la informacin correspondiente
a dichas caractersticas.

Controlando el nmero de los pxeles situados bajo las mscaras, y la


densidad de pxeles en las mismas, se puede controlar y determinar la
severidad de las diferentes caractersticas o defectos en las nuevas
muestras.

Aparece entonces un problema adicional, ligado al hecho de que nuevas


imgenes pueden alcanzar distintos valores o scores en cada una de las
componentes principales, y por tanto tambin en aqullas ligadas a las
caractersticas de inters. Este hecho implica que, como los Score Plots
son simplemente la representacin de una matriz A ligada a parejas de
valores o scores de las componentes principales estudiadas, cuyas celdas
son el nmero de pxeles de la imagen que presentan las parejas de
valores (ti, tj), es necesario obtener siempre valores positivos de las
parejas (ti, tj).

Esto se puede conseguir restando a cada score de cada componente


principal el valor mnimo detectado a lo largo del estudio de varias
imgenes, o incluso un valor inferior, a fin de conseguir siempre valores
positivos. Este problema tambin ha sido tratado por Bharati (2002).

233
SPC mediante MIA____________________________________________________

A fin de controlar un defecto a partir de la cuantificacin del rea en que


se presenta en una imagen, hay que observar que un nmero mximo de
defectos por unidad de rea deber tener en cuenta el rea contenida en
cada pxel, para comprobar despus si la pieza se clasifica como buena o
mala.

rea/pxel= rea total/nmero de pxeles

Bharati y MacGregor (2000) sugieren que de esta forma se podra


obtener una medida ms objetiva de las caractersticas a estudiar en las
nuevas imgenes. Adems, se podran establecer lmites de tolerancia
sobre el mximo nmero de pxeles aceptables para cada caracterstica o
defecto de inters. Cuando se violasen estos lmites, la muestra en
cuestin podra ser investigada realzando los pxeles correspondientes
bajo las mscaras, para localizar espacialmente los defectos o
caractersticas superficiales.

La Figura 4.94 presenta el procedimiento a seguir para aplicar este


enfoque.

Aislamiento de la
caracterstica de inters
Imgenes
Score
X = ABT + E descriptoras
PCA del defecto
o
caracterstica

Score Plot. Score Plot.


Seleccin de Seleccin de la
los valores de misma zona de
los scores que las mismas
recogen el PCs
defecto o
caracterstica:
Masking Anuevo = XnuevoB

Imagen con
defecto o Xnuevo
caracterstica
de inters Aislamiento de la
caracterstica de inters
Nueva Imagen

Figura 4.94. Esquema del enfoque de Seleccin de las caractersticas de inters.

234
Captulo 4. MIA y SPC___________________________________________________

Por otro lado, mediante la comparacin de los Score Plots se puede hacer
un diagnstico de qu tipo de defecto o caracterstica existe en cada zona
de los mismos, ya que aparecern agrupaciones de pxeles en cada Score
Plot para cada tipo de defecto o caracterstica. De esta manera, se pueden
comparar con los Score Plots de cada tipo de caracterstica, y ver cules
son las agrupaciones que presenta la nueva imagen, y en qu grado.

Una posibilidad mencionada por Bharati (2002) es, en aquellos casos que
el defecto o caracterstica quede recogida por ms de una componente
principal, crear una mscara multidimensional (aunque tal vez sera
mejor definirla como un recinto multidimensional), que comprenda los
rangos de valores de scores asociados al defecto en cada componente
principal. De esta manera, la interseccin de todos los rangos definira el
recinto ligado al defecto. En cualquier caso, la estrategia de seleccin ya
consume bastante tiempo de por s, y el hecho de incorporar nuevas
restricciones empeora su aplicabilidad frente a la posible mejora que
podra alcanzarse.

Adems, la metodologa propuesta en esta tesis proporciona buenos


resultados, gracias a la graduacin en color facilitada por Matlab, que
ayuda bastante a definir el rango de valores asociados a un defecto o
caracterstica, y posibilita que el uso de slo dos componentes principales
sea suficiente para conseguir el objetivo perseguido.

A continuacin se exponen tres ejemplos de aplicacin de esta estrategia,


basada en los tres tipos de imgenes reales disponibles: naranjas,
cermicas y piedra artificial, mostrando la bondad de la misma.

5.2 Estudio sobre naranjas

Si se estudia, por ejemplo, una imagen de una naranja con cochinilla


como la que aparece en la Figura 4.95, se observa que las Imgenes
Score que mejor describen este defecto son las asociadas a la primera y
tercera componente principal, mostradas en la Figura 4.96.

235
SPC mediante MIA____________________________________________________

Figura 4.95. Imagen de una naranja afectada por cochinilla.

La primera componente describe bien la enfermedad. En este grfico se


observa cmo los valores de esta primera componente que mejor
describen la cochinilla son los que abarca el rango [-650,-100]. La otra
componente principal que mejor define la enfermedad es la tercera. En
este caso, los valores que capturan la cochinilla son los ms positivos y
los ms negativos. El rango aproximado de valores es el definido dentro
del intervalo [-200,-100] y [50,100].
Score numero 1 Score numero 3
-100 100

20 20
-200
50
40 40
-300

60 60
0
-400
80 80
Valor del score

Valor del score

-500
100 100 -50

120 -600 120

-100
140 140
-700

160 160
-800 -150

180 180

-900
-200
50 100 150 200 50 100 150 200

a) b)
Figura 4.96. Imgenes Score de la primera componente principal (a) y de la tercera
componente principal (b).

Se hace entonces necesario ver si estos valores se agrupan en el Score


Plot de las componentes 1 y 3, o si se trata de simplemente escoger los
valores indicados. Dicho grfico se presenta en la Figura 4.97.

236
Captulo 4. MIA y SPC___________________________________________________

Figura 4.97. Score Plot de las componentes 1 y 3.

En este grfico se puede comprobar que los rangos definidos se


corresponden con la zona en blanco, es decir, con aquello que no se
corresponde con las condiciones normales. Como ya se ha comentado,
con el objeto de poder representar los pxeles en estas nuevas
coordenadas, ha sido necesario sumar a todos ellos los valores mnimos
de cada direccin principal, ya que no es posible representar pxeles
situados en coordenadas negativas.

Seleccionando la zona indicada por los rangos, sin ms que sumar a los
mismos los valores absolutos de los mnimos de cada direccin principal,
es decir, 927 y 201 en este caso, se escogen aquellos pxeles que caen
dentro del rea en color rojo, tal como muestra la Figura 4.98.

Figura 4.98. Seleccin de los pxeles caractersticos del defecto.

237
SPC mediante MIA____________________________________________________

El hecho de elegir todo el rango de valores de la tercera componente


principal se debe a que la cochinilla es un defecto continuo, por lo que,
aunque son los valores extremos los que la caracterizan, tambin los
medio son necesarios a la hora de visualizarla de manera correcta.

Mediante esta seleccin se obtiene la representacin, en la Figura 4.99 de


los pxeles seleccionados sobre la imagen original para cada una de las
componentes principales escogidas.

a) b)

Figura 4.99. Imagen Score de los pxeles seleccionados, caractersticos del defecto, para
la 1 (a) y 3 (b) componentes principales.

Si se estudia ahora, y a partir de la informacin existente en la imagen


patrn, la enfermedad de la cochinilla en una nueva imagen como la que
se muestra en la Figura 4.100, ocurre lo siguiente.

Figura 4.100. Imagen de una nueva naranja con cochinilla.

238
Captulo 4. MIA y SPC___________________________________________________

Seleccionando la misma zona de las mismas componentes principales,


una vez llevado a cabo el proceso de alineacin, se obtiene el Score Plot
y la seleccin de pxeles en base a la mscara de la Figura 4.101.

Figura 4.101. Seleccin de los pxeles caractersticos del defecto.

Relocalizando los pxeles bajo la mscara en el espacio de la imagen, se


obtiene, para cada una de las dos componentes principales seleccionadas,
las Imgenes Score mostradas en la Figura 4.102.

a) b)

Figura 4.102. Imgenes Score de los pxeles seleccionados, caractersticos del defecto,
para la 1 (a) y 3 (b) componentes principales.

239
SPC mediante MIA____________________________________________________

5.3 Estudio sobre cermicas

Supngase que se llevan a cabo las mismas operaciones sobre una


cermica de la referencia, por ejemplo, Claro, como la mostrada en la
Figura 4.103.

Figura 4.103. Imagen de una cermica de la referencia Claro.

En este caso, se obtienen como direcciones de inters la segunda y la


tercera, cuyas imgenes de los scores son las que aparecen en la Figura
4.104.

a) b)

Figura 4.104. Imgenes Score de la 2 (a) y 3 (b) componentes principales.

240
Captulo 4. MIA y SPC___________________________________________________

Si se desea por ejemplo, obtener la imagen de los pxeles relacionados


con las zonas moteadas, asociados a valores bajos o elevados para estas
componentes, se debe seleccionar la zona exterior del Score Plot de las
componentes segunda y tercera, mostrado en la Figura 4.105.

Figura 4.105. Score Plot de las componentes 2 y 3.

De esta manera queda seleccionada la zona que aparece en azul en la


Figura 4.106.

Figura 4.106. Seleccin de los pxeles caractersticos de las picadas.

241
SPC mediante MIA____________________________________________________

Mediante esta seleccin, los pxeles relacionados con las zonas moteadas
quedan localizados como se muestra en las Figura 4.107, para cada una
de las componentes principales consideradas.

a) b)

Figura 4.107. Imgenes Score de los pxeles seleccionados, caractersticos de las zonas
moteadas, para la 2 (a) y 3 (b) componentes principales.

De esta manera, si se tiene determinada dicha zona de control como la


zona de puntos o pxeles anmalos, se puede establecer, simplemente
contando el nmero de pxeles, si la pieza se puede considerar aceptable
o no desde el punto de vista considerado.

Conviene hacer notar que esta estrategia se diferencia de la de Ajuste a


un modelo en que slo se incide en la diferencia respecto de unas
direcciones principales consideradas, y no respecto del total del modelo.

En este caso, la zona seleccionada ha supuesto 1719 pxeles sobre un


total de 9604, lo que supone un 17,90% de la zona estudiada. En funcin
de los lmites establecidos, definidos como el porcentaje mximo de
pxeles (o rea mxima de la pieza) que puede presentar zonas moteadas,
se considerara la pieza como aceptable o no aceptable.

242
Captulo 4. MIA y SPC___________________________________________________

5.4 Estudio sobre piedra artificial

En el caso del estudio de piedra artificial, ya se ha visto a lo largo de la


aplicacin de la estrategia anterior de localizacin de defectos
inespecficos cmo haba dos tipos bsicos: reas sucias y rayas.

Mediante la aplicacin de esta estrategia, se va a comprobar cmo es


posible controlar y aislar el defecto a monitorizar, una vez construido el
modelo correspondiente y seleccionadas las componentes principales y
los rangos de scores relacionados con el defecto de inters. La estrategia
ha sido aplicada sobre una pieza del Tipo A, mostrada en la Figura 4.108.

Figura 4.108. Imagen de una pieza del Tipo A.

Cuando se tiene una imagen con cualquier tipo de defecto conocido a


priori o caracterstica a monitorizar, es posible construir un modelo
multivariante que resuma toda la informacin, incluyendo dicho defecto
o caracterstica. La imagen de la Figura 4.108, correspondiente al Tipo A,
muestra una serie de picadas que, aunque formen parte de dicho Tipo de
pieza, podran ser controladas con el fin de monitorizar el nmero de
picadas que aparecen en un determinado rea.

Al construir un modelo multivariante a partir de la imagen de la Figura


4.108 y estudiar las distintas Imgenes Score, tal como se ha indicado al
explicar la estrategia, se ha determinado que las componentes que mejor
caracterizan las picadas en este caso son la primera y la tercera, como se
muestra en la Figura 4.109. En el caso de la primera componente
principal, se puede comprobar cmo las picadas aparecen asociadas a los
valores o scores ms elevados de la componente, mientras que en el caso

243
SPC mediante MIA____________________________________________________

de la tercera componente, son los scores ms positivos y ms negativos


los que definen las picadas.
Score numero 1 Score numero 3
15 10

20 20
10 5

40 40

5 0

Valor del score


Valor del score

60 60

0 -5
80 80

-5 100 -10
100

120 120
-10
-15
20 40 60 80 100 120 20 40 60 80 100 120

a) b)
Figura 4.109. Imgenes Score para las componentes principales 1 (a) y 3 (b).

El Score Plot asociado es entonces el que se muestra en la Figura 4.110


(a), mientras que la Figura 4.110 (b) presenta la mscara que selecciona
los pxeles asociados a las picadas. Como se puede comprobar, se trata de
los valores ms elevados para la primera componente principal, mientras
que para la tercera, dado que las picadas son continuas, es necesario
seleccionar todo el rango de valores posibles.

b)
a)

Figura 4.110. Score Plot para las componentes principales de inters, con (a) y sin (b) la
aplicacin de la mscara de seleccin de los pxeles asociados a las picadas.

244
Captulo 4. MIA y SPC___________________________________________________

Una vez seleccionados y localizados los pxeles bajo la mscara, es


posible reubicarlos en la imagen original, detectando no slo aquellas
picadas ya detectadas a priori, sino tambin aqullas que pudieran no
hacer sido detectadas desde un primer momento, convirtiendo el proceso
de cuantificacin del nmero de picadas en una tarea bastante sencilla, y
permitiendo su monitorizacin de manera consistente.

La Figura 4.111 presenta la localizacin espacial de los pxeles


seleccionados bajo la mscara de inters en las Imgenes Score
correspondientes.
Score Image 1 Score Image 3
14 10

8
20 12 20
6

40 10 4
40
2
Valor del score

Valor del score


8
60 60 0

6 -2
80
80
-4
4
100 -6
100
2 -8
120 -10
120
0
20 40 60 80 100 120 -12
20 40 60 80 100 120

a) b)

Figura 4.111. Localizacin aislada de las picadas en las Imgenes Score de la 1 (a) y 3
(b) componentes principales.

Seleccinese ahora una nueva imagen, tal como la mostrada en la Figura


4.112, que presenta adems un defecto de rea sucia.

Figura 4.112. Imagen de la pieza con defecto de rea sucia del Tipo A.

245
SPC mediante MIA____________________________________________________

Al proyectar esta nueva estructura de datos sobre el modelo creado


previamente, el nuevo Score Plot es el que se muestra en la Figura 4.113,
con y sin aplicacin de la mscara, teniendo en cuenta que se han
alineado los valores correspondientes de los scores en cada una de las
componentes principales.

a) b)
Figura 113. Score Plots para las componentes principales 1 y 3, antes (a) y despus (b)
de aplicar la mscara.

As, mediante la seleccin de la misma zona del Score Plot, los nuevos
pxeles aislados son los que se muestran en las Imgenes Score de la
Figura 114, tanto para la 1 como para la 3 componente principal.
Score Image 1 Score Image 3
20 10

8
18
20 20
6
16
4
40 14 40
2
Valor del score
Valor del score

12
0
60 60
10 -2

80 8 80 -4

6 -6
100 100
-8
4
-10
120 2 120
-12
0
20 40 60 80 100 120 20 40 60 80 100 120

a) b)
Figura 114. Localizacin aislada de los pxeles de inters (picadas) en la 1 (a) y 3 (b)
componentes principales.

246
Captulo 4. MIA y SPC___________________________________________________

Hay que indicar que, dado que el objetivo era detectar las picadas,
caracterstica ligada a un tamao de rea pequeo, se utiliz un amplitud
de ventana de vecindad de 1 pxel. Este hecho ha permitido, no slo
aislar de manera efectiva las picadas de inters, sino tambin descartar el
defecto de rea sucia, cuya localizacin no era el objetivo del presente
estudio.

Otro ejemplo interesante es la deteccin de rayas, tal como se mostr en


el apartado correspondiente a la estrategia de localizacin de defectos
inespecficos.

Una alternativa posible es aplicar la presente estrategia a una imagen con


rayas, con el fin de determinar aquellas componentes asociadas al
fenmeno de inters, es decir, encontrar las componentes principales que
mejor describen el defecto de rayas.

Figura 4.115. Imagen de una pieza del Tipo C con defecto de rayas.

Cuando se construye un modelo PCA basado en la imagen de la Figura


4.115, las componentes principales que mejor describen el defecto de
rayas son la tercera y la cuarta componentes, cuyos valores o scores
asociados son los ms elevados y los ms bajos en cada una de las dos
componentes principales comentadas, tal como se muestra en las
Imgenes Score de la Figura 116.

247
SPC mediante MIA____________________________________________________

Score Image 3 Score Image 4


600 600

20 400 20 400

40 200 200
40
Valor del score

Valor del score


0 0
60 60

-200 -200
80 80

-400 -400
100 100

-600
-600
120 120
20 40 60 80 100 120 20 40 60 80 100 120

a) b)
Figura 116. Imgenes Score para las componentes principales 3 (a) y 4 (b).

Como los scores asociados a las rayas son aqullos que podran verse
como valores anmalos, la mscara en este caso podra definirse como se
muestra en la Figura 117 (b), rodeando la zona central del Score Plot
asociado a las componentes principales 3 y 4.

a) b)
Figura 117. Score Plots para las componentes principales 3 y 4, antes (a) y despus (b)
de aplicar la mscara.

Finalmente, la Figura 118 muestra las Imgenes Score de las


componentes principales 3 y 4 una vez los pxeles de inters han sido
aislados. Se puede observar cmo la raya queda detectada en la imagen,
si bien con algunos pxeles de ms, asociados a los valores extremos en
esas dos componentes principales.

248
Captulo 4. MIA y SPC___________________________________________________

Score Image 3 Score Image 4


600 600

20 400 20 400

Valor del score 40 200 40 200

Valor del score


60 0 60 0

80 80 -200
-200

100 100 -400


-400

120 120
-600 -600

20 40 60 80 100 120 20 40 60 80 100 120

a) b)
Figura 118. Localizacin aislada de los pxeles de inters (rayas) en la 3 (a) y 4 (b)
componentes principales.

Si se escoge ahora, por ejemplo, la imagen de la Figura 4.119, donde


aparece otra imagen de la referencia Tipo C, y se proyecta sobre el
espacio latente creado a partir de la Imagen de la Figura 4.115, se obtiene
el Score Plot de la Figura 4.120 (a), para las componentes 3 y 4.

Figura 4.119. Imagen de la pieza Tipo C con raya.

Mediante este proceso de seleccin, aparecen aislados los pxeles bajo la


mscara, de la manera en que se muestra en la Figura 4.121, con la raya
detectada, si bien algo confundida con otros pxeles que muestran valores
extremos para las componentes estudiadas.

249
SPC mediante MIA____________________________________________________

Score Plot PC's 3 vs 4 Score Plot PC's 3 vs 4


2.5 2.5
1400 1400

1200 1200
2 2

1000 1000

800
PC 3

800

PC 3
1.5 1.5

600 600

400 1 400 1

200 200

0.5 0.5
200 400 600 800 1000 1200 1400 200 400 600 800 1000 1200 1400
PC 4
PC 4

a) b)
Figura 4.120. Score Plots de las componentes 3 y 4 para la imagen de la Figura 4.119
al proyectarla sobre el modelo construido a partir de la pieza de la Figura 4.115, antes
(a) y despus (b) de la aplicacin de la mscara.

Score Image 3 Score Image 4


600 600

20 400 20
400

40 200 40
200
Valor del score

Valor del score

60 0 60
0

80 -200 80
-200

100 -400 100


-400

120 -600 120

-600
20 40 60 80 100 120 20 40 60 80 100 120

a) b)
Figura 121. Localizacin aislada de los pxeles de inters (rayas) en la 3 (a) y 4 (b)
componentes principales.

5.5 Conclusiones

En el presente apartado se ha ilustrado mediante la aplicacin a diversos


ejemplos de imgenes reales la utilidad de esta estrategia a la hora de
extraer caractersticas de inters existentes en las mismas. Esta
metodologa, basada en modelos 2-way, no es nueva, y se ha ilustrado a

250
Captulo 4. MIA y SPC___________________________________________________

fin de comprobar su capacidad de deteccin y su utilidad en procesos en


tiempo real.

Se ha podido comprobar cmo la extraccin es bastante buena, siendo


incluso capaz de distinguir entre diferentes tipos de defectos o
caractersticas, como en el caso de la piedra artificial con sus picadas
propias y un defecto de rea sucia.

Sin embargo, esta estrategia consume mucho tiempo a la hora de extraer


los pxeles bajo la mscara, por lo que su aplicacin en tiempo real es
todava limitada. Es necesario investigar los posibles resultados con
imgenes comprimidas a un mayor nivel de escala, y buscando espacios
de color que permitan asociar el defecto o caracterstica a uno solo de
ellos.

La principal aportacin ha sido la utilizacin integrada de la informacin


espacial y espectral con diferentes espacios de color y la ampliacin de la
estrategia a los modelos 3-way, as como la comprobacin del elevado
tiempo asociado (horas en aquellos casos en que se busca el valor sin
redondear de los pxeles en las componentes principales). En este
sentido, se ha desarrollado un cdigo propio que permite aplicar la
estrategia por medio del modelo Tucker3, as como disminuir el tamao
de las estructuras de datos asociados a las imgenes y disminuir los
tiempos de bsqueda.

Para finalizar, parece conveniente, en aquellos casos en que no est muy


claro el tipo de defecto a controlar, emplear la estrategia de deteccin y
localizacin, basada en las Imgenes T2 y SCR desarrolladas, debido a su
buena capacidad de deteccin y, sobre todo, al menor tiempo de
computacin necesario para presentar los resultados.

251
Captulo 5. Conclusiones y lneas futuras___________________________________

Captulo 5. Conclusiones y lneas futuras

1 ASPECTOS DESARROLLADOS Y APORTACIONES

La presente tesis ha estudiado el problema del control estadstico de


calidad mediante anlisis multivariante de imgenes, a nivel textural y
con imgenes en color, integrando ambos tipos de informacin para crear
modelos de control.

Para ello, se ha utilizado y ampliado la tcnica de desplazamiento de


imgenes propuesta por Bharati y MacGregor (2000), pudindose elegir
el tamao de ventana deseado, sin tener que limitarse a los pxeles
inmediatamente vecinos.

La estructura fsica 4D de los datos asociados a las imgenes, en aquellos


casos en los que se ha integrado la informacin de carcter espectral con
la de carcter textural resulta en una estructura interna 3D una vez
desplegadas las imgenes a partir de la filosofa MIA (Multivariate Image
Analysis), la cual despliega los pxeles de cada canal de color de una
imagen en una sola columna. El hecho de disponer de una gran cantidad
de datos asociados a las imgenes en una estructura 3D ha posibilitado su
anlisis por medio de diferentes modelos multivariantes, tales como los
2-way basados en la tcnica de desplegado manteniendo constante el
modo de las muestras, compuestas por los pxeles de las imgenes; as
como por medio de modelo N-way, los cuales analizan directamente la
estructura geomtrica o interna de los datos, 3-way en este caso.

Los modelos utilizados han sido el Unfold-PCA y Unfold-PLS en el caso


de los modelos 2-way, y Tucker3 y N-PLS en cuanto a los modelos N-
way. La manera en que las imgenes pueden ser estudiadas por los
modelos multivariantes y el nombre a aplicar en cada caso ha dado lugar

253
SPC mediante MIA____________________________________________________

a una discusin que pretende integrar todos los mtodos de anlisis bajo
un mismo marco conceptual relativo al anlisis de imgenes mediante
modelos multivariante, ya sean 2-way o N-way.

Una vez determinada la manera de modelizar la informacin existente en


una imagen, se ha hecho necesario, por restricciones computacionales y
de memoria, emplear wavelets como herramienta de compresin eficiente
de los datos, y se ha dejado evidencia de su gran potencial a la hora de
caracterizar la informacin textural contenida en las imgenes.

La aplicacin de modelos de control estadstico de procesos a imgenes


multivariantes deriva en la aplicacin de tres estrategias diferentes, como
son la clasificacin automtica, la deteccin de defectos inespecficos, y
la deteccin y monitorizacin de defectos especficos.

1.1 Clasificacin automtica

Para la clasificacin automtica se han empleado diferentes enfoques, en


funcin del objetivo perseguido: si el objetivo principal es controlar una
determinada lnea de produccin, o bien determinar la pertenencia de una
determinada pieza a una clase en concreto, el enfoque adecuado es el de
Ajuste a un modelo; mientras que si se trata de establecer la pertenencia
entre un determinado nmero de clases posibles, ya sea durante un
proceso de fabricacin o de inspeccin, existen dos enfoques alternativos
a aplicar, como son SIMCA o PLS-DA.

La gran cantidad de factores que pueden influir a la hora de maximizar el


porcentaje de acierto de cada uno de estos enfoques (tipo de problema o
de modelo de produccin a controlar, nivel de compresin, tipo de
wavelet utilizado, centrado previo o no de cada canal de color de la
imagen, modelo multivariante, tipo de preprocesamiento de los datos,
amplitud de la ventana de vecindad, etc.), ha hecho necesario la
utilizacin de un diseo de experimentos, con el fin de determinar la
significacin de los factores de entrada y las condiciones ptimas
operativas de los factores cuyo efecto ha resultado significativo sobre el
porcentaje de acierto en la clasificacin por parte de cada uno de los
enfoques empleados.

254
Captulo 5. Conclusiones y lneas futuras___________________________________

Se ha propuesto el Diseo de Experimentos en conjuncin con el anlisis


de los resultados mediante un modelo de Regresin Logstica como una
metodologa eficiente a la hora de conocer los niveles ptimos de proceso
y de determinacin de los factores de entrada significativos en cada tipo
de problema estudiado.

Los resultados obtenidos han puesto de manifiesto que la significacin y


los niveles a emplear de los factores estudiados depende del problema
que se est analizando en cada caso (del tipo de imagen), as como del
enfoque utilizado, de lo cual se deriva que la metodologa propuesta es de
utilidad a la hora de optimizar el porcentaje de acierto en la clasificacin
en diferentes problemas estudiados.

Se ha podido comprobar cmo los modelos N-way consumen ms


memoria y emplean un tiempo bastante mayor que los 2-way en la
realizacin de los clculos. Esto es coherente con los resultados de
Gurden et al. (2003).

Adems, la integracin de los dos tipos de informacin utilizados en el


anlisis de imgenes para su estudio mediante modelos de anlisis
estadstico multivariante: informacin espectral e informacin espacial,
ha demostrado proporcionar mejores resultados que si slo se emplea la
informacin de carcter espectral, informacin utilizada de manera
tradicional por el MIA.

Mediante dicha integracin se ha logrado un nivel satisfactorio de acierto


en la clasificacin para los distintos enfoques empleados. Asimismo, se
ha comprobado la mejora de los niveles predichos de clasificacin, as
como la mayor fiabilidad de los modelos de prediccin de acierto en la
clasificacin al emplear modelos que integran la informacin de tipo
espectral y la de tipo espacial frente a aqullos creados nicamente con
informacin de carcter espectral.

255
SPC mediante MIA____________________________________________________

1.2 Deteccin y localizacin de defectos inespecficos

Otra estrategia posible es la relacionada con la deteccin de defectos de


cualquier tipo cuando se fabrica o inspecciona una pieza. Esta estrategia
no debe verse como una alternativa excluyente de la anterior, sino que
ambas pueden aplicarse a la vez sobre cada pieza que se fabrica o
inspecciona. El valor aadido de esta estrategia es que no slo permite
conocer el porcentaje de pxeles de una pieza que superan los lmites
establecidos, sino que tambin consigue localizar y aislar los mismos en
el espacio original de la imagen, consiguiendo as determinar si la
distribucin espacial de los pxeles es aleatoria o constituye algn tipo de
defecto, independientemente de si el porcentaje de pxeles por encima de
lmites supere o no el mximo determinado a partir de la imagen patrn.

Con el fin de localizar los defectos, caractersticas y, en definitiva,


cualquier conjunto de pxeles que no se ajusten a un modelo, se han
desarrollado dos grficos basados en la localizacin espacial de los
pxeles con valores de los estadsticos T2-Hotelling y SCR que superan el
umbral establecido por los pxeles correspondientes, a las que se ha
denominado Imgenes T2 e Imgenes SCR, respectivamente.

Estos grficos se han aplicado sobre distintos tipos de imgenes: tres


reales, correspondientes a imgenes de ctricos, de cermicas y de piedra
artificial; y uno ficticio, correspondiente a una simulacin de imgenes
de acero.

La dificultad de detectar los defectos relacionados con la deteccin de


rayas en piezas de piedra artificial, ha llevado a la utilizacin de otros
espacios de color y de otros canales de detalle de las wavelets,
mostrndose la utilidad de estas acciones a la hora de reducir el tamao
de las estructuras de datos, aspecto fundamental para conseguir
minimizar los tiempos de computacin y de realizacin de los grficos de
las Imgenes T2 y SCR.

Los dos grficos propuestos se muestran como una herramienta muy


potente a la hora de detectar los distintos tipos de defectos, permitiendo
adems efectuar diferentes interpretaciones, en funcin de que las

256
Captulo 5. Conclusiones y lneas futuras___________________________________

detecciones se lleven a cabo por parte de la Imagen T2, de la Imagen SCR


o, de ambas a la vez.

1.3 Seleccin de caractersticas de inters

Los mtodos de seleccin de caractersticas permiten localizar y controlar


la cantidad de pxeles de una imagen que contiene una caracterstica o
defecto de inters, as como, a partir de la determinacin de las
componentes o direcciones principales que condensan la informacin
relativa a dicha caracterstica o defecto, localizar en nuevas imgenes la
posible presencia de la mis vbma, y controlar el grado en que sta se
produce, con el fin de adoptar las decisiones oportunas respecto a la pieza
asociada a la imagen.

La aportacin de la presente tesis a esta estrategia ha sido la ampliacin


del estudio por medio de modelos N-way a partir del modelo Tucker3, si
bien las diferencias en los resultados obtenidos no han sido importantes,
prefiriendo los modelos 2-way por su menor coste computacional y su
aplicabilidad a imgenes basadas en un nico canal de color (v.g.
imgenes en escala de grises).

Aunque el procedimiento en s no constituye una nueva aportacin, se ha


profundizado en su aplicabilidad, estudiando los problemas relativos al
tiempo de computacin necesario para visualizar los defectos o
caractersticas de inters, y la necesidad de comprimir al mximo la
informacin presente en las imgenes. As, se ha podido constatar que, si
bien la estrategia ha funcionado bien en los tres tipos de imgenes
analizados, los elevados tiempos de computacin asociados impiden su
aplicacin, al menos de momento, al control de procesos en tiempo real.

1.4 Cdigo propio

Finalmente, indicar que se ha desarrollado un cdigo propio, en


conjuncin con el ya existente (PLS_Toolbox, N-way Toolbox, Wavelab
Toolbox), basado en Matlab, con el fin de desarrollar todos los enfoques
propuestos y los grficos presentados.

257
SPC mediante MIA____________________________________________________

2 LNEAS DE INVESTIGACIN ABIERTAS

La amplitud y relativa novedad de las tcnicas presentadas, sobre todo en


cuanto a la integracin de las informaciones de tipo espectral y espacial,
deja multitud de campos abiertos. La gran cantidad de lneas de
investigacin abiertas refleja el trabajo que queda por hacer, y la
posibilidad de desarrollar toda una lnea asociada al anlisis multivariante
de imgenes. A continuacin se expone cules parecen ser las ms
importantes, distinguiendo entre aqullas que se presentan desde un
punto de vista ms terico o metodolgico, y aqullas caracterizadas por
su mayor orientacin a la aplicacin.

Desde un punto de vista metodolgico, las principales lneas de


investigacin abiertas son:

1. Estudio de la capacidad de anlisis textural de las wavelets,


utilizando los coeficientes asociados a las imgenes de detalle en
cada escala como caracterizadores de la textura de la imagen. sta
parece erigirse como una de las lneas de trabajo ms importantes
derivadas de la presente tesis, lo cual har necesario una mayor
profundizacin en el estudio de estas herramientas.

2. Bsqueda de espacios de color que permitan comprimir la


informacin de inters en el menor nmero de canales posible, as
como la compresin de la informacin derivada de las imgenes
de manera eficiente (wavelets, aplicacin del cdigo propio
desarrollado para simplificar la resolucin de los scores, etc.), con
el fin de reducir los tiempos de computacin. Para ello, se plantea
el anlisis de espacios alternativos al RGB, tales como los CIE-
Lab y CIE-Luv, o el HSI o HSB.

3. Desarrollo de grficos p en los enfoques de clasificacin, tanto


para el estadstico T2-Hotelling como para SCR, con el fin de
mejorar la base estadstica de los porcentajes de pxeles mximos
por encima de lmites establecidos.

258
Captulo 5. Conclusiones y lneas futuras___________________________________

4. Estudio de la estrategia inferencial del anlisis multivariante de


imgenes, para poder determinar la edad, estado de avance de una
enfermedad, grado de erosin de fachadas y/o pinturas, etc. Para
ello es necesario disponer de imgenes que permitan dicho
estudio, lo cual ha hecho imposible su presentacin en esta tesis.

5. Estudio con un mayor grado de detalle de tcnicas ms clsicas


del anlisis de texturas en conjuncin y en comparacin con el
anlisis multivariante de imgenes. Asimismo, se plantea el
estudio de la informacin existente en las componentes
principales de los distintos anlisis llevados a cabo, para poder
encontrar las distancias y direcciones que caracterizan cada
textura. Tambin se pretende comparar la posible ventaja de los
modelos N-way frente a los 2-way, a travs de la inspeccin de los
diferentes loadings de las distintas componentes de los diferentes
modos. Utilizacin de los grficos de contribucin y de la
contribucin global media de las variables.

6. Inclusin de nuevos modos o direcciones de variacin natural de


los datos, tales como tiempo, tipo de imagen (como un modo
ms), etc.

7. Mejora de la informacin de partida para la creacin de los


modelos, mediante una correcta asignacin previa de los pxeles a
las distintas clases, caractersticas o enfermedades existentes en
las imgenes.

8. Estudio de la propuesta de Bharati acerca de la aplicacin del


PLS-DA con fines de deteccin de caractersticas predefinidas, a
fin de comprobar su bondad en trminos tanto de capacidad de
deteccin como de velocidad en la presentacin de los resultados,
en comparacin con la estrategia de seleccin de caractersticas.

9. Desarrollo de un cdigo Matlab que permita, en la estrategia de


seleccin de caractersticas, automatizar el proceso de alineacin
en el masking, con el fin de exportarlo a entornos industriales, al
menos a nivel de laboratorio (off-line).

259
SPC mediante MIA____________________________________________________

10. Estudio de la influencia de las condiciones de iluminacin sobre


los resultados de clasificacin obtenidos, as como sobre el
control de procesos on-line, donde dichas condiciones pueden
variar en mayor grado que en un laboratorio de clasificacin.

11. Estudio del beneficio derivado de la utilizacin de cmaras


multiespectrales y la mayor cantidad de datos proporcionados por
las mismas frente al coste que dichas cmaras llevan asociado.

A nivel de aplicacin, las principales lneas futuras derivadas del presente


trabajo son:

12. Aplicacin conjunta de las wavelets junto con una posterior


construccin de la matriz de varianzas-covarianzas a las
estructuras resultantes. Es decir, para cada imagen desplegada en
cada canal de color, de dimensiones I=n1n2 J pxeles de la
ventana de vecindad, se calcula la matriz de varianzas-
covarianzas, resultando en una estructura de dimensiones JJ.
Apilando esta estructura para los diferentes canales de color,
resulta una nueva estructura 3-way que podra ser analizada
mediante PCA o PLS, con un fin clasificatorio.

13. Estudio de imgenes de diferente tamao o diferente nmero de


canales, ventanas o variables de textura, etc.

14. Aplicacin de estas tcnicas al anlisis y clasificacin de


tonalidades en cermicas, aspecto muy tratado dentro del mundo
de la visin artificial, as como su comparacin con otras tcnicas
ms propias del reconocimiento de patrones, a partir de
colecciones de imgenes tales como las Brodatz y de los
resultados obtenidos en diversos trabajos.

15. Aplicacin de las estrategias de SPC mediante MIA desarrolladas


en esta tesis a otros procesos industriales como hornos de
fundicin, procesos de polimerizacin, combustin de motores,
as como a otros mbitos como el diagnstico mdico a travs de
imgenes.

260
Referencias Bibliogrficas________________________________________________

Referencias Bibliogrficas

Acebrn, F.; Lpez, F.; Valiente, J.M.; Navarro, J.R. (2002) Surface
defect detection on fixed pattern ceramic tiles, Procedings of the
Second IASTED International Conference on Visualization, imaging,
and imade processing, ISBN: 0889863543, 35-40.

Albregsten, F. (1995) Statistical texture measures computed from


gray level coocurrence matrices. Technical Note, Deparment of
Informatics, Universtity of Oslo, Norway.

Alsberg, B.K., Woodward, A.M., Kell, D. B. (1997) An introduction


to wavelets transforms for chemometricians, Chemometrics and
Intelligent Laboratory Systems 37, 215-239.

Andersson, C.A.; Bro, R. (2000) The N-way Toolbox for MATLAB,


Chemometrics and Intelligent Laboratory Systems 52, 1-4.

Atkinson, A.C.; Donev, A.N. (1992) Optimum Experimental Designs.


Oxford University Press. New York.

Baxes, G.A. (1994) Digital Image Processing: Principles and


Applications, John Wiley & Sons, NY.

Benito, M.; Pea, D. (2003) Statistical Methods in Image Retrieval,


27 Congreso Nacional de Estadstica e Investigacin Operativa, 394-
405.

Bharati, M.H., Jay Liu, J., MacGregor, J.F. (2004) Image texture
analysis: methods and comparisons, Chemometrics and Intelligent
Laboratory Systems 72, 57-71.

261
SPC mediante MIA____________________________________________________

Bharati, M.H.; MacGregor, J.F.; Tropper, W. (2003) Softwood


Lumber Grading through On-line Multivariate Image Analysis
Techniques, Industrial Engineering Chemical Research 42, 5345-
5353.

Bharati, M.H. (2002) Multivariate Image Analysis and Regression for


Industrial Process Monitoring and Product Quality Control, Ph.D.
Thesis, McMaster Univesity, Hamilton (Ontario), Canada.

Bharati, M. H.; MacGregor, J.F. (2000) Texture analysis of images


using Principal Component Analysis, SPIE/Photonics Conference on
Process Imaging for Automatic Control, Boston.

Bharati, M.H.; MacGregor, J.F. (1998) Multivariate Image Analysis


for process monitoring and control, Industrial Engineering and
Chemical Research, 37, 4715-4724.

Blasco, J. (2001) Concepcin de un sistema de visin artificial


multiespectral para la deteccin e identificacin de daos en ctricos,
Tesis Doctoral. Universidad Politcnica de Valencia, Valencia,
Espaa.

Boukouvalas, C.; DeNatale, F.; DeToni, G.; Kittler, J.; Marik, R.;
Mirmehdi, M.; Petrou, M. (1998) Automatic system for surface
inspection and sorting of tiles, Journal of Materials Processing
Technology 82, 179-188.

Boukouvalas, C.; Kittler, J.; Marik, R.; Petrou, M. (1997) Automatic


Colour Grading of Ceramic Tiles using Computer Vision, IEEE
Transactions on Industrial Electronics 44, 1, 132-135.

Bovik, A.D.; Clark, M (1990) Multichannel Texture Analysis Using


Localizaed Spatial Filters IEEE Transactions on pattern analysis and
machine intelligence 12, 1, 55-73.

Bro, R.; Smilde, A. (2003) Centring and Scaling in Component


Analysis, Jounal of Chemometrics 17, 16-33.

262
Referencias Bibliogrficas________________________________________________

Bro, R. (1998) Multiway Analysis in the Food Industry, PhD Thesis.


Royal Veterinary and Agricultural University, Copenhagen,
Denmark.

Bro, R. (1997) PARAFAC. Tutorial and applications, Chemometrics


and Intelligent Laboratory Systems 38, 149-171.

Bro, R, (1996) Multilinear Calibration. Multilinear PLS, Journal of


Chemometrics 10, 47-61.

Burnham, A.J.; Viveros, R.; MacGregor, J.F. (1996) Frameworks for


Latent Variable Multivariate Regression, Journal of Chemometrics
10, 31-45.

Carroll, J.D. & Chang, J. (1970) Analysis of individual differences in


multidimensional scaling via an N-way generalization of Eckhart-
Young decomposition, Psychometrika 35, 283-319.

Chetverikov, D.; Hanbury, A. (2002) Finding defects in texture using


regularity and local orientation, Pattern Recognition 35, 2165-2180.

Christensen, R. (1997) Log-Linear Models and Logistic Regression


(2nd Edition). Springer-Verlag New York, Inc.

Clausi, D.A.; Jernigan, M.E. (2000) Designing Gabor filters for


optimal texture separability, Pattern Recognition 33, 1835-1849.

Conners, R.W.; Harlow, C.A. (1980) A theoretical comparison of


texture algorithms, IEEE Transactions on Pattern Analysis and
Machine Intelligence, PAMI 2 (3), 204-222

Courcoux, P.; Devaux, M.F.; Bouchet, B. (2002) Simultaneous


decomposition of multivariate images using three-way data analysis.
Application to the comparison of cereal grains by confocal laser
scannning microscopy, Chemometrics and Intelligent Laboratory
Systems 62, 103-113.

263
SPC mediante MIA____________________________________________________

De Jong, S. (1992) SIMPLS: an alternative approach to partial least


squares regression, Chemometrics and Intelligent Laboratory Systems
18, 251-263.

Ekstrom, M.P. (1984) Digital Image Processing Techniques,


Academic Press Inc., FL.

Esbensen, K.; Lied, T. (1999) PLS as multiple-alternative


preprocessing selector. Examples from industrial/technological image
analysis, Les methodes PLS. Symposium International PLS99. ISBN:
2-906711-45-4, 21-39.

Esbensen, K.; Geladi, P.; Grahn, H.F. (1992) Strategies for


multivariate image regression, Chemometrics and Intelligent
Laboratory Systems, 14, 357-374.

Esbensen, K.; Geladi, P. (1989) Strategy of Multivariate Image


Analysis, Chemometrics and Intelligent Laboratory Systems 7, 67-86.

Esbensen, K.; Wold, S.; Geladi, P. (1988) Relationships between


higher-order data array configurations and problem formulations in
multivariate data analysis, Journal of Chemometrics 3, 33-48

Fioravanti, S.; Fioravanti, R.; DeNatale, F.; Marik, R.; Mirmehdi, M.;
Kittler, J.; Petrou, M. (1995) Spectral and Rank order approaches to
Texture Analysis, European Transactions on Telecomunications 6,
287-299.

Foucherot, I.; Gouton, P.; Devaux, J.C.; Truchetet, F. (2004) New


methods for analysing colour texture based on the Karhunen-Loeve
transform and quantification, Pattern Recognition 37, 1661-1674.

Frank, I.E.; Friedman, J.H. (1993) A Statistical View of Some


Chemometrics Regression Tools, Technometrics 36, 2, 109-148.

Geladi, P.; Forsstrm, J. (2002) Monitoring of a bacht organic


synthesis by near infrared spectroscopy: modeling and interpretation
of three-way data, Journal of Chemometrics 16, 329-338.

264
Referencias Bibliogrficas________________________________________________

Geladi (1992) Some special topics in multivariate image analysis,


Chemometrics and Intelligent Laboratory Systems, 14, 375-390.

Geladi, P.; Grahn, H. (1996) Multivariate Image Analysis. Ed. John


Wiley & Sons Ltd. Chichester, England.

Geladi, P.; Bengston, E.; Esbensen, K.; Grahn, H. (1992) Image


Analysis in Chemistry. I. Properties of Images, Graylevel Operations,
the Multivariate Image, Trends in Analytical Chemistry 11, 1, 41-53.

Geladi, P.; Grahn, H.; Esbensen, K.; Bengston, E. (1992) Image


Analysis in Chemistry. II. Multivariate Image Analysis, Trends in
Analytical Chemistry 11, 3, 121-130.

Geladi, P; Esbensen, K. (1991) Regression on Multivariate Images:


Principal Component Regression for Modeling, Prediction and Visual
Diagnostic Tools, Jounal of Chemometrics 5, 97-111.

Geladi, P.; Esbensen, K. (1989) Can Image Anlisis Provide


Information Useful in Chemistry?, Journal of Chemometrics 3, 419-
429.

Geladi, P.; Isaksson, H.; Lindqvist, L.; Wold, S.; Esbensen, K. (1989)
Principal Component Analysis of Multivariate Images, Chemometrics
and Intelligent Laboratory Systems 5, 209-220.

Geladi, P.; Kowalski, B.R. (1986) Partial Least-Squares Regression:


A Tutorial, Analytica Chimica Acta 185, 1-17.

Gonzalez, R.C. and Woods, R.E. (1992) Digital Image Processing,


Addison-Wesley, Singapore.

Grahn, H.F.; Sf, J. (1992) Multivariate image regression and


analysis. Useful techniques for the evaluation of clinical magnetic
resonance images, Chemometrics and Intelligent Laboratory Systems,
14, 391-396.

265
SPC mediante MIA____________________________________________________

Gurden, S.P.; Lage, E.M.; de Faria, C.G.; Joekes, I.; Ferreira, M.


(2003) Analysis if video images from a gas-liquid transfer
experiment: a comparison of PCA and PARAFAC for multivariate
image analysis, Journal of Chemometrics 17, 400-412.

Gurden, S.B.; Westerhuis, J.A.; Bro, R.; Smilde, A.K. (2001) A


comparison of multiway regression and scaling methods,
Chemometrics and Intelligent Laboratory Systems 59 (1-2), 121-136.

Haralick, R.M. (1979) Statistical and Structural Approaches to


Texture, Proceedings of the IEEE 67, 5, 780-803.

Haralick, R.M.; Shanmugan, K.; Disntein, I. (1973) Textural Features


for Image Clasification, IEEE Transactions on Systems, Man, and
Cyberneticsl 3, SMC-3, 6, 610-621.

Harshman, R.A. (1970) Foundations on the PARAFAC procedure:


model and conditions for an explanatory multi-mode factor
analysis, UCLA Working Papers in phonetics 16, 1-84.

Henrion, R.; Andersson, C.A. (1999) A new criterion for simple-


structure transformations of core arrays in N-way principal
components analysis, Chemometrics and Intelligent Laboratory
Systems 47, 189-204.

Henrion, R. (1994) N-way principal component analysis. Theory,


algorithms and applications, Chemometrics and Intelligent
Laboratory Systems 25, 1-23.

Honglu, Y.; MacGregor, J.F. (2003) Multivariate image analysis and


regresin for prediction of coating content and distribution in the
production of snack foods, Chemometrics and Intelligent Laboratory
Systems 67, 125-144.

Honglu, Y.; MacGregor, J.F. (2003) Digital Imaging for Online


Monitoring and Control of Industrial Snack Food Processes,
Industrial and Engineering Chemistry Research 42, 3036-3044.

266
Referencias Bibliogrficas________________________________________________

Hskuldsson, A. (1988) PLS Regression Methods, Journal of


Chemometrics 2, 221-228.

Huang, J.; Wium, H.; Qvist, K.B.; Esbensen, K.H., (2003) Multi-way
methods in image anlisis-relationships and applications,
Chemometrics and Intelligent Laboratory Systems 66, 141-158.

Indahl, U.G.; Naes, T. (1998) Evaluation of alternative feature


extraction methods of textural images for multivariate modeling,
Journal of Chemometrics 12, 261-278.

Jackson, J.E.; Mudholkar, G.S. (1979) Control Procedures for


Residuals Associated With Principal Component Analysis,
Technometrics 21, 3, 341-349.

Jackson, J. E. (1991) A Users guide to Principal Components. Ed.


Wiley, New York.

Keller, J.M.; Chen, S., Crownover, R.M. (1989) Texture description


and Segmentation Trough Fractal Geometry, Comput. Vision
Graphics Image Processing, 45, 150-166.

Khotanzad, A.; Hernandez, O. (2003) Color image retrieval using


multiespectral random field texture model and color content features,
Pattern Recognition 36, 1679-1694.

Kiers, H.A.L.; van Mechelen, I. (2001) Three-way component


analysis: Principles and illustrative application, Psychological
Methods 6, 84-110.

Kiers, H.A.L. (2000) Towards a Standardized Notation and


Terminology in Multiway Analysis, Journal of Chemometrics 14,
105-122.

Kourti, T.; MacGregor, J.F. (1996) Multivariate SPC Methods for


Process and Product Monitoring, Journal of Quality Technology 28,
4, 409-428.

267
SPC mediante MIA____________________________________________________

Kresta, J.V.; Marlin, T.E.; MacGregor, J.F. (1994) Development of


Inferential Process Models using PLS, Computers chem. Engng. 18,
7, 597-611.

Kroonenberg, P.M. (1983) Three-Mode Principal Component


Analysis: Theory and Applications, DSWO Press, Leiden.

Kruskal, J.B. (1977) Three-way analysis: rank and uniqueness of


trilinear decomposition, with application to arithmetic complexity
and statistics, Linear algebra and its applications 18, 95-138.

Lied, T.T.; Esbensen, K. (2001) Principles of MIR, multivariate


image regression. I: Regression typology and representative
application studies, Chemometrics and Intelligent Laboratory
Systems 58, 213-226.

Lied, T.T.; Geladi, P.; Esbensen, K. (2000) Multivariate image


regression (MIR): implementation of image PLSR-first forays,
Journal of Chemometrics, 14, 585-598.

Liu, J.J.; MacGregor, J.F.; Duchesne, C,; Bartolacci, G (2005)


Flotation froth monitoring using multirresolutional multivariate
image analysis, Mineral Engineering, 18, 65-76.

Livens, S. (1998) Image Analysis for Material Characterization,


PhD, Department of Physics, University of Antwerpen, Belgium.

Livens, S.; Scheunders, P.; van der Wouwer, G.; Van Dyck, D.
(1997) Wavelets for Texture Analysis, an Overview, Procc IPA, IEE.

Livens, S.; Scheunders, P.; van der Wouwer, G.; Van Dyck, D.;
Smets, H.; Winkelmans, J.; Bogaerts, W. (1996) A Texture Analysis
Approach to Corrosion Image Classification, Micros. Microanal.
Microstruct. 7, 143-152.

Lpez, F.; Valiente, J.; Acebrn, F. (2002) Inspeccin automtica de


tonalidad en procesos industriales: aplicacin a la clasificacin de
azulejos, XIV Congreso Internacional de Ingeniera Grfica,

268
Referencias Bibliogrficas________________________________________________

(INGEGRAF02). Santander : Universidad de Cantabria, 2002, ISBN:


8469985590, 288-294.

Lpez, F.; Acebrn, F.; Valiente, J.M.; Prez, E. (2001) A Study of


Registration Methods for Ceramic Tile Inspection Purposes, IX
Symposium on Pattern Recognition and Image Analysis, vol. 1, 145-
150.

Lpez, F.; Valiente, J.M.; Acebrn, F. (1997) Sistema automtico de


inspeccin ptica de defectos de integridad en piezas cermicas:
Estudio comparativo de mtodos de reconocimiento geomtrico de
formas, VII Conferencia de la Asociacin Espaola para la
Inteligencia Artificial, (CAEPIA'97). Mlaga: ISBN: 8484987655,
509-518.

Louwerse, D.J.; Smilde, A.G. (2000) Multivariate Statistical Process


Control of batch processes based on three-way models, Chemical
Engineering Science 55, 1225-1235.

Luo, J.; Savakis, A.E. (2001) Self-supervised texture segmentation


using complementary types of features, Pattern Recognition 34,
2071-2082.

Martens, H.; Hoy, M.; Westad, F.; Folkenberg, D.; Martens, M.


(2001) Analysis of designed experiments by stabilised PLS
Regression and jack-knifing, Chemometrics and Intelligent
Laboratory Systems 58, 151-170.

Materka, A.; Strzelecki, M. (1998) Texture Analysis Methods A


Review, Technical University of Lodz, Institute of electronics, COST
B11 report, Brussels.

Monadjemi, A.; Thomas, B.T.; Mirmehdi, M. (2002) Speed v.


Accuracy for High Resolution Colour Texture Classification, BMVC
2002 Conference, Cardiff, Walse.

Noda, H.; Mahdad, N.S.; Kawaguchi, E. (2002) MRF-based texture


segmentation using wavelet decomposed images, Pattern Recognition
35, 771-782.

269
SPC mediante MIA____________________________________________________

Nomikos, P.; MacGregor, J.F. (1995) Multivariate SPC Charts For


Monitoring Batch Processes, Technometrics 37, 1, 41-59.

Noordam, J.C.; van den Broek, W.H.A.M.; Buydens, L.M.C. (2002),


Multivariate image segmentation with cluster size insensitive Fuzzy
C-means, Chemometrics and Intelligent Laboratory Systems, 64, 65-
78.
Noordam, J.C.; van den Broek, W.H.A.M.; Buydens, L.M.C. (2003),
Unsupervised segmentation of predefined shapes in multivariate
images, Journal of Chemometrics, 17, 216-224.

Noordam, J.C.; van den Broek, W.H.A.M.; Geladi, P.; Buydens,


L.M.C. (2004), A new procedure for the modelling and representation
of classes in multivariate images, Chemometrics and Intelligent
Laboratory Systems, in press.

Ojala, T.; Valkealahti, K.; Oja, E.; Pietikinen, M. (2001) Texture


discrimination with multidimensional distributions of signed gray-
level differences, Pattern Recognition 34, 727-739.

Ozyildiz, E.; Krahnstver, N.; Sharma, R. (2002) Adaptive texture


and color segmentation for tracking moving objects, Pattern
Recognition 35, 2013-2029.

Palm, C. (2004) Color texture classification by integrative Co-


occurrence matrices, Pattern Recognition 37, 965-976.

Pietikinen, M.; Ojala, T.; Xu, Z. (2000) Rotation-invariant texture


classification using feature distributions, Pattern Recognition 33, 43-
52.

Pratt, W.K. (1978), Digital Image Processing, John Wiley & Sons,
NY.

Prez, J.; Valiente, J.M., Arlandis, J. (2001) Textile inspection with a


parallel computer cluster, Proceedings of the 2001 International
Conference on Quality Control by Artificial Vision, QCAV-2001, Le
Creusot (France), 180-185.

270
Referencias Bibliogrficas________________________________________________

Porter, R.; Canagarajah, N. (1997) Robust Rotation-Invariant Texture


Classification: Wavelet, Gabor Filter and GMRF Based Schemes,
IEE Proceedings on Vision Image Signal Processing 144, 3, 180-188.

Rao, C.R.; Mitra, S. (1971) Generalized inverse of matrices and its


applications. Wiley, New York.

Rosenfeld, A.; Lipkin, B.S. (1970) Texture Synthesis, en Picture


Processing and Psychopictorics, Lipkin and Rosenfeld (Eds) New
York Academic Press (309-340).

Russ, J.C. (1999) The Image Processing Handbook, 3rd edition, CRC
Press, FL.

Sarkar, A.; Sharma, K.M.S.; Sonak, R.V. (1997) A New Approach


for Subset 2-D AR Model Identification for Describing Textures,
IEEE Trans. Image Process., 6, 407413.

Serra, J. (1982) Image Analysis and Mathematical Morphology,


Academic Press Inc. (London) Ltd., UK.

Sjstrm, M; Wold, S; Sderstrm, B. (1986) PLS Discriminant


Plots, Proceedings of PARC in Practice, Amsterdam, June 19-21,
1985. Elsevier Science Publishers B.V., North-Holland.

Soltanian-Zadeh, H.; Rafiee-Rad, F.; Pourabdollah-Nejad D, S.


(2004) Comparison of multiwavelet, wavelet, Haralick, and shape
features for microcalcification classification in mammograms,
Pattern Recognition 37, 1973-1986.

Song, K.Y.; Petrou, M.; Kittler, J. (1995) Texture Crack Detection,


Machine Vision and Applications 8, 63-76.

Song, K.Y.; Petrou, M.; Kittler, J. (1992) Texture defect detection: a


review, SPIE Machine Vision and Robotics Conference 1708, 99-106.

271
SPC mediante MIA____________________________________________________

Tracy , N.D.; Young, J.C.; Mason, R.L. (1992) Multivariate Control


Charts for Individual Observations, Journal of Quality Technology
24, 88-95.

Tran, T.N.; Wehrens, R.; Buydens, L.M.C. (2004) Clustering


multiespectral images: a tutorial, Chemometrics and Intelligent
Laboratory Systems, in press.

Trygg, J.; Wold, S. (1998) PLS regresion on wavelet compressed


NIR spectra, Chemometrics and Intelligent Laboratory Systems 42,
209-220.

Tsatsanis, M.K..; Giannakis, G.B. (1992) Object and Texture


Classification Using Higher Order Statistics, IEEE Transactions on
pattern analysis and machine intelligence 14, 7, 733-749.

Unser, M. (1995) Texture Classification and Segmentation using


Wavelet Frames, IEEE Transactions on Image Processing 4, 11,
1549-1560.

Valiente, J.M. (2002 a) Feature Extraction and Classification of


Textile Images, Proceedings of the 2nd International Workshop on
Pattern Recognition in Information Systems, vol. 1, 77-94.

Valiente, J.M.; Acebrn, F.; Lpez, F. (2002 b) Sistema de


inspeccin visual automtica de azulejos de patrn fijo, XIV
Congreso Internacional de Ingeniera Grfica, (INGEGRAF02).
Santander: Universidad de Cantabria, ISBN: 8469985590, 309-318.

Valiente, J.M.; Lpez, F.; Acebrn, F. (2001) An image registration


method for ceramic tile inspection purposes, 2001 International
Conference on Quality Control by Artificial Vision, (QCAV2001). Le
Creusot, France: Cpadue-ditions, ISBN: 2854285573, 498-503.

Valiente, J.M.; Acebrn, F.; Lpez, F. (1998) An automatic visual


inspection system for ceramic tile manufacturing defects,
Proceedings of the IASTED International Conference on Signal
Processing and Communications, ISBN: 088986246X, 257-260.

272
Referencias Bibliogrficas________________________________________________

Van de Wouwer, G. (1998) Wavelets for Multiscale Texture Analysis,


PhD Thesis, Department of Physics, University of Antwerp, Belgium.

Vidakovic, B. (1999) Statistical Modeling by Wavelets. Ed. John


Wiley & Sons, Inc. New York.

Walczak, B. (2000) Wavelets in Chemistry Ed. Elsevier Science.


Amsterdam.

Westerhuis, J.A.; Kourti, T.; MacGregor, J.F. (1999) Comparing


alternative approaches for multivariate statistical analysis of batch
process data, Journal of Chemometrics 13, 397-413.

Winkler, G. (2003) Image Analysis, Random Fields and Markov


Chain Monte Carlo Methods. 2nd Edition Ed. Springer.

Wise, B.M.; Geladi, P. (2000) A Brief Introduction to Multivariate


Image Analysis, North American/International Chemometrics Sociey
Newsletter.

Wold, H. (1966 a) Estimation of principal compoents and related


models by iterative least squares. Multaivariate Analysis, Krishnaiah
PR (ed.). Academic Press. New York. 391-420.

Wold, H. (1966 b) Nonlinear estimation by iterative least squares


procedures. Research Papers in statistics, David F (ed.). John Wiley.
New York. 411-444.

Wold, S.; Geladi, P.; Esbensen, K.; hman, J. (1987) Multi-Way


Principal Components-and-PLS-Analysis, Journal of Chemometrics
1, 41-56.

Wold, S; Albano, C; Dunn, W.J.; Edlund, U; Esbensen, K; Geladi, P;


Hellberg, S.; Johansson, E.; Lindberg, W.; Sjstrm, M. (1984)
Multivariate Data Analysis in Chemistry, In: B.R. Kowalski (ed.)
Chemometrics: Mathematics and Statistics in Chemistry, D. Reidel
Publishing Company, Dordrecht, Holland.

273
SPC mediante MIA____________________________________________________

Xiong, Z.; Ramchandran, K. (2000) Wavelet image compression,


Handbook of Image and Video Processing. A. Bovik, ed., Academic
Press. New York.

Yu, H.; MacGregor, J.F. (2003 a) Monitoring turbulent nonpremixed


flames in an industrial boiler using multivariate image analysis
(MIA), Proceedings of the Seventeenth International Forum. Process
Analytical Chemistry. January 21-24, 2003, 597-602.

Yu, H.; MacGregor, J.F. (2003 b) Multivariate image analysis and


regression for prediction of coating and distribution in the production
of snack foods, Chemometrics and Intelligent Laboratory Systems 72,
57-71.

274

You might also like