You are on page 1of 6

G R AFICA III S IMPOSIO P ERUANO DE C OMPUTACI ON Y P ROCESAMIENTO DE I M AGENES , SCGI-2009

de par Deteccion asitos helmintos en im agenes microscopicas


Gabriel E. Humpire Mamani, Alexander V. Rodriguez Velasquez
Resumen Este trabajo muestra una propuesta para separar de forma autom atica par asitos del tipo Helmintos de artefactos no deseados en im agenes microscopicas. La imagen de consulta ingresa al algoritmo de contornos activos(Snakes) para obtener los contornos de los candidatos para luego extraer caracter sticas geom etricas, textura y curvatura estas ultimas presentan de forma robusta la diferencialidad entre artefactos no deseados y par asitos Hel con un clasicador Multilayer Perceptron para poder descartar artefactos mintos, y nalmente la etapa de clasicacion del algoritmo de contornos activos para segno deseados obteniendo resultados del 93 % y considerando la precision la precision nal fue del 73.4 % sobre la base de datos SADPI8 mentacion de caracter T erminos de indexacion Par asitos Helmintos,Extraccion sticas, Multilayer Perceptron, Gray Level coocurrence matrix, caracteristicas geometricas y de curvatura, contornos activos.

1.

Introduccion

El diagnostico de enfermedades en centros hospitalarios cada vez requiere de procesos m as r apidos como apoyo para diagnosticar posibles enfermedades y evitar complicaciones en la salud por tiempos que conlleva la espera de un diagnostico y un tratamiento adecuado. Es es frecuentemente por esta causa que la computacion usada en el entorno medico en estos d as,no solo para diagnosticos sino tambi en como un medio para el aprendizaje. La aplicabilidad de la detecciones autom aticas se pueden apreciar como ejemplo en la medicina actual,en la para la realizacion de diagnosticos. cual es util Tenemos procesamiento de im agenes de Resonancia Magn etica ( MRI Magnetic Resonance Imaging ),tomograf a computarizada ( CT Computer Tomography), mamograf a digital,diagnostico autom atico en micrograas y otras modalidades, proveen un medio no-invasivo y efectivo de delinear la anatom a de un sujeto. Estas tecnolog as han incrementado enormemente el conocimiento y estudio de anatom as y patolog as para medica, y son un componente critico en la investigacion de diagnosticos la planicacion y tratamientos. y principalAnte ello los algoritmos de deteccion juegan juegan un papel mente la fase de segmentacion importante en numerosas aplicaciones biom edicas de tratamiento de im agenes, como muestra Rueckert et al. [14]. En Biolog a o parasitolog a, la morfolog a es la disciplina encargada del estudio de la forma y estructura de un organismo o sistema. Existen diferentes Subdisciplinas, una de ellas la morfolog a descriptiva que se encarga y comparacion de las formas org de la descripcion anicas. El personal especializado de apoyo en parasitolog a
Catedra Concytec por el apoyo ofrecido para realizar procesos de investigacion.

se basa principalmente en la morfolog a descriptiva para realizar la tarea de reconocimiento de los par asitos por sus caracter sticas morfologicas como: altura, ancho, entre estos valores otorgan e incluso una proporcion que ayudan al reconocimiento o descarte de informacion los objetos candidatos. Cuando el entorno no es el adecuado(background), la relevante para textura del par asito otorga informacion el descarte de objetos no deseados. Para el presente caso de estudio tenemos que los par asitos del tipo helmintos tienen dos tipos de texturas: rugosas o lisas. Una forma de automatizar la tarea de los parasitologos es rea, realizar un c alculo autom atico de medidas como el a de los di ametro m aximo, di ametro m nimo, proporcion di ametros(excentricidad) y simetr as con respecto a cada uno de los di ametros. El siguiente paper esta estructurado de la siguiente ma 2 se muestra el estado del arte, en la nera: en la seccion 3 se detallar seccion a la propuesta y los algoritmos usados de par para la deteccion asitos y su descarte de artefactos 4 se explicar no deseados, en la seccion a la etapa clasica usando una red neuronal MultiLayer Perceptron, en cion 5 se discutir la seccion an los resultados y algunos detalles 6 con sobre la base de datos usada, nalmente la seccion las conclusiones.

2.

Estado del Arte

Yoon Seok Yang Et.Al. [16] propone una secuencia de pasos para realizar el diagnostico de par asitos en dos etapas: El procesamiento digital de la imagen el cual engloba segmentacion de objetos, extract ecnicas de binarizacion, de caracter cion sticas geom etricas por forma, tamano, nucleo y nalmente una segunda etapa que es la clasi usando dos redes neuronales, una red dedicada cacion exclusivamente para descartar artefactos no deseados y una red para clasicar los tipos de par asitos. Carlos Platero [3] describe un sistema de procesamiento de im age-

Published by SCGI 2008

E JEMPLO DE USO DE SCGI . CLS PARA A RT I CULOS DEL SCGI-2009

de nucleos nes digitales para la enumeracion de c elulas madre neurales. Yi-De Ma [15] muestra un trabajos enfocado a micrograf as extra das de laboratorio, se desarrolla sobre im agenes microscopicas de c elulas, que contienen globu y conteo aprovechanlos rojos, m etodos de segmentacion do la morfolog a de los globulos. En un estudio comparativo de los diferentes extractores de caracter sticas Krystian Mikolajczyk y Cordelia Schmid [11] comparan los alcances de descriptores que hallan regiones de inter es de im agenes usando propiedades como intensidad de pixel, color, textura, bordes etc. Considera las transformaciones geom etricas(escala, y traslacion),manchas, de im rotacion compresion agenes Listan una serie de descripJpeg, cambios de iluminacion tores y la comparativa de resultados entre ellos Scale Invariant Feature Transform (SIFT) [10], PCA-SIFT [9], Shape Context [2], . Cesar Beltr an en su tesis doctoral [4] trabaja sobre par asitos de gallinas del g enero Eimeria, mues de caracter tra una extraccion sticas geom etricas y de curvatura, selecciona las caracter sticas principales de forma estad stica para luego usar dos clasicadores: uno bayesiano y otro estad stico obteniendo resultados del 80 % y 85 % respectivamente. Las redes neuronales son usada en otros trabajos de in para detectar caracter vestigacion sticas visuales, tal como R. Jamet, M. Pereira en [12] para detectar la frescura en el pescado por medios visuales; tambi en se puede usar para detectar fenomenos f sicos explicado por Bonie J. Restrepo [13], en la cual usan esta red para la clasica para clasicar eventos s cion smicos.

Figura 1: Diagrama de contexto

3.2.

Extraccion de caracter sticas

3.

Deteccion de par asitos helmintos en im agenes microscopicas

de caracter La extraccion sticas es una representacion num erica de tal forma que pueda representar al obje to. Los extractores fueron escogidos por su desempeno en pruebas previas emp ricas en las que se vericaba el de cada una de ellas y posteriormente se prodesempeno a juntarlas obteniendo mejores resultados. Las cacedio racter sticas de curvatura sirven principalmente para dis tinguir entre artefactos extranos y par asito. Las caracter sticas geom etricas y de textura otorgan mayor infor y son usados para la identicacion de las clases macion de los par asitos. Los extractores usados fueron de 3 tipos: Caracter sticas geom etricas Extrae representaciones matem aticas de los contornos de los candidatos. El personal de apoyo en parasitolog a identica a los par asitos por la altura,anchura, proporcion que hablando en t entre ellas y tamano, erminos de geometr a serian: Di ametro m aximo 3(a), di ametro rea 3(d) . Las dos m nimo 3(b), excentricidad 3(c), a primeras caracter sticas reciben el contorno del candidato y son calculadas por las orientaciones de los ejes principales usando eigenvalores y eigenvectores sobre los contornos del candidato encontradas utilizando Principal Component Analysis (PCA) [1] mostrado en la imagen 2 espaCaracter sticas de textura Incorporan informacion cial entre niveles de intensidad dentro de la textura, son de hecho histogramas bidimensionales, el descriptor usado fue Gray Level Co-ocurrence Matrix(GLCM) o matrices de dependencia espacial propuesto por Haralick [7], esta basado en la matriz de co-ocurrencia de una imagen en escala de grises y se dene en base a dos par ametros: distancia y orien-

implica tres fases: segmentaUn proceso de deteccion de los candidatos, extraccion de caracter cion sticas , y por ultimo un clasicador que recibe las caracter sticas de patrones. Se uso la Baextra das para la clasicacion 5.1, los conse de Datos SADPI-8 detallada en la seccion tornos est an contenidos en archivos planos que son entra de caracter das para los algoritmos de extraccion sticas. El diagrama de contexto mostrado en la gura 1 muestra de forma gr aca los pasos que se explicar an en las siguientes secciones.

3.1.

Segmentacion

fue realizada por el algoritmo de conLa segmentacion tornos activos (Snakes) [8], que consiste en una evolucion que se adapta hasta englobar de iteraciones de un patron un objeto contenido en una imagen por medio de energ as dadas por los valores de los pixeles de una imagen en escala de grises. Pueden ser internos si se inician en el interior del objeto, Externos (si es que se inician en el exterior) o mixtos (cuando se toman ambos criterios para optimi zar la evolucion).

E JEMPLO DE USO DE SCGI . CLS PARA A RT I CULOS DEL SCGI-2009

de componentes principales con PCA Figura 2: Obtencion aplicado al contorno del candidato.

Figura 5: GLCM de imagen. computacional, reconocimiento de forma en la vision en esta enfatiza la importancia de eventos no repeti visual de los tivos as como simetr a en la percepcion humanos. L.F.Costa establece [5] el descriptor jer arquico llamado curvatura multiescala, expresa la curvatura del contorno en t erminos del an alisis de escalas para detectar la rugosidad y esquinas tanto como la curvatura estad stica. La curvatura k(t) del contorno c(t) esta denida de la siguiente manera: x (t) y (t) x (t)y (t) (x (t)2 + y (t)2 )3/2

(a)

(b)

k (t) =

(1)

(c)

(d)

Figura 3: Caracter sticas geom etricas: a) di ametro m axi rea mo , b) di ametro m nimo, c) excentricidad y d) a Las caracter tacion. sticas extra das son correlacion, energ a, contraste, homogeneidad.

Para hallar la curvatura es necesario hallar la prime ra y segunda derivada de las senales x(t) e y (t). Para calcular esto se utiliza la propiedad derivativa de Fourier. Siendo X(f) e Y(f) las transformadas de Fou rier de las senales x(t) e y(t) respectivamente. Esto implica: (f ) = j 2 f X (f ) X (f ) = j 2 f Y (f ) Y (f ) = (2 f )2 X (f ) X (f ) = (2 f )2 Y (f ) Y (2) (3) (4) (5)

Figura 4: GLCM Co-ocurrencia. Caracter sticas de curvatura La curvatura es una de las caracter sticas mas importantes, son extra das del contorno de una imagen. Attneave Fred [6] tuvo in rea de uencia en investigaciones posteriores en el a

X, Y ,Y la transformada de Fourier de Siendo X, x, x , y, y con estos conceptos podemos hallar la derivada en el espacio de Fourier aplicando los conceptos previamente vistos, para luego aplicando la transformada inversa de Fourier obtener los datos necesarios en el espacio Original. Se usaron 2 caracter sticas de curvatura representativas:

E JEMPLO DE USO DE SCGI . CLS PARA A RT I CULOS DEL SCGI-2009

Media de Curvatura . Est Desviacion andar de Curvatura. Bloque de guras 6 la curvatura de un par asito (a y c) es muy diferente al de la curvatura de un artefacto no deseado (e), lo que permite hacer una separacion m as acertada de lo que es un par asito de un artefacto.

que se quiera representar. para hacer una primera La t ecnica que se escogio es una MLP, ya que por su facilidad y aproximacion rapidez puede contribuir a una r apida respuesta a la consulta del usuario.

4.1.

Descripcion del funcionamiento

bas Se considero la siguiente conguracion andose en la proporcionalidad de una MLP, y luego ajustando manualmente y de forma emp rica los valores hasta obtener el mejor resultado.
(a) (b)

Se tiene 10 neuronas en la capa entrada 2 capas Ocultas con 7 neuronas cada una 1 neurona en la capa de salida Las caracter sticas son ingresadas en un archivo que contienen en la primera columna la clase a la que pertenece y las siguientes 10 columnas con cada una de las caracter sticas detectadas.

(c)

(d)

El objetivo es identicar la naturaleza del objeto, es y se procede decir si es un par asito o un artefacto extrano a hacer uso de una base de datos que contiene las im agenes segmentadas al separar par asitos de artefactos en la etapa de segmentacion. Luego se procede a entrenar la red con los distintos tipos de par asitos etiquetados en una misma clase as co como mo con los artefactos resultante de la segmentacion parte de otra clase.

(e)

(f)

Figura 6: Curvatura de Candidatos: a) Imagen de Trichiuris , b) Curvatura de Trichiuris, c) Imagen de Fasciola hepatica , d) curvatura de Fasciola hepatica , e) artefacto y f)curvatura de artefacto muy diferente a las curvaturas b) y d)

4.2.

Caracter sticas de la MLP


gradiente de 0,1x109 Mu de 0.01

La red se calibro con las siguientes variables:

4.

Clasicacion

Epochs 5000 Grado de Error de 0.001 de activacion en las 3 primeras capas es La funcion logar tmico sigmoidal la capa de salida tiene una lineal. funcion

es una de las ultimas La clasicacion etapas en un de par sistema de deteccion asitos, lo que se centrar a en separar de manera adecuada el conjunto de datos para que el usuario pueda hacer una consulta de una imagen y discriminar par asitos de artefactos no deseados. Uno de los principales problemas que se aborda al momento de clasicar un conjunto de datos de este tipo, es la variabilidad de especies (5 en total) ademas que sus caracter sticas no son siempre muy distintas unas de otras. Por eso es muy importante las etapas previas y extraccion de caracter de segmentacion sticas para garantizar que se cuenta con un conjunto de datos que represente de forma adecuada a cada uno de los objetos

5.
5.1.

Resultados
Base de datos

La base de datos usada fue SADPI-8 disponible en la web en el siguiente enlace http://www.pibapunsa.com . un conjunto de datos de 2180 im De estas se tomo agenes pertenecientes a 5 especies:

E JEMPLO DE USO DE SCGI . CLS PARA A RT I CULOS DEL SCGI-2009

Finalmente en conjunto se tuvo un porcentaje de 75.4 % como resultado nal de la deteccion.

6.

Trabajos Futuros
y lograr Para poder hacer una mejor segmentacion es necesario mejores resultados en la clasicacion emplear una nueva t ecnica inicial para obtener mejores resultados, esto se conseguir a usando una t ecnica h brida Snakes sobre Salient Region.

(a)

(b)

Figura 7: Base de datos modicada: a) Vista previa de la Base de datos SADPI-8 con 5 de las 8 clases de la Base de datos original y b) Objetos no deseados, Artefactos ex usados para el entrenamiento tranos
Helmintos Ascaris Trichuris Dyphillobothrium pacicum Taenia solium fasciola hepatica Muestras 100 128 104 136 77 Segmentadas 96 100 92 93 61 Detectadas 93 82 91 88 57 Falladas 3 18 1 5 4

de Otro trabajo futuro es lograr hacer la clasicacion las 7 especies por separado usando un clasicador mas robusto o empleando la MLP de manera directa a las especies. Se propone usar como una alternativa a la MLP un SVM multiclase. Este ser a un paso previo para poder hacer el diagnostico de que especie es objeto de una consulta. Ya de que es necesario descartar los artefactos extranos solo la base de datos para poder hacer una deteccion con los posibles candidatos a par asitos.

Cuadro 1: Resultados de la deteccion Ascaris trichuris Dyphillobothrium pacicum Taenia solium Fasciola hepatica

7.

Conclusiones
aun esCabe destacar que la etapa de segmentacion ta en etapa de prueba por lo que el porcentaje bajo Esto se podr las pruebas de clasicacion. a mejorar h usando una segmentacion brida Snakes con Salient Region. Es importante senalar que las caracter sticas rescatadas son lo bastante representativas como para dar un porcentaje de 93 % en la clasicacion. Por otro lado podemos apreciar que la especie que fue tuvo el mayor error en la etapa de segmentacion la Taenia solium por tener esta un contorno muy cla a las dem ro es dif cil segmentar en comparacion as.

5.2.

Resultados

Se obtuvieron los siguientes resultados despu es de con la MLP: aplicar la clasicacion 5.2.1. Matriz de Resultados

en un 80 % para el entrenaLa base de datos se dividio miento y un 20 % para las pruebas. Como se aprecia en el cuadro se obtuvieron los siguientes resultados: de posibles candidatos en la 81.1 % de deteccion etapa de segmentacion. se trabajaron con Para la etapa de clasicacion obtelas im agenes candidatas de la segmentacion de par ni endose un 93 % de deteccion asitos.

Agradecimientos
EsLos autores quisieran agradecer a Raquel E. Patino carcina, C esar Beltr an Castanon, Juan Carlos Gutierrez y Juan H. Chuctaya Humari.

Referencias
[1] Principal Component Analysis. Jolliffe I.T., 2002. [2] Serge Belongie, Jitendra Malik, and Jan Puzicha. Shape context: A new descriptor for shape matching and object recognition. In In NIPS, pages 831837, 2000. [3] Miguel Angel S anchez Carlos Platero, Jorge Moreno. Vi articial. Proyecto de investigacion precompetitivo sion (UPM).

E JEMPLO DE USO DE SCGI . CLS PARA A RT I CULOS DEL SCGI-2009

[4] Cesar Beltran Castanon. An alise e reconhecimento digital de formas biol ogicas para o diagn ostico autom atico de parasitas do g enero Eimeria. PhD thesis, IME, 2007. [5] L.F.Costa. D.M.U. Sabino. Atomatic leukemia diagnosis. Instituto de F sica de Sao Carlos, 2003. [6] Attneave Fred. Some informational aspect of visual perception. Technical report, Psychological Review, 1954. [7] Robert M. Haralick, K. Shanmugam, and Itshak Dinstein. Textural features for image classication. Systems, Man and Cybernetics, IEEE Transactions on, 3(6):610621, 1973. [8] M. Kass, A. Witkin, and D. Terzopoulos. Snakes: Active contour models. International Journal of Computer Vision, 1(4):321331, January 1988. [9] Yan Ke and Rahul Sukthankar. Pca-sift: A more distinctive representation for local image descriptors. Computer Vision and Pattern Recognition, IEEE Computer Society Conference on, 2:506513, 2004. [10] David G. Lowe. Distinctive image features from scaleinvariant keypoints. International Journal of Computer Vision, 60:91110, 2004. [11] Krystian Mikolajczyk and Cordelia Schmid. A performance evaluation of local descriptors. IEEE Trans. Pattern Anal. Mach. Intell., 27(10):16151630, 2005. R. Jamet, M. Pereira. Aplicacion de [12] J. Rabanal A. Y anez una red neuronal articial para determinar el nivel de frescura de un pescado mediante procesamiento de imagen. Technical report, Departamento de Ingenier a El ectrica, Universidad de Antofagasta., 2008. entre enfoques gene[13] BONIE J. RESTREPO. Comparacion de eventos rativos y determinativos para la clasicacion s smicos. Technical report, Universidad Tecnologica de Pereira., 2007. [14] D; Burger P.; Forbat S.M.; Mohiaddin R.D.; Yang G.Z. Rueckert. Automatic tracking of the aorta in cardiovascular mr images using deformable models. IEEE Transactions on Medical Imaging, 16:581590, 1997. [15] Ro-Lan Dai1 Li Lian2 Zai-Fen Zhang2 Yi-De Ma1, 2. An counting and segmentation method of blood cell image with logical and morphological feature of cell. [16] Duck Kun Park Hee Chan Kim* Member IEEE MinHo Choi Yoon Seok Yang Student Member, IEEE and JongYil Chai. Automatic identication of human helminth eggs on microscopic fecal specimens using digitalautomatic identication of human helminth eggs on microscopic fecal specimens using digital image processing and an articial neural network. IEEE, June 2001.

You might also like