You are on page 1of 74

INSTITUTO POLITECNICO

NACIONAL

Centro de Innovaci
on y Desarrollo Tecnol
ogico en C
omputo

Detecci
on Autom
atica de Anomalas Presentes en Mamografas Digitales

TESIS
Que para obtener el grado de

MAESTRIA EN TECNOLOGIA DE COMPUTO

Presenta
Fernando Carlos Martnez Rodrguez

Directores:
Dr. Rolando Flores Carapia
Dr. Benjamn Luna Benoso

Mexico, D. F.

Junio del 2013

Resumen
La mamografa digital es la tecnica m
as usada por los radilogos para detectar c
ncer de mama. Por medio
de las mamograf
as digitales se pueden usar algoritmos computacionales para detectar cancer. En este
trabajo se muestran una serie de pasos para detectar el cancer de mama. Estos pasos son: tratamiento
digital de imagenes, segmentaci
on, extraccion de caracteristicas y clasificacion. Con estos pasos se puede
obtener una respuesta a una mamografia digital, en donde, la respuesta sera si la mamografa contiene
cancer.
Los algoritmos propuestos en este trabajo fueron probados con la base de datos MINI-MIAS. La cual
contiene imagenes de mamografas y con las cuales son usadas en otros trabajos realizados.

ii

Abstract

iii

Indice general
Resumen

Abstract

II

Indice de Algoritmos

Indice de figuras
1. Introducci
on
1.1. Antecedentes . . . . . . . .
1.1.1. C
ancer de mama . .
1.1.2. Mamografa Digital .
1.1.3. Clasificaci
on . . . .
1.2. Objetivos . . . . . . . . . .
1.2.1. Objetivo general . .
1.2.2. Objetivos especficos
1.3. Justificaci
on . . . . . . . . .
1.4. Contribuciones . . . . . . .
1.5. Organizaci
on del documento

VII

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

1
1
1
2
2
3
3
3
3
4
4

2. Estado del Arte


2.1. Metodos Experimentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1.1. Segmentaci
on de la region de la mama usando contornos activos . . . . . . . . .
2.1.2. Tecnica para preprocesamiento de mamografas digitales . . . . . . . . . . . . . .
2.1.3. Sistema asistido por computadora para la deteccion de cancer de mama . . . . .
2.1.4. identificaci
on del musculo pectoral en mamografas . . . . . . . . . . . . . . . . .
2.1.5. Evaluaci
on autom
atica de la densidad del tejido mamario en las mamografas
digitales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1.6. Segmentaci
on de mama con supresion de musculo Pectoral . . . . . . . . . . . .
2.1.7. Detecci
on temprana de cancer de mama utilizando SVM como clasificador . . . .
2.2. Bases de Datos de Mamografias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2.1. MIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

10
10
11
11
12

3. Marco T
eorico
3.1. Segmentaci
on de im
agenes . .
3.1.1. Umbralizaci
on . . . .
3.1.2. Regi
on Creciente . . .
3.2. Extracci
on de caractersticas

14
14
14
15
15

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

5
6
6
6
8
9

INDICE GENERAL

iv

3.2.1. Media . . . . . . . . . . . .
3.2.2. Desviaci
on Est
andar . . . .
3.2.3. Suavidad . . . . . . . . . .
3.2.4. Asimetra . . . . . . . . . .
3.2.5. Uniformidad . . . . . . . .
3.2.6. Curtosis . . . . . . . . . . .
3.2.7. Histograma Medio . . . . .
3.3. Memorias Asosiativas Alfa Beta . .
3.3.1. Operaciones Binarias y

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

16
16
16
16
17
17
17
18
18

4. Modelo Propuesto
4.1. Segmentaci
on de mamografas . . . . . . . . . .
4.1.1. Imagen Digital . . . . . . . . . . . . . .
4.1.2. Segmentaci
on . . . . . . . . . . . . . . .
4.2. Extracci
on de caractersticas . . . . . . . . . .
4.2.1. M
aximo . . . . . . . . . . . . . . . . . .
4.2.2. Mnimo . . . . . . . . . . . . . . . . . .
4.2.3. Moda . . . . . . . . . . . . . . . . . . .
4.2.4. Desviaci
on Est
andar . . . . . . . . . . .
4.2.5. Asimetra . . . . . . . . . . . . . . . . .
4.2.6. Uniformidad . . . . . . . . . . . . . . .
4.2.7. Curtosis . . . . . . . . . . . . . . . . . .
4.2.8. Histograma Medio . . . . . . . . . . . .
4.2.9. Algoritmos . . . . . . . . . . . . . . . .
4.3. Clasificaci
on . . . . . . . . . . . . . . . . . . . .
4.3.1. Manejo de las caractersticas adquiridas
4.3.2. fase de recuperaci
on . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

20
21
21
21
24
27
27
30
30
30
30
30
31
31
41
41
46

.
.
.
.

50
50
51
52
59

6. Conclusiones y Trabajos a futuro


6.0.1. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.0.2. trabajos a Futuro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

63
63
63

5. Resultados
5.1. Segmentaci
on de las mamografas
5.2. Extracci
on de caracteristicas . .
5.3. Clasificaci
on . . . . . . . . . . . .
5.4. Conclusiones y Trabajo a furturo

.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

Indice de cuadros
4.1. Algoritmo 1 Funci
on para leer imagen y guardar en matriz . . . . . . . . . . . . . . .
4.2. Algoritmo 2 Funci
on para obtener el Histograma de una imagen . . . . . . . . . . . .
4.3. Algoritmo 3 Funci
on para obtener la varianza . . . . . . . . . . . . . . . . . . . . . . .
4.4. Algoritmo 4 Funci
on para localizar el m
usculo Pectoral . . . . . . . . . . . . . . . . .
4.5. Algoritmo 5 Funci
on para Quitar Ruido . . . . . . . . . . . . . . . . . . . . . . . . . .
4.6. Algoritmo 6 Funci
on para Calibrar el Histograma . . . . . . . . . . . . . . . . . . . . .
4.7. Algoritmo 7 Funci
on para Filtrar y Recortar la imagen . . . . . . . . . . . . . . . . . .
4.8. Algoritmo 8 Funci
on para Filtrar el m
usculo Pectoral . . . . . . . . . . . . . . . . . .
4.9. Algoritmo 9 Funci
on para Quitar Pectoral . . . . . . . . . . . . . . . . . . . . . . . . .
4.10. Algoritmo 10 Funci
on para obtener el Maximo, el Mnimo y la Moda . . . . . . . . . .
4.11. Algoritmo 11 Funci
on para obtener la mediana,varianza,energa y la entropa . . . . .
4.12. Algoritmo 12 Funci
on para obtener el nmero

de pixeles . . . . . . . . . . . . . . . . .
4.13. Algoritmo 13 Funci
on para obtener la sumatoria de valores del Histograma . . . . . .
4.14. Algoritmo 14 Funci
on para obtener la media . . . . . . . . . . . . . . . . . . . . . . .
4.15. Algoritmo 15 Funci
on para obtener la varianza . . . . . . . . . . . . . . . . . . . . . .
4.16. Algoritmo 16 Funci
on para obtener la desviacion estandar . . . . . . . . . . . . . . . .
4.17. Algoritmo 17 Funci
on para obtener la suavidad de la imagen . . . . . . . . . . . . . .
4.18. Algoritmo 18 Funci
on para obtener la asimetra . . . . . . . . . . . . . . . . . . . . . .
4.19. Algoritmo 19 Funci
on para obtener la uniformidad . . . . . . . . . . . . . . . . . . . .
4.20. Algoritmo 20 Funci
on para obtener la curtosis . . . . . . . . . . . . . . . . . . . . . .
4.21. Algoritmo 21 Funci
on para obtener el Histograma promedio . . . . . . . . . . . . . . .
4.22. Algoritmo 22 Funci
on para obtener la probabilidad de constraste . . . . . . . . . . . .
4.23. Algoritmo 23 Funci
on para obtener la asimetra por pixel . . . . . . . . . . . . . . . .
4.24. Algoritmo 24 Funci
on para normalizar caractersticas . . . . . . . . . . . . . . . . . .
4.25. Algoritmo 24 Funci
on para la operacion alfa de memorias asociativas . . . . . . . .
4.26. Algoritmo 25 Funci
on para la operacion de recuperacion Alfa min (min ) memorias
asociativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.27. Algoritmo 25 Funci
on para recuperacion de la clase . . . . . . . . . . . . . . . . . . .

22
22
23
25
26
27
28
28
29
31
32
32
33
33
33
34
34
41
42
42
42
43
43
46
47

5.1. Resultados de clasificaci


on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

59

48
49

vi

Indice de figuras
1.1. Etapas de un clasificador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2. Diagrama de funcionamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2
3

2.1. Mini-MIAS image 0381: (a) Mamografa Original, (b) Bordes, (c) Extraccion de la mama,
(d) Contornos activos versi
on de a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2. Error obtenido con contornos activos . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3. Resultado de la supresion del m
usculo pectoral. . . . . . . . . . . . . . . . . . . . . . . .
2.4. Diagrama del metodo seguido en el trabajo. . . . . . . . . . . . . . . . . . . . . . . . . .
2.5. Resultados obtenidos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.6. Metodo utilizado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.7. Resultado detecci
on del musculo Pectoral. . . . . . . . . . . . . . . . . . . . . . . . . . .
2.8. Caracteristcas tomadas de la imagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.9. Metodo de extracci
on del m
usculo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.10. Metodo de clasificaci
on por SVM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.11. Muestras base de datos MIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

6
7
7
8
8
9
10
11
11
12
13

3.1. (a) Histograma (b)Imagen umbralizada . . . . . . . . . . . . . . . . . . . . . . . . . . .


3.2. (a) Clasificaci
on de la imagen (b)Region creciente . . . . . . . . . . . . . . . . . . . . . .
3.3. Asimetra Negativa y Positiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

15
15
17

4.1. Etapas del sistema para el modelo propuesto . . .


4.2. Imagen Digital . . . . . . . . . . . . . . . . . . . .
4.3. Diagrama de segmentaci
on de la region mamaria .
4.4. Imagen de una mamografa digital y su histograma
4.5. Estimaci
on del m
usculo pectoral . . . . . . . . . .
4.6. Estimaci
on del m
usculo pectoral . . . . . . . . . .
4.7. Valores filtrados en el histograma . . . . . . . . . .
4.8. Imagen binarizada usando el histograma . . . . . .
4.9. localizaci
on del m
usculo pectoral . . . . . . . . . .
4.10. Imagen binarizada usando el histograma . . . . . .
4.11. Extracci
on de caractersticas de una imagen . . . .
4.12. Asimetra Negativa y Positiva . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

20
21
35
36
36
37
37
38
39
39
40
40

5.1.
5.2.
5.3.
5.4.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

51
52
53
54

Lectura de la mamografa . . . .
Calculo del Histograma . . . . .
Localizaci
on del m
usculo Pectoral
Obtenci
on de la Semilla . . . . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

INDICE DE FIGURAS

5.5.
5.6.
5.7.
5.8.

Recortado de la regi
on Pectoral . . . . . . . .
Binarizado y Filtrado de la maografa . . . .
Escaneo y Segmentaci
on del m
usculo Pectoral
Supresi
on del m
usculo Pectoral . . . . . . . .

vii

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

55
60
61
62

Captulo 1

Introducci
on
1.1.

Antecedentes

El cancer de mama es una grave amenaza de salud p


ublica en Latinoamerica, como a nivel mundial, es
la primer causa de mortalidad por c
ancer en la mujer adulta y la segunda en mujeres de 30 a 54 a
nos [?].
El problema est
a en que la mayora de los casos se autodetecta y solo el 10 % de los casos se identifica en etapa I. Pero este no es el problema principal ya que se espera que anualmente incremente el
n
umero de casos [1].
Es importante que el c
ancer de mama se diagnostique en etapa temprana ya que los tumores en esta
etapa tienen m
as posibilidades de curacion que los que se diagnostican en etapas avanzadas [2, 3].
Existen tres metodos para la detecci
on de cancer de mama: la mamografa, el examen clnico y el
autoexamen. Sin embargo la mamografa es la herramienta de diagnostico mas utilizada en los programas de diagn
ostico, esto es, por que detecta lesiones no palpables en la mama y es un metodo de
deteccion para reducir la mortalidad de cancer de mama [3, 4].
El avance tecnol
ogico de la medicina ha evolucionado con la ayuda de las imagenes medicas digitales, las cuales son tratadas por medios de computo con lo cual se puede mejorar la calidad y obtener
regiones de interes, un caso particular de este tipo de imagenes son las mamografas digitales [5].
En particular, los algoritmos para extraccion de informacion a partir de imagenes son conocidos como algoritmos de segmentaci
on de im
agenes, y juegan un papel importante en numerosas aplicaciones
biomedicas para obtener las regiones de interes [6].
La segmentaci
on autom
atica del m
usculo pectoral es importante al momento de analizar la mamografa, ya que este m
usculo y el tejido glandular pueden tener caractersticas similares a la mama, por lo
tanto, el m
usculo pectoral puede inferir con deteccion automatica de cancer por lo cual se recomienda
suprimirlo previamente [7, 8].

1.1.1.

C
ancer de mama

El cancer es una enfermedad que ocurre cuando las celulas de alguna parte del organismo comienzan
a crecer sin control, desplazando a las celulas normales. Cuando algunas celulas cancergenas se des-

1.1. Antecedentes

prenden de un tumor, pueden establecerse en otra parte del cuerpo viajando a traves de la sangre o del
sistema linfatico.
En cuanto al c
ancer de mama, es un tumor o bulto maligno (canceroso) que se origina a partir de
las celulas del seno. Este c
ancer es una de las principales causas de mortalidad en nuestro pas. El uso
de la mastografa como metodo de tamizaje ha disminuido la mortalidad por cancer de mama, siendo
el estudio de elecci
on [9].

1.1.2.

Mamografa Digital

En la mamografa convencional se hace uso de pelculas que graban los fotones de radiacion que pasan
a traves de la mama, con el problema de que si la pantalla no tiene actividad se van percibiendo
borrosidad, adem
as de que en este tipo de mamografa no se logran percibir los primeros fotones que
pasan, ademas de que tienen el problema de borrosidad resultante de la luz.
En la mamografa digital el equipo tiene la capacidad de percibir los primeros fotones que pasan permitiendo con esto tener mucho m
as informacion de la mama [10]. Los sistemas digitales para mamografa
estan basados en detectores que, por un lado, producen una imagen no continua sino constituida por
peque
nos elementos separados (pxeles).
La mamografa digital al ser tomada por pixeles puede ser manejable por un ordenador, adem
as de
que se puede hacer un seguimiento de los pacientes a traves de las imagenes obtenidas, las cuales se
pueden procesar y obtener una mayor calidad para hacer un diagnostico [11].

1.1.3.

Clasificaci
on

La tarea de clasificaci
on de patrones consiste en construir un mapa de relaciones entre el espacio de
caractersticas y el conjunto de las clases, de modo de poder reconocer a que clase corresponde cualquier
patron de entrada representado por un vector de caractersticas, las cuales se deben de escoger de tal
manera que solo se usen las nos den informacion relevante para el objeto a clasificar. En la figura 1.1 se
muestran las etapas de un clasificador, donde como primer paso se tiene como entrada las caractersticas
del objeto a clasificar, como siguiente paso los objetos clasificados que funcionaran como conjunto de
aprendizaje del sistema y como paso final el resultado, que es la etiqueta que nos dice a que conjunto
pertenece el objeto clasificado.

Figura 1.1: Etapas de un clasificador

1.2. Objetivos

1.2.
1.2.1.

Objetivos
Objetivo general

Desarrollo de un sistema de software para la segmentacion y clasificacion de mamografas digitales, por


medio de filtros y clasificadores para la deteccion de cancer de mama. En la figura 1.2 se muestra el
diagrama de funcionamiento del sistema.

Figura 1.2: Diagrama de funcionamiento

1.2.2.

Objetivos especficos

1. Procesamiento de las mamografas digitales para la obtencion de mayor calidad para el proceso
de segmentaci
on.
2. Segmentaci
on de las mamografas digitales por medio de filtros como: por medio del histograma,
para obtener solo regiones de interes dentro de la imagen.
3. Extraer caractersticas de la mama segmentada para posteriormente ser procesadas por el clasificador.
4. Clasificaci
on de las caractersticas por medio de la base de datos MiniMIAS, de la cual se obtendr
an
las mamografas que nos servir
an como base de conocimiento del sistema.
5. Mostrar los resultados de la clasificacion; los resultados que se obtendran seran: si la mama contiene
cancer, el tipo de c
ancer (benigno, maligno) en caso de que exista.

1.3.

Justificaci
on

El cancer de mama es un problema de salud a nivel mundial, as como tambien es el tipo de c


ancer
mas frecuente. Este se da por el crecimiento anormal de las celulas las cuales se dividen rapidamente
sin morir y duplicarse muchas veces, cuando esto ocurre, suele iniciar un crecimiento rapido que genera
la formacion de un tumor.
Es importante la detecci
on a tiempo del cancer de mama, ya que cuando ocurre esto puede ser tratado
y en muchos casos se elimina de forma eficaz el tumor. Al contrario que pasa cuando no se detecta a
tiempo y se suele asociar con resultados negativos.

1.4. Contribuciones

En la actualidad, el c
ancer de mama es un problema donde solo el 10 % de los casos son detectados en etapa temprana, dando un panorama poco alentador. Tambien se sabe que el metodo que mejor
detecta anomalas en la mama son las mamografas en las cuales los radiologos al analizarlas pueden
dar un panorama del estado de las mamas. Sin embargo, existen casos en los cuales los tejidos son muy
densos y pueden esconder los tumores a la vista, por ello con el uso del reconocimiento de patrones y
del tratamiento digital de im
agenes se puede ayudar a mejorar la imagen.
Por este motivo se desarrollar
a un sistema de software el cual detectara anomalas presentes en mamografas, lo cual apoyar
a a los radi
ologos a tomar una decision acerca del diagnostico obtenido de las
mamografas. Con lo que se pretende que mas casos de cancer de mama sean diagnosticados en etapa
temprana y con esto se puedan efectuar mas tratamientos, dando resultados positivos.

1.4.

Contribuciones
Procesamiento de las mamografas digitales para la obtencion de mayor calidad para el proceso
de segmentaci
on.
Segmentaci
on de las mamografas digitales por medio de filtros como: por medio del histograma
y de semillas, para obtener solo regiones de interes dentro de la imagen.
Extracci
on de caractersticas de la mama segmentada para posteriormente ser procesadas por un
clasificador.
Clasificaci
on de las caractersticas por medio de la base de datos MiniMIAS, de la cual se obtendr
an
las mamografas que nos servir
an como base de conocimiento del sistema.
Mostrar los resultados de la clasificacion; los resultados que se obtendran seran: si la mama contiene
cancer, el tipo de c
ancer (benigno, maligno) en caso de que exista y puede dar un prediagn
ostico
en el caso de encontrar una mama densa.

1.5.

Organizaci
on del documento

Este primer captulo de Introducci


on esta constituido por el contexto, el objetivo del trabajo de tesis, la
justificacion y las contribuciones. El resto del documento de tesis esta organizado de la siguiente manera:
El captulo 2 Presenta el Estado de Arte en el cual se exponen otros trabajos realizados que tienen
una finalidad similar, la de autenticar personas mediante alguna caracterstica intrnseca y/o u
nica. Se
analizaran en especfico los trabajos que utilicen el ojo humano como parametro de autenticaci
on.
El captulo 3 Se define el marco te
orico, el punto de partida de nuestro algoritmo, metodos de segmentacion de imagenes, de extracci
on de aracteristicas y el clasificador en este caso Memorias asociativas.
El captulo 4 Abarca la soluci
on propuesta, los metodos utilizados para darle solucion al problema
El captulo 5 Contiene los resultados
El captulo 6 Conclusiones y trabajos futuros

Captulo 2

Estado del Arte


El cancer de mama es una enfermedad que afecta principalmente a las mujeres en todo el mundo, esta
enfermedad cada da va tomando m
as terreno, ya que el ndice ha estado creciendo significativamente,
por ello se ha convertido en objeto de estudio de muchos investigadores. Actualmente con el uso de las
mamografas digitales, los investigadores se han dedicado a desarrollar algoritmos computacionales para
apoyar a los especialistas a determinar de forma mas optima si un paciente padece c
ncer, dentro de los
objetos de estudio se han enfocado a las siguientes investigaciones:
Detecci
on de musculo pectoral
Segmentaci
on de regiones de la mamografa
Mejora de la mamografa
Detecci
on de tumores
Detecci
on de c
ancer
Como se observa existen diferentes objetos de estudio dentro de las mamografas digitales, las cuales
ayudan a los especialistas a dar una segunda opinion en su trabajo.
Dentro de estos metodos la detecci
on y clasificacion se han abordado de diferentes maneras, la extraccion de caractersticas y la toma de desicion se han abordado por diferentes metodos, que involucran
diferentes logicas, metodos experimentales y computacionales, con el fn de acercarse a una respuesta
mas exacta, m
as eficiente y con el prop
osito de ayudar a la investigacion y servir de apoyo a los especialistas.
El Estado del Arte se compone por las siguientes secciones:
1. Metodos experimentales en donde se presentan diferentes trabajos que se han realizado tanto para
extracci
on de caracteristicas, la deteccion de anomalas y la identificacion de cancer dentro de las
mamografas digitales.
2. Base de Datos de mamografas digitales que se utiliza para la investigacion y pruebas con metodos
experimentales, en contraste con otros trabajos que utilizan la misma base de datos.

2.1. M
etodos Experimentales

2.1.
2.1.1.

M
etodos Experimentales
Segmentaci
on de la regi
on de la mama usando contornos activos

La segmentaci
on de la regi
on de la mama usando contornos activos [12] propuesto por Michael A. Wirth,
et al. considera la imagen como dos niveles de umbrales para caracterizar la mama, posteriormente se
le aplico un filtro reductor de ruido, para eliminar partes inservibles de la mamografa y finalmente se
le aplico el metodo de contornos activos para localizar los bordes de la mama.
En la figura 2.1 se muestra el procedimiento seguido y los resultados obtenidos por el metodo.

Figura 2.1: Mini-MIAS image 0381: (a) Mamografa Original, (b) Bordes, (c) Extraccion de la mama,
(d) Contornos activos versi
on de a
El metodo propuesto fue probado en 25 imagenes de las cuales en la figura 2.2 se muestra el error
obtenido.

2.1.2.

T
ecnica para preprocesamiento de mamografas digitales

En este trabajo Indra Kanta Maitra, et al. proponen un metodo [?] que encuentra las regiones de interes
de las mamografas dogitales, en este caso suprime el m
usculo pectoral.
En este metodo se mejor
o la imagen por lo cual se definio un umbral con el que se filtra la imagen
y posteriormente se encontr
o la region del pectoral de la cual se calculo una diagonal que separa el
pectoral de la mama. Para finalmente suprimir la parte del pectoral.
Con este metodo se obtuv
o el 85 % de resultados correctos, sin embargo en imagenes donde el m
usculo
pectoral tiene casi la misma densidad de la mama, los resultados no son favorables. En la figura 2.3 se
pude ver el resultado de segmentaci
on con este metodo .

2.1. M
etodos Experimentales

Figura 2.2: Error obtenido con contornos activos

Figura 2.3: Resultado de la supresion del m


usculo pectoral.

2.1. M
etodos Experimentales

En conclusion este metodo da buenos resultados a la hora de segmentar el m


usculo, sin embargo se le
deben de aplicar modificaciones para que funcione con todas las imagenes.

2.1.3.

Sistema asistido por computadora para la detecci


on de c
ancer de mama

El metodo propuesto por H.S. Sheshadri [1] emplea un umbral simple la region de interes y el uso
de filtros para la identificaci
on clara de microcalcificaciones. este metodo sugerido para la detecci
on y
fue probado en varias imagenes de
segmentacion de microcalcificaciones en una imagen de mamografAa
la base de datos mini-MIAS. El algoritmo fue implementado utilizando programacion en Matlab.
Como resultados obtubier
on una tasa de deteccion de microcalcificaciones del 78 % los cuales fuer
on
analizados por un radi
ologo experto.
La imagen 2.4 muestra el procedimiento seguido para la deteccion de microcalcificaciones. En la imagen

Figura 2.4: Diagrama del metodo seguido en el trabajo.


2.5 se observan los resultados obtenidos en las etapas de este metodo.

Figura 2.5: Resultados obtenidos.

2.1. M
etodos Experimentales

2.1.4.

identificaci
on del musculo pectoral en mamografas

En este trabajo [2] realizado por K. Santle Camilus se muestra un procedimiento para eliminar el
musculo pectoral a partir de la transformada de watershed, con la cual fueron capaces de encontrar la
region de la mama adem
as de la linea divisora entre el pectoral y la mama. En este trabajo se utilizar
on
un total de 84 mamografas. La media de falsos positivos y falsos obtenidos mediante la comparaci
on
de los resultados fueron 0,85 % y 4,88 % respectivamente. Usando distancia Hausdorff se observ
o que la
media y la desviaci
on est
andar es de 2,82 a 4,95 mm.
Este trabajo propone un enfoque el cual detecta el musculo pectoral, lo cual es de gran utilidad ya
que debemos de enfocarnos en la regi
on mamaria, ya que el musculo pectoral en un analisis computacional podra causar ruido y con este enfoque podemos determinar y elimiar de la mamografa esta regi
on
que no es de interes para la determinacion de cancer en la region mamaria.
En la figura 2.6 se muestra muestra el diagrama de los pasos seguidos en este metodo.

Figura 2.6: Metodo utilizado.

En la figura 2.7 se muestra muestra el resultado de la identificacion del m


usculo pectoral mediante

2.1. M
etodos Experimentales

10

este metodo.

Figura 2.7: Resultado deteccion del musculo Pectoral.

2.1.5.

Evaluaci
on autom
atica de la densidad del tejido mamario en las mamografas
digitales

T.S. Subashini, et al. proponen un algoritmo donde la region de interes se limita a los tejidos del seno
o sculo pectoral.
eliminando los dem
as componentes que interfieren en la imagen como son el fondo y el mA
Las imagenes de mamografa utilizados en este estudio son de la base de datos Mini-MIAS. En este
trabajo se describe el desarrollo de una metodologa de clasificacion automatica de tejido mamario, que
se resume en 3 etapas: (1) pretratamiento, (2) extraccion de caractersticas y la clasificacon (3).
En donde en la primera etapa de pretratamiento mediante un umbral de Niveles de Gris, siguiendo con
el etiquetado de componentes que se utiliza para eliminar los artefactos y los m
usculos pectorales de la
region de interes.
Posterior mente se hace la extracci
on de caractersticas del tejido mamario. Estas caractersticas alimentan a la m
aquina de soporte vectorial (SVM) la cual se encarga de clasificar los resultados en 3
clases distintas: grasos, glandular y tejido denso. La precision clasificador obtenido es 95,44 % utilizando
14 mamografas con tejido graso, 14 mamografas con tejido glandular y 15 mamografas con tejido denso.
En la figua 2.8 se pueden ver las caractersticas obtenidas de la imagen.

2.1.6.

Segmentaci
on de mama con supresi
on de musculo Pectoral

Este trabajo realizado por David Raba et. al. [4] se presenta un metodo de extraccion del m
usculo
pectoral, el cual se obtiene de aplicar diferentes mascaras asociadas a el operador gaussiano con el cual
se pretende obtener el contorno de la mama.

2.2. Bases de Datos de Mamografias

11

Figura 2.8: Caracteristcas tomadas de la imagen


Como primer paso, se procede a obtener toda la region de la mama y posteriormente se generan filtros
con diferentes niveles de gris para obtener el m
usculo. Finalmente se extrae el m
usculo pectoral usando
la transformada de Hough. Se utiliz
o la base de datos MiniMIAS, con la cual se probaron 320 im
agenes,
de las cuales se obtuvo 98 % de exactitud en localizacion del m
usculo pectoral y 86 % de extracciones
correctas del m
usculo pectoral. En la figura 2.9 se puede ver el funcionamiento del sistema.

Figura 2.9: Metodo de extraccion del m


usculo.

2.1.7.

Detecci
on temprana de c
ancer de mama utilizando SVM como clasificador

En este trabajo realizado por Y. Ireaneus Anna Rejani, et. al. se presenta un algoritmo para detecci
on de
tumores en mamografas, donde presenta dos problemas; el primero encontrar las regiones sospechosas
y el segundo extraer las caractersticas para su clasificacion.
En este trabajo se siguen los siguientes pasos: (a) mejora de la mamografa, (b) La segmentaci
on por
umbral de la zona del tumor, (c) La extraccion de caractersticas del tumor y (d) El uso del clasificador
SVM. En la figura 2.10 se muestra el proceso para la clasificacion de tumores en mamografas.

El metodo fue probado en 75 im


agenes de las mamografas, a partir de la base de datos MiniMIAS. La
metodologa logra una sensibilidad del 88,75 %.

2.2.

Bases de Datos de Mamografias

2.2. Bases de Datos de Mamografias

12

Figura 2.10: Metodo de clasificacion por SVM


Para la evaluar un algoritmo es recomendable usar una base de datos de prueba estandar para los
investigadores para ser capaz de comparar directamente los resultados. La mayor parte de las bases de
datos mamogr
aficos no est
an disponibles p
ublicamente. Las base de datos accesible y por tanto las base
de datos mas utilizada es: la Sociedad de Analisis de Imagen mamografica (MIAS).

2.2.1.

MIAS

La Sociedad de An
alisis de Imagen mamografica (MIAS) es una organizacion de grupos de investigacion espa
noles interesados en la comprension de las mamografas y han generado una base de datos de
mamografas digitales. Las ima
agenes han sido digitalizadas a 50 micrones de pxel borde, con pixeles
de 8 bits. La base de datos contiene 322 imagenes digitalizadas y esta disponible. Tambien incluye la
ubicacioon de las anormalidades presentes. La base de datos se ha reducido a un borde de 200 micrones
de pxel tienen un tama
no de 1024x1024 pixeles.
En la figura 2.11 se pueden apreciar algunas muestras de la base de datos.

2.2. Bases de Datos de Mamografias

Figura 2.11: Muestras base de datos MIAS

13

14

Captulo 3

Marco T
eorico
3.1.

Segmentaci
on de im
agenes

La segmentaci
on se refiere al proceso de compartimentacion de una imagen digital en m
ultiples segmentos formados por la uni
on de pxeles conectados. El objetivo de la segmentacion es para simplificar la
representacion de una imagen en algo que es mas significativo y mas facil de analizar. La segmentaci
on
de la imagen se utiliza tpicamente para localizar objetos y lmites. Mas precisamente, la segmentaci
on
de imagenes es el proceso de asignar una etiqueta a cada pxel con las mismas caractersticas visuales
tales como el color, la intensidad, o la textura. El resultado de la segmentacion de la imagen es un
conjunto de regiones que cubren conjuntamente toda la imagen, o un conjunto de contornos extrados
de la imagen.
En la actualidad existe gran cantidad de imagenes medicas las cuales para hacer mas facil su an
alisis necesitan separar partes de la imagen para obtener una mejor interpretacion. Estos algoritmos son
conocidos como segmentaci
on de im
agenes cuya tarea principal es encontrar objetos localizados en la
imagen y separarlos para distinguirlos de los demas. [?]. Los resultados de la segmentacion deben cumplir ciertas caractersticas:
Brindar resultados similares a los obtenidos por un observador experimentado.
Las regiones obtenidas deben formar la imagen completa y no se deben intersectar.
Cada objeto debe ser solo una region.
Las regiones no deben tener huecos.
Los contornos de los segmentos deben ser continuos sin huecos.
Los algoritmos deben ser autom
aticos con la intervencion mnima del usuario.
Los algoritmos deben ser de bajo conto computacional [?]

3.1.1.

Umbralizaci
on

Dentro del procesamiento de im


agenes la deteccion de clases es un paso importante para el reconocimiento de patrones, esto es en el proceso de segmentacion, esto es, porque al obtener distintas clases

3.2. Extracci
on de caractersticas

15

podemos utilizar solo aquellas regiones de interes que sean de importancia para nuestros metodos siguientes, especialmente el proceso de extraccion de caractersticas.
La umbralizaci
on es un metodo simple pero muy efectivo, ya que aplicando los filtros correctos podemos obtener exelentes resultados a la hora de segmentar la imagen.
La umbralizaci
on (thresholding) es un metodo que busca separar la imagen por medio de sus intensidades de color creando una partici
on (lmite inferior y superior) donde las intensidades que correspondan
al rango pertenecer
an a una clase y las demas perteneceran a otra. En este metodo es com
un usar el
histograma para mostrar los rangos de las clases. En la figura 3.1 se muestra el histograma de una
imagen con umbrales(a) as como la imagen umbralizada(b). [?]

Figura 3.1: (a) Histograma (b)Imagen umbralizada

3.1.2.

Regi
on Creciente

El metodo de Regi
on creciente (region growing) es una tecnica que sirve para extraer partes de la
imagen por medio de un criterio definido, este metodo requiere de un punto (semilla) del cual todos los
puntos conectados a esta ser
an parte de la clase, siempre que se encuentren en el umbral definido para
la semilla. En la figura 3.2 se muestra un ejemplo de esta tecnica, la imagen muestra la clasificaci
on de
la imagen con respecto de la semilla(a) ademas de la region creciente(b). [?]

Figura 3.2: (a) Clasificacion de la imagen (b)Region creciente

3.2.

Extracci
on de caractersticas

3.2. Extracci
on de caractersticas

16

Tenicas que permiten extraerciertos elementos (caractersticas) de la imagen para luego ser usados en
otras tareas. Estos elementos sirven de base para otros metodos que realizan tareas mas complejas
(reconocimiento, localizaci
on, clasificaci
on, etc.)
A continuacion se detallan algunas de las caractersticas estadisticas utilizadas.

3.2.1.

Media

La media aritmetica (tambien llamada promedio o simplemente media) de un conjunto finito de n


umeros
es el valor caracterstico de una serie de datos cuantitativos objeto de estudio que parte del principio de

la esperanza matemAtica
o valor esperado, se obtiene a partir de la suma de todos sus valores dividida
entre el n
umero de sumandos.
La media aritmetica se define a continuacion:
Dados los n n
umeros {a1 , a2 , ..., an }
n

x
=

1 X x1 + x2 + ... + xn
n
n
i=1

3.2.2.

Desviaci
on Est
andar

La desviacion est
andar es una medida de centralizacion o dispersi
n para variables de raz
on y de
intervalo.
Se define como la raz cuadrada de la varianza. Junto con este valor, la desviacion tpica es una medida
(cuadratica) que informa de la media de distancias que tienen los datos respecto de su media aritmetica,
expresada en las mismas unidades que la variable.
n
X

2 =

(xi x
)2

i=1

3.2.3.

n1

Suavidad

La suavidad mide la suavidad relativa de intensidad en una region de interes. a continuacion se define
la formula para calcularla:
1

R=1

(1+ 2 )

3.2.4.

Asimetra

En teora de la probabilidad y estadsticas , es una medida de la asimetra de la distribucion de una


variable aleatoria. El valor de la asimetra puede ser positivo o negativo, o incluso indefinida. Un valor
negativo indica que existen mas datos de probabilidad del lado derecho de la media y un valor positivo
que la mayor cantidad de valores se encuentran del lado izquierdo de la media. Un valor cero indica que
los valores son relativamente distribuido uniformemente en ambos lados de la media.
En la figura 4.12 se muestra la distribucion con asimetria negativa y positiva.

3.2. Extracci
on de caractersticas

17

Figura 3.3: Asimetra Negativa y Positiva


La asimetra de una variable aleatoria X es el tercer momento estandarizado , denotado 1 y se define
como:
X  X )3 
1 =
3

3.2.5.

Uniformidad

Mide la uniformidad de una distribuci


on de intensidad. Se calcula con la siguiente formula:
U=

L1
X

p (i)2

i=0

3.2.6.

Curtosis

En teora de la probabilidad y estadstica, la curtosis es una medida de la forma. As, las medidas de
curtosis tratan de estudiar la proporci
on de la varianza que se explica por la combinacion de datos extremos respecto a la media en contraposicion con datos poco alejados de la misma. Una mayor curtosis
implica una mayor concentraci
on de datos muy cerca de la media de la distribucion coexistiendo al
mismo tiempo con una relativamente elevada frecuencia de datos muy alejados de la misma.
El coeficiente de apuntamiento de uso mas extendido es el basado en el cuarto momento con respecto a
la media y se define como:
X  X )4 
2 =
4

3.2.7.

Histograma Medio

El histograma medio es el valor caracterstico que se obtiene a partir de la suma de todos los valores
del histograma dividida entre el n
umero maximo de gris.
El histograma medio se define a continuacion:
AHg =

L1
1 X
N (i)
L
i=0

3.3. Memorias Asosiativas Alfa Beta

3.3.

18

Memorias Asosiativas Alfa Beta

En esta seccion se presenta la teora referente a las memorias asociativas Alfa-Beta [?]. A continuaci
on
se presentan las operaciones y , ademas de las operaciones matriciales que se derivan, y se describen
las fases de aprendizaje y recuperaci
on de la memorias heteroasociativas y autoasociativas Alfa-Beta,
tanto Max, denotadas por M, como Min, denotadas por W.

3.3.1.

Operaciones Binarias y

Las memorias Alfa-Beta utilizan m


aximos y mnimos, y dos operaciones binarias originales y de las
cuales heredan el nombre.
Para definir las operaciones binarias y se deben especificar los conjuntos A y B, los cuales son:
A={0,1} y B={0,1,2}
La operacion : A x A B se muestra en la tabla siguiente:
x

(x,y)

1 1
1
La operacion : B x A A se muestra en la tabla siguiente:
x

(x,y)

Memorias Heteroasociativas Alfa Beta (max y min)


En [?] se muestran dos tipos de memorias heteroasosiativas : tipo y tipo .
En el dise
no de las memorias heteroasociativas se utilizan los operadores matriciales 41 , 51 , 41
y 51 . los cuales son definidos a continuacion:


1. Operaci
on max: Pmxr5Qrxn = f mxn , donde
f = (pik,qkj).
h
i
2. Operaci
on max: Pmxr5 Qrxn = f mxn , donde

3.3. Memorias Asosiativas Alfa Beta

19
f = (pik,qkj).



3. Operaci
on min: Pmxr4Qrxn = f mxn , donde
f = (pik,qkj).
h
i
4. Operaci
on min: Pmxr4 Qrxn = f mxn , donde
f = (pik,qkj).

20

Captulo 4

Modelo Propuesto
En este captulo se describe la metodologa utilizada para la clasificacion de mamografas Digitales provenientes de la base de datos de mini-MIAS, en las cuales se aplica un procedimiento para la segmentaci
on
de mamografas digitales, posteriormente de las mamografas segmentadas se efect
ua la extraci
on de caractersticas, las cuales nos aportaran datos importantes para la clasificacion y finalmente se aplica el
algoritmo de memorias alfa-Beta para la clasificacion de las caractersticas con lo cual sabremos si la
mama tiene c
ancer.
El metodo propuesto consta principalmente de tres pasos. Los cuales se describiran a continuaci
on.

Figura 4.1: Etapas del sistema para el modelo propuesto

4.1. Segmentaci
on de mamografas

4.1.
4.1.1.

21

Segmentaci
on de mamografas
Imagen Digital

Para segmentar las mamografas digitales debemos consideralas como una imagen digital, las cuales
son definidas como una funci
on bidimensional f (x, y), donde (x, y) representa un punto el espacio. Las
imagenes digitales se reprentan como una matriz bidimensional 4.2 Fij = (fij ) mxn donde m y n
representan las dimenciones de la imagen y la funcion de trancicion es la siguiente fij = f (xi , xj )

Figura 4.2: Imagen Digital

4.1.2.

Segmentaci
on

El primer paso de este metodo consiste en identificar el m


usculo pectoral, as como las demas regiones
que no son de inteespara la mamografa. Por lo cual la deteccion de la region de intees o region mamaria
se divide en distintos pasos que en su totalidad tienen el objetivo de segmentar la mama.
La figura 4.3 muestra el Diagrama de los procedimientos creados para segmentar la region mamaria.
El primer paso del algoritmo consiste en leer la mamografa en formato bmp, utilizando lenguaje
c++, al final del proceso se obtendr
a una matriz que contiene los valores de cada pixel de la imagen en
escala de grises con valores entre 0 y 255 donde el 0 representa el color negro y 255 representa el color
blanco.

Posteriormente se debe de obtener el Histograma de la imagen, el cual nos mostrara donde se concentra
la region mamaria. A continuaci
on el Algoritmo 2 muestra como obtener el Histograma de una imagen.
La figura 4.4 muestra el resultado de aplicar el algoritmo a una mamografa.

Una vez obtenido el Histograma de la imagen se calcula la varianza, para encontrar los lmites del
m
usculo pectoral. En este procedimiento se discriminan los niveles menores a 50 y los mayores a 255
ya que son niveles que no corresponden a la region mamaria. El Algoritmo 3 muestra como obtener la
varianza a partir del Histograma. La varianza se obtiene con la siguiente formula:

4.1. Segmentaci
on de mamografas

Cuadro 4.1: Algoritmo 1 Funcion para leer imagen y guardar en matriz


Entrada: imagen mamografa I
Salida: imagen en matriz Im
funci
on LeerImagen(I)
para cada pxel (x, y) en I
Im(i, j) I(i, j)
fin para
regresar Im
fin funci
on

Cuadro 4.2: Algoritmo 2 Funcion para obtener el Histograma de una imagen


Entrada: imagen Im
Salida: Hitograma H
funci
on ObtenerHistograma(Im)
para i 0 hasta 255
H[i] 0
fin para
para cada pxel (x, y) en Im
H[Im(x, y)] + +
end para
regresar H
fin funci
on

22

4.1. Segmentaci
on de mamografas

23

Cuadro 4.3: Algoritmo 3 Funcion para obtener la varianza


Entrada: Histograma H
Salida: Varianza V ar
funci
on ObtenerVarianza(Im)
para m 50 hasta 250
npixeles+ = H[m]
fin para
para m 50 hasta 250
aux[m] = H[m]/npixeles
mediana mediana + (m)(aux[m])
fin para
para m 50 hasta 250
V ar V ar + [(i mediana)(i mediana) (aux[i])]
fin para
var sqrt(V ar)
regresar V ar
fin funci
on

2 =

P255

)2 xH [i])
P255
j=0 [j]

i=0 ((i

donde:
P255
=

i=0 (ixH [i])


P255
j=0 [j]

Para estimar la posici


on del m
usculo pectoral en la imagen primero suprimimos los primeros 90 pixeles
de la parte superior de la imagen. Despues se realiza una trayectoria vertical de izquierda a derecha
y de derecha a izquierda paralelamente, para encontrar el primer pxel f (x90, yj) que esta dentro del
umbral 100 f (x90, yj) 250.
Si el primer pxel en el umbral se encontro en el camino de izquierda a derecha, entonces se estima
que el m
usculo pectoral est
a en el lado izquierdo de la mamografa, y si el primer pxel en el umbral se
encontro en el camino de la derecha hacia a la izquierda, entonces se estima que el m
usculo pectoral es
el lado derecho de la mamografa. En la figura ?? muestra el curso que se realiza en paralelo de derecha
a izquierda y de izquierda a derecha para encontrar el pectoral.
El Algoritmo 4 muestra el procedimiento para localizar el m
usculo pectoral, este metodo regresa adem
as
la semilla que se utiliza para obtener el nivel de gris del m
usculo pectoral.

4.2. Extracci
on de caractersticas

24

Los procedimientos utlizados para segmentar el m


usculo pectoral de las maografas son: el metodos del
pixel mas cercano y el metodo de la semilla. A continuacion se presentan los pasos del procedimiento
propuesto:
Posteriormente se recorta la imagen tomando como referencia los puntos encontrados anteriormente. Si el punto encontrado est
a del lado izquierdo hacemos un corrimiento a derecha hasta encontra
un pixel negro, y si el pixel se encuentr
o del lado derecho hacemos un recorrimiento a izquierda hasta
encontrar un pixel negro. La figura 4.6 representa el recorte de la mamografa. El algorimo 5 muestra
el procedimiento para quitar ruido de la mamografa.

Obtenida la semilla se procede a calibrar el Histograma, esto es, busca un pico cercano y lo toma como
valor de nueva semilla. Ahora se filtra el histograma de la imagen tomando como semilla el punto localizado f (x, y), el cual nos servir
a para filtrar los valores encontrados entre f (x, y) 2 y f (x, y) + 2 ,
en la figura 4.7 podemos ver el filtro del histograma. El Algoritmo 6 muestra el procedimiento calibrar
el Histograma.

Una vez calibrado el histograma, lo filtramos con los valores entre f (x, y) + 2 y f (x, y) + 2 y procedemos a binarizar la imagen donde los valores dentro del rango les asignaremos el color blanco (255)
y a los que se encuentren fuera del rango les asignamos negro (0). Nuestra formula de binarizaci
on se
muestra a continuaci
on:
bin(x, y) = {(255sif (x, y) 2 < f (x, y) < f (x30, yj) + 2 )0enotrocaso.)
la figura 4.8 muestra la imagen recortada y binarizada y el Algoritmo 7 muestra el proceso de recortado
y Binarizacion.

Como se muestra en la figura 4.8 la imagen escaneada contiene el m


usculo pectoral, sin embargo tambien
contiene regiones no pertenecientes a este, por lo cual tomamos como referencia semilla y realizamos un
escaneo tanto vertical como horizontal con lo cual obtendremos solo la region perteneciente al muculo
pectoral. En la figura 4.9 se muestra el m
usculo pectoral localizado. El algoritmo 8 muestra este procedimiento.

Una vez que haya encontrado el m


usculo pectoral se procede a eliminarlo de la imagen original. La
imagen 4.10 muestra el resultado de la supresion del m
usculo pectoral. El algoritmo 9 muestra el procedimiento para suprimir el m
usculo Pectoral.

4.2.

Extracci
on de caractersticas

La extraccion de caractersticas es, b


asicamente, un proceso de extraccion de la informacion u
til contenida en la se
nal a tratar (en nuestro caso las mamografas digitales).

4.2. Extracci
on de caractersticas

25

Cuadro 4.4: Algoritmo 4 Funcion para localizar el m


usculo Pectoral
Entrada: Imagen im
Salida: punto x, y, lado donde se localizo el pectoral lado y Rango del pectoral max, semilla semilla
funci
on LocalizarPectoral(Im)
para m 90 hasta largoIm
para n 0 hasta ancho Im
si im(m, n) >= 100 y im(m, n) < 250 entonces
ym
xn
lado 1
semilla Im(m, n + 2)
mientras im(m, n) >= 50
semilla n + +
fin mientras
regresar res
fin si
si im(m, ancho Im n) >= 100 y im(m, ancho Im n) < 250 entonces
ym
xn
lado 1
semilla im(m, n + 2)
mientras im(m, ancho Im n) >= 50
semilla n
fin mientras
regresar semilla
fin si
fin para
fin para
regresar semilla
fin funci
on

4.2. Extracci
on de caractersticas

Cuadro 4.5: Algoritmo 5 Funcion para Quitar Ruido


Entrada: imagen mamografa I,punto x, y, lado del pectoral lado
Salida: imagen Filtrada sin Ruido Im
funci
on QuitarRuido(I)
para m x hasta largo Im
pos x
si lado 1
mientras Im(m, pos) > 20 y Im(m, n) < 250
Im(m, pos + +) 0
fin mientras
fin si
si lado 2
mientras Im(m, pos) > 20 y Im(m, n) < 250
Im(m, pos ) 0
fin mientras
fin si
fin para
regresar Im
fin funci
on

26

4.2. Extracci
on de caractersticas

27

Cuadro 4.6: Algoritmo 6 Funcion para Calibrar el Histograma


Entrada: semilla sem, Histograma H
Salida: semilla sem
funci
on CalibrarHistograma(sem)
para m 0 hasta 10
si H[sem + 1] > H[sem]
sem + +
fin si
si H[sem 1] > H[sem]
sem
fin si
fin para
regresar sem
fin funci
on

Para modelar las clases de nuestro problema (con cancer y sin cancer), se obtienen los vectores de
caractersticas que podemos obtener a partir de nuestra imagen, En la figura 4.11 se muestra el proceso
de extraccion de caractersticas.

A estos vectores de caractersticas se les asocia una etiqueta de clase a la cual corresponden. Para obtener el vector de caractersticas se debe de aplicar alg
un algoritmo de extraccion de caractersticas para
obtener el vector de caractersticas.
A continuaci
on se describen las f
ormulas y algoritmos empleados para la extraccion de caractersticas.

4.2.1.

M
aximo

se hacerca
El maximo nos muestra el valor m
aximo de nuestra imagen esto es el nivel de gris que mAs
al blanco.
A continuacion se describe la f
ormula empleada para obtener el valor maximo de la imagen:
max = max(f (x, y))

4.2.2.

Mnimo

El maximo nos muestra el valor mnimo de nuestra imagen esto es el nivel de gris que mas se acerca al
negro.

4.2. Extracci
on de caractersticas

Cuadro 4.7: Algoritmo 7 Funcion para Filtrar y Recortar la imagen


Entrada: Imagen Im, rango max, lado del pectoral lado
Salida: Imagen Im
funci
on FiltarRecortar(sem)
si lado = 1
ini max
f in ancho Im
fin si
si lado = 2
ini 0
f in max
fin si
para m 0 hasta largo Im
para n Ini hasta f in
Im(m, n) = 0
fin para
fin para
regresar Im
fin funci
on

Cuadro 4.8: Algoritmo 8 Funcion para Filtrar el m


usculo Pectoral
Entrada: Imagen Im, semilla sem, lado del pectoral lado
Salida: Imagen ImSp
funci
on FiltrarPectoral(sem)
si (x, y) en I
si f (x, y) > sem varianza y f (x, y) < sem + varianza
f (x, y) 0
en otro caso
f (x, y) 255
fin si
regresar ImSp
fin funci
on

28

4.2. Extracci
on de caractersticas

Cuadro 4.9: Algoritmo 9 Funcion para Quitar Pectoral


Entrada: Imagen Im, lado del pectoral lado
Salida: Imagen ImSp
funci
on QuitarPectoral(sem)
si lado 1
limite 0
mientras f (x, y) > 100
limite + +
fin mientras
fin si
si lado 2
limite ancho Im 1
mientras f (x, y) > 100
limite
fin mientras
fin si
para cada pxel (x, y) en Im
si lado = 1 y x < limite
f (x, y) 255
si lado = 2 y x > limite
f (x, y) 255
en otro caso
f (x, y) 0
fin si
regresar ImSp
fin funci
on

29

4.2. Extracci
on de caractersticas

30

La siguiente f
ormula se utiliza para obtener el valor maximo de una imagen:
min = min(f (x, y))

4.2.3.

Moda

La moda nos regresa el valor m


as repetido en nuestra imagen.
La siguiente f
ormula se utiliza para obtener el valor maximo de una imagen:
moda = max(H(i))

4.2.4.

Desviaci
on Est
andar

La desviacion est
andar nos muestra que tan dispersos se encuentran los valores de luminocidad de nuestra imagen.
Para obtener la deviaci
on estandar en nuestra imagen empleamos la siguiente formula:
m1
X n1
X

2 =

2
(f (x, y) )

x=0 y=0
mn1

4.2.5.

Asimetra

En teora de la probabilidad y estadsticas , es una medida de la asimetra de la distribucion de una


variable aleatoria. El valor de la asimetra puede ser positivo o negativo, o incluso indefinida. Un valor
negativo indica que existen m
as datos de probabilidad del lado derecho de la media y un valor positivo
que la mayor cantidad de valores se encuentran del lado izquierdo de la media. Un valor cero indica que
los valores son relativamente distribuidos uniformemente en ambos lados de la media.
En la figura 4.12 se muestra la distribucion con asimetra negativa y positiva.
La asimetra de una variable aleatoria X es el tercer momento estandarizado , denotado 1 y se define
como:
X  X )3 
1 =
3

4.2.6.

Uniformidad

Mide la uniformidad de una distribucion de instensidad. Se calcula con la siguiente formula:


U=

L1
X

p (i)2

i=0

4.2.7.

Curtosis

En teora de la probabilidad y estadstica, la curtosis es una medida de la forma. As, las medidas de
curtosis tratan de estudiar la proporci
on de la varianza que se explica por la combinacion de datos ex-

4.2. Extracci
on de caractersticas

31

Cuadro 4.10: Algoritmo 10 Funcion para obtener el Maximo, el Mnimo y la Moda


Entrada: Histograma H
Salida: valor m
aximo max, valor mnimo min, moda moda
funci
on ObtenerCaracteristicas(H)
max 0, min 0, moda 0
para m 0 hasta 255
si H[moda] < H[m]
moda m
fin si
fin para
max max(H)
max min(H)
regresar max, min, moda
fin funci
on

tremos respecto a la media en contraposicion con datos poco alejados de la misma. Una mayor curtosis
implica una mayor concentraci
on de datos muy cerca de la media de la distribucion coexistiendo al
mismo tiempo con una relativamente elevada frecuencia de datos muy alejados de la misma.
El coeficiente de apuntamiento de uso mas extendido es el basado en el cuarto momento con respecto a
la media y se define como:
X  X )4 
2 =
4

4.2.8.

Histograma Medio

El histograma medio es el valor caracterstico que se obtiene a partir de la suma de todos los valores
del histograma dividida entre el n
umero maximo de gris.
El histograma medio se define a continuacion:
AHg =

L1
1 X
N (i)
L
i=0

A continuacion se muestran los Algoritmos para obtener las caractersticas de la imagen

4.2.9.

Algoritmos

4.2. Extracci
on de caractersticas

Cuadro 4.11: Algoritmo 11 Funcion para obtener la mediana,varianza,energa y la entropa


Entrada: Histograma H
Salida: mediana med, varianza var, energa ererg y la entropa entr
funci
on ObtenerCaracteristicas2(Im)
med 0; var 0; entr 0; energ 0
para m 50 hasta 250
npixeles npixeles + H[m]
fin para
para m 50 hasta 250
p[i] H[i]/(double)npixeles
med med + (i H[i])
mediana mediana + (m)(aux[m])
fin para
para m 50 hasta 250
V ar V ar + [(i mediana) (i mediana) (p[i])]
energ energ + [(p[i]) (p[i])]
entr entr + [(p[i]) (log(p[i])) (log(2,0))]
fin para
var sqrt(var)
regresar med, V ar, energ, entr
fin funci
on

Cuadro 4.12: Algoritmo 12 Funcion para obtener el nmero

de pixeles
Entrada: Histograma H
Salida: b
umero de pixeles npixeles
funci
on numPixeles(H)
npixeles 0
para m 0 hasta 255
npixeles npixeles + H[m]
fin para
regresar npixeles
fin funci
on

32

4.2. Extracci
on de caractersticas

Cuadro 4.13: Algoritmo 13 Funcion para obtener la sumatoria de valores del Histograma
Entrada: Histograma H
Salida: sumatoria sum
funci
on sumHistograma(H)
sum 0
para m 0 hasta 255
sum sum + (m H[m])
fin para
regresar sum
fin funci
on

Cuadro 4.14: Algoritmo 14 Funcion para obtener la media


Entrada: Histograma H, n
umero de pixeles npixeles y sumatoria del Histograma sum
Salida: media media
funci
on obtenerMedia(H,npixeles,sum)
media 0
media sum/npixeles
regresar media
fin funci
on

Cuadro 4.15: Algoritmo 15 Funcion para obtener la varianza


Entrada: Histograma H, sumatoria del Histograma sum y media media
Salida: varianza var
funci
on ObtenerVarianza(H, sum, media)
d 0, var 0, desv 0
para m 0 hasta 255
d d + (H[i] pow(i media, 2))
fin para
V ar d/sum
regresar var
fin funci
on

33

4.2. Extracci
on de caractersticas

Cuadro 4.16: Algoritmo 16 Funcion para obtener la desviacion estandar


Entrada: varianza var
Salida: desviaci
on desv
funci
on ObtenerDesviacion(var)
desv sqrt(V ar)
regresar desv
fin funci
on

Cuadro 4.17: Algoritmo 17 Funcion para obtener la suavidad de la imagen


Entrada: varianza var
Salida: suavidad smooth
funci
on obtenerSuavidad(var)
smooth 1 (1/(1 + var))
regresar smooth
fin funci
on

34

4.2. Extracci
on de caractersticas

Figura 4.3: Diagrama de segmentacion de la region mamaria

35

4.2. Extracci
on de caractersticas

Figura 4.4: Imagen de una mamografa digital y su histograma

Figura 4.5: Estimacion del m


usculo pectoral

36

4.2. Extracci
on de caractersticas

Figura 4.6: Estimacion del m


usculo pectoral

Figura 4.7: Valores filtrados en el histograma

37

4.2. Extracci
on de caractersticas

Figura 4.8: Imagen binarizada usando el histograma

38

4.2. Extracci
on de caractersticas

Figura 4.9: localizacion del m


usculo pectoral

Figura 4.10: Imagen binarizada usando el histograma

39

4.2. Extracci
on de caractersticas

Figura 4.11: Extraccion de caractersticas de una imagen

Figura 4.12: Asimetra Negativa y Positiva

40

4.3. Clasificaci
on

41

Cuadro 4.18: Algoritmo 18 Funcion para obtener la asimetra


Entrada: Histograma H, desviaci
on estandar desv y media media
Salida: Asimetra de la Imagen skew
funci
on ObtenerAsimetria(H, desv, media)
sk 0, skew 0
para m 0 hasta 255
sk sk + (H[i] pow(i media, 3))
fin para
skew sk/(s pow(desv, 3))
regresar skew
fin funci
on

4.3.

Clasificaci
on

Una vez obtenidas las caractersticas de las imagenes, procesadas por los algoritmos anteriores, se tienen que seguir dos pasos importante para la clasificacion: El primero es el entrenamiento de la memoria
asociativa que se utiliza y el segundo paso es la recuperacion, en la cual se tiene una imagen de entrada,
la cual pasa por los proceso anteriores segmentacion y extraccion de caractersticas, una vez obtenido
el vector de caractersticas se asocia con una clase del conjunto de entrenamiento.
En esta secci
on se muestra como a partir de las caractersitcas adquiridas, se construye el vector de
caractersticas las cuales serviran en el proceso de clasificacion, ademas de los algoritmos para crear
vectores de caractersticas y la fase de recuperacion.

4.3.1.

Manejo de las caractersticas adquiridas

Para generar los vectores de caractersticas se procede a tomar cada una de las caractersticas de la
siguiente forma:
Para generar nuestro vector buscaremos el valor mnimo vmin y el valor maximo vmax para cada
caracterstica y despues calcularemos un valor entero (entre 0 y 100) para cada n
umero con la siguiente
formula:
val[x] = (x nmin) (100/(nmax nmin))
Con lo cual todas nuestras caractersitcas quedaran en el rango entre 0 y 100. Hecho esto procedemos a crear nuestro vector de caractersticas el cual necesitara un vector de 100 por el n
umero de
caractersticas, es decir, en nuestro caso tenemos 13 caractersticas entonces nuestro vector sera de 1300
bits. Los cuales ser
an llenados por la concatenacion de la representacion en bits de cada caracterstica.
Por ejemplo:

4.3. Clasificaci
on

42

Cuadro 4.19: Algoritmo 19 Funcion para obtener la uniformidad


Entrada: Histograma H y sumatoria del Histograma sum
Salida: uniformidad unif
funci
on ObtenerUniformidad(H, sum)
un 0, unif 0
para m 0 hasta 255
P H[i] H[i]/sum
un un + (pow(P H[i], 2))
fin para
unif un
regresar unif
fin funci
on
Cuadro 4.20: Algoritmo 20 Funcion para obtener la curtosis
Entrada: Histograma H, desviaci
on estandar desv y media med
Salida: curtosis kurt
funci
on Obtenercurtosis(H, desv, med)
k 0, kurt 0
para m 0 hasta 255
k k + (H[i] pow(i media, 4))
fin para
kurt k/((s 1) pow(desv, 4))
regresar kurt
fin funci
on
Cuadro 4.21: Algoritmo 21 Funcion para obtener el Histograma promedio
Entrada: Histograma H y sumatoria del Histograma sum
Salida: curtosis AH
funci
on ObtenerHistProm(H, sum)
AH sum/256
regresar AH
fin funci
on

4.3. Clasificaci
on

Cuadro 4.22: Algoritmo 22 Funcion para obtener la probabilidad de constraste


Entrada: Histograma H y media med
Salida: Probabilidad contraste moded
funci
on ObtenerProbConst(H, sum)
me 0, moded 0
para m 0 hasta 255
me me + (H[i] pow(i media, 2) P H[i])
fin para
moded sqrt(me)
regresar moded
fin funci
on

Cuadro 4.23: Algoritmo 23 Funcion para obtener la asimetra por pixel


Entrada: Histograma H, desviaci
on estandar desv y media med
Salida: Asimetra por pixel kurt
funci
on ObtenerAsimetriaP(H, desv, sum)
ms 0, modsk 0
para m 0 hasta 255
ms +ms(H[i] pow(i media, 3) P H[i])
fin para
modsk ms/pow(desv, 3)
regresar modsk
fin funci
on

43

4.3. Clasificaci
on

44

Supongamos que tenemos los datos x1 = 115,65, x2 = 30,34 y x3 = 3,46, con sus respectivos m
aximos
y mnimos max1 = 130, min1 = 30, max2 = 42,25, min2 = 8,36, max3 = 40,34 y min3 = 20,2 y
que queremos normalizarlos entre los valores 0 y 20.
Entonces nuestro vector quedara como se muestra a continuacion:
Nuestros nuevos valores ser
an los siguientes:
x11 = (x1 min1 ) (20/(max1 min1 )) = (115,65 30) (20/(130 30)) = 17,13 = 17
x21 = (x2 min2 ) (20/(max2 min2 )) = (30,34 (8,36)) (20/(42,25 (8,36))) = 15,29 = 15
x31 = (x3 min3 ) (20/(max3 min3 )) = (3,46 (20,2)) (20/(40,34 (20,2))) = 7,81 = 7
donde:
xb1 = 11111111111111111000
xb2 = 11111111111111100000
xb3 = 11111110000000000000
Nuestro vector queda de la siguiente forma:
vx = xb1 &xb2 &xb3
vx = 111111111111111110001111111111111110000011111110000000000000
Como se observa el algoritmo para realizar este procedimiento es el siguiente:
1. Primero tendremos nuestro conjunto de entradas:
{e1 , e2 , e3 , ..., en }
2. Donde cada entrada le corresponde un conjunto de caractersticas:
{c1 , c2 , c3 , ..., cn }
3. Entonces apartir de la caractersitca ci de cada una de nuestras entradas buecaremos el mayor y
el menor, obteniendo los siguientes conjuntos.
Cmax = {cmax1 , cmax2 , cmax3 , ..., cmaxn } y Cmin = {cmin1 , cmin2 , cmin3 , ..., cminn }
4. A cada caractersitica de cada entrada se le restara el valor mnimo encontrado para la caracterstica, con lo cual nuestros conjuntos tendran como valor mnimo 0.
5. Se normalizan los conjuntos de entrada para dejarlos en un rango fijo (0 a 100) y truncarlos para
convertirlos en un conjunto de enteros nuevo.
{ce1 , ce2 , ce3 , ..., cen }

4.3. Clasificaci
on

45

6. una vez que tenemos normalizadas nuestras entradas las transformamos a bits (0s y 1s) donde
tendremos cei ceros concatenados de 100 cei unos.
Ejemplo:
Supangamos que tenemos el conjunto de entradas:
en = {e1 , e2 , e3 }
Los cuales contienen las siguientes caractersticas:
e1 = {0,2, 7,8, 15,5}
e2 = {3,1, 4,4, 3,6}
e3 = {4,2, 1,3, 10,1}
Entonces de estos valores encontraremos los siguientes conjuntos:
cmax = {4,2, 7,8, 15,5} y cmin = {3,1, 1,3, 3,6}
Restando el valor de caracterstica mnimo obtenemos los nuevos conjuntos:
e1 = {3,3, 9,1, 11,9}
e2 = {0, 5,7, 0}
e3 = {7,3, 0, 6,5}
Ahora se normalizan los conjuntos para dejarlos en un rango fijo (0-100), obteniendo los siguientes
conjuntos:
e1 = {45, 100, 100}
e2 = {0, 62, 0}
e3 = {100, 0, 54}
Para cada valor de cada caractersitca de entrada obtenemos su representacion en bits:
e1 = {11111111111111111111111111111111111111111111100000
00000000000000000000000000000000000000000000000000,
11111111111111111111111111111111111111111111111111
11111111111111111111111111111111111111111111111111,
11111111111111111111111111111111111111111111111111
11111111111111111111111111111111111111111111111111}
e2 = {00000000000000000000000000000000000000000000000000
00000000000000000000000000000000000000000000000000,
11111111111111111111111111111111111111111111111111
11111111111100000000000000000000000000000000000000,
00000000000000000000000000000000000000000000000000
00000000000000000000000000000000000000000000000000}
e3 = {11111111111111111111111111111111111111111111111111
11111111111111111111111111111111111111111111111111,
00000000000000000000000000000000000000000000000000
00000000000000000000000000000000000000000000000000,
11111111111111111111111111111111111111111111111111
11110000000000000000000000000000000000000000000000}

4.3. Clasificaci
on

46

Cuadro 4.24: Algoritmo 24 Funcion para normalizar caractersticas


Entrada: Vector de caractersticas vec, n
umero de caractersticas ncar
Salida: vectorNormailizado vecN
funci
on NormalizarCaracteristicas(vec,ncar)
aux
para m 0 hasta ncar
aux[i] (vec[m] min[m]) (100 max[i])
fin para
para m 0 hasta ncar
para n 0 hasta 100
si aux[i] < n
vecN [m 100 + n] 1
en otro caso
vecN [m 100 + n] 1
fin si
fin para
fin para
regresar vecN
fin funci
on

El Algoritmo 24 muestra el proceso del manejo de las caractersticas, en este algoritmo se muestra la
normalizacion de las caractersticas en el rango 0 a 100
Una vez obtenidos los vectores de caractersticas se forma una matriz donde contendra los vectores
obtenidos, para finalmente formar el conjunto de aprendizaje, en donde se agregaran todos los vectores
normalizados.

4.3.2.

fase de recuperaci
on

Para recuperar una clase son necesarios los algoritmos con las operaciones y de las memorias asociativas.
A continuacion se muestran los algoritmos con las operaciones.
El algoritmo 25 muestra la recuperaci
on con la operacion alfa min (min)

4.3. Clasificaci
on

47

Cuadro 4.25: Algoritmo 24 Funcion para la operacion alfa de memorias asociativas


Entrada: Vectores Normalizados x, y
Salida: Matriz resultante resul
funci
on opAlfa(x,y)
para m 0 hasta el tama
no de x
para n 0 hasta el tama
no de y
si x[m] = x[n]
resul[m, n] 1
en otro caso x[m] == x[n]
si x[m] < x[n]
resul[m, n] 0
en otro caso
resul[m, n] 2
fin si
fin si
fin para
fin para
regresar result
fin funci
on

4.3. Clasificaci
on

48

Cuadro 4.26: Algoritmo 25 Funci


on para la operacion de recuperacion Alfa min (min ) memorias
asociativas
Entrada: Matriz Resultante result, vector Analizar entr
Salida: Matriz min
funci
on recAlfamin(x,y)
para m 0 hasta el tama
no de x
para n 0 hasta el tama
no de y
res 0
si result[m][n] + entr[m] > 1
res 1
fin si
si res < 2
min[m, n] res
fin si
fin para
fin para
regresar min
fin funci
on

4.3. Clasificaci
on

Cuadro 4.27: Algoritmo 25 Funcion para recuperacion de la clase


Entrada: Matriz min
Salida: n
umero de clase resultante numc
funci
on claserec(x,y)
numc 0
para m 0 hasta el tama
no de x
para n 0 hasta el tama
no de y
maximo 0
si min(x, y) = 1
maximo maximo + 1
fin si
fin para
si maximo > numc
numc maximo
fin si
fin para
regresar numc
fin funci
on

49

50

Captulo 5

Resultados
En este captulo se presentan los resultados obtenidos con la metoologa propuesta utilizando los algoritmos expuestos en el captulo anterior. Se muestran los resultados de la segmentacion con las im
agenes
de la base de mini-MIAS.
A continuaci
on se detallan los resultados obtenidos en las etapas de segmentacion extraccion de caractersticas y clasificaci
on.

5.1.

Segmentaci
on de las mamografas

Utilizando los algoritmos correspondientes para la obtencion de la region mamaria, a continuaci


on se
detallan los pasos utilizados.
1. Lectura de la mamografa Digital obtenida de la base de datos mini-MIAS (figura 5.1)
2. Calculo del Histograma (figura 5.2)
3. Calculo de la varianza
4. Localizaci
on del m
usculo pectoral (figura 5.3)
5. Obtenci
on de la semilla en escala de grises (figura 5.4)
6. Recortado de la im
agen en la regi
on Pectoral (figura 5.5)
7. Calibraci
on y Filtrado del Histograma (figura 5.2)
8. Binarizado de la mamografa Digital en el rango del histograma (figura 5.6)
9. Escaneo y segmentaci
on del m
usculo pectoral (figura 5.7)
10. Supresi
on del m
usculo pectoral (figura 5.8)
A continuacion se muestran los resultados correspondientes, aplicando cada uno de los pasos mostrados
anteriormente de algunas im
agenes del Banco de datos mini-MIAS.

5.2. Extracci
on de caracteristicas

51

Figura 5.1: Lectura de la mamografa

5.2.

Extracci
on de caracteristicas

Como resultado de la extracci


on de caracteristicas podemos mencionar que se hizo uso de 12 medidas
estadsticas normalizadas en un rango de 0 a 100, obteniendo como resultado vectores de 1200 bits, los
cuales responden bien a las pruebas de clasificacion.

5.3. Clasificaci
on

52

Figura 5.2: Calculo del Histograma

5.3.

Clasificaci
on

Para hacer pruebas de clasificaci


on se crearon memorias autoasociativas con las clases cancer Benigno
CB, cancer Maligno CB, Sin C
ancer SC, con las cuales se realizaron pruebas obteniendo los resul-

5.3. Clasificaci
on

53

Figura 5.3: Localizacion del m


usculo Pectoral
tados siguientes:
Se analizaron 100 de las 322 im
agenes obteniendo como resultado un porcentaje de exactitud del 85 %,
a continuacion se muestra una tabla con los resultados obtenidos.

5.3. Clasificaci
on

54

Figura 5.4: Obtencion de la Semilla

5.3. Clasificaci
on

55

Figura 5.5: Recortado de la region Pectoral

clase original

muestra

clase candidata

Clasificacion correcta

CB

mdb001

CB

Sigue en la p
agina siguiente

5.3. Clasificaci
on

56

clase original

muestra

clase candidata

Clasificacion correcta

CB

mdb002

CB

SC

mdb003

SC

SC

mdb004

SC

CB

mdb005

CB

CB

mdb006

CB

SC

mdb007

SC

SC

mdb008

SC

SC

mdb009

SC

SC

mdb010

SC

CB

mdb011

CB

SC

mdb012

SC

CB

mdb013

CB

CB

mdb014

CB

SC

mdb015

SC

CB

mdb016

CB

SC

mdb017

SC

CB

mdb018

SC

No

SC

mdb019

SC

CB

mdb020

CB

SC

mdb021

SC

CB

mdb022

CB

CM

mdb023

CM

SC

mdb024

SC

CB

mdb025

CB

SC

mdb026

SC

SC

mdb027

SC

CM

mdb028

CM

SC

mdb029

CB

No

CB

mdb030

SC

No

SC

mdb031

CB

No

CB

mdb032

SC

No

Sigue en la p
agina siguiente

5.3. Clasificaci
on

57

clase original

muestra

clase candidata

Clasificacion correcta

SC

mdb033

SC

SC

mdb034

SC

SC

mdb035

CB

No

SC

mdb036

SC

SC

mdb037

SC

SC

mdb038

SC

SC

mdb039

CB

No

SC

mdb040

SC

SC

mdb041

SC

SC

mdb042

SC

SC

mdb043

SC

SC

mdb044

CB

No

SC

mdb045

SC

SC

mdb046

SC

SC

mdb047

SC

SC

mdb048

SC

SC

mdb049

SC

SC

mdb050

SC

SC

mdb051

SC

SC

mdb052

SC

SC

mdb053

CB

No

SC

mdb054

SC

SC

mdb055

SC

SC

mdb056

SC

SC

mdb057

SC

CM

mdb058

CM

CB

mdb059

CB

SC

mdb060

SC

SC

mdb061

SC

SC

mdb062

CB

No

CB

mdb063

SC

No

Sigue en la p
agina siguiente

5.3. Clasificaci
on

58

clase original

muestra

clase candidata

Clasificacion correcta

SC

mdb064

SC

No

SC

mdb065

SC

SC

mdb066

SC

No

SC

mdb067

CB

SC

mdb068

SC

CB

mdb069

CB

SC

mdb070

SC

SC

mdb071

SC

CM

mdb072

CM

SC

mdb073

SC

SC

mdb074

SC

CM

mdb075

CM

SC

mdb076

SC

SC

mdb077

SC

SC

mdb078

SC

SC

mdb079

SC

CB

mdb080

SC

No

CB

mdb081

CB

SC

mdb082

SC

CB

mdb083

CB

SC

mdb084

SC

SC

mdb085

SC

SC

mdb086

SC

SC

mdb087

SC

SC

mdb088

SC

SC

mdb089

CB

No

CM

mdb090

SM

CB

mdb091

CB

CM

mdb092

CM

SC

mdb093

CS

SC

mdb094

CS

Sigue en la p
agina siguiente

5.4. Conclusiones y Trabajo a furturo

59

clase original

muestra

clase candidata

Clasificacion correcta

CM

mdb095

CM

SC

mdb096

SC

CB

mdb097

CB

SC

mdb098

CS

CB

mdb099

CB

SC

mdb100

SC

Cuadro 5.1: Resultados de clasificacion

5.4.

Conclusiones y Trabajo a furturo

5.4. Conclusiones y Trabajo a furturo

Figura 5.6: Binarizado y Filtrado de la maografa

60

5.4. Conclusiones y Trabajo a furturo

Figura 5.7: Escaneo y Segmentacion del m


usculo Pectoral

61

5.4. Conclusiones y Trabajo a furturo

Figura 5.8: Supresion del m


usculo Pectoral

62

63

Captulo 6

Conclusiones y Trabajos a futuro


6.0.1.

Conclusiones

La aportacion principal de estre trabajo es el dise


no de una nueva metodologa para la segmentaci
on y
clasificaion de las mamografas digitales, esta metodologa hace uso de vectores de gran tama
no por el
n
umero de caractersticas utilizadas, sin embargo da buenos resultados.
En la clasificaci
on con memorias asociativas tipo min en las que se considera el ruido aditivo de las
imagenes, observando que a la hora de clasificar da buenos resultados porcentuales.
Dentro de los objetivos especficos, el primero consistio en mejorar la calidad de la imagen por lo
cual se aplicaron filtros: el de la semilla y por Histograma para quitarle ruido a la imagen y mejorarla
a la hora de segmentar.
El segundo objetivo consisti
o en segmentar la region mamaria para obtener menos margen de ruidos externos, como la supresi
on del musculo Pectoral y demas etiquetas que no pertenecen a la regi
on
de la mama, esto es porque puede causar ruido a la hora de extraer caractersticas, ademas de que las
caracteristcas adquiridas solo pertenecen a la region de interes, en esta etapa se obtuvo un porcentaje
del 91 % de extracci
ones correctas de la region mamaria.
Para la extracci
on de caracteristicas se dise
naron diferentes algoritmos, los cuales obtienen datos especficos de la imagen, que en conjunto forman el vector de clasificacion.
Finalmente a la hora de clasificar se observo que se obtuvieron buenos resultados a la hora de clasificar ya que se obntuvo un porcentaje de 85 % exactitud a la hora de clasificar, lo cual representa un
buen resultado.

6.0.2.

trabajos a Futuro

Para aquellos investigadores que deseen profundizar sobre el tema de deteccion de cancer en mamografas
Digitales, se proponen los siguientes trabajos:
1. Desde el punto de vista de la segmentacion se pueden hacer cambios al algoritmo para mejorar el
proceso de extracci
on de la regi
on de interes.
2. Para la extracci
on de caracteristcas se podrian usar otras propuestas, minimizar las menos efectivas y agregar mejores datos.

64

3. Pruebas con las dem


as mamografas de la base de datos mini-MIAS.
4. Realizar pruebas con otro banco de mamografas Digitales con la misma metodologa.
5. Implementaci
on de la aplicaci
on en dispositivos mas rapidos como los FPGAs.
6. Utilizar alg
un otro algoritmo de clasificacion para realizar pruebas.

65

Bibliografa
[1] G. Tzanetakis and P. Cook, Musical genre classification of audio signals, Speech and Audio
Processing, IEEE Transactions on, vol. 10, pp. 293 302, Julio 2002.
[2] T. Gault, E. Mostafa, A. Farag, and A. Farag, Less is more: Cropping to improve facial recognition with thermal images, in Multimedia Technology (ICMT), 2011 International Conference on,
pp. 6445 6449, Julio 2011.
[3] N. Gal and V. Stoicu-Tivadar, Computer assisted medical image interpretation using fuzzy logic,
in Soft Computing Applications (SOFA), 2010 4th International Workshop on, pp. 159 163, Julio
2010.
[4] Z. M. Win and M. M. Sein, Fingerprint recognition system for low quality images, in SICE
Annual Conference (SICE), 2011 Proceedings of, pp. 1133 1137, Septiembre 2011.
[5] S. Bakshi, S. Das, H. Mehrotra, and P. Sa, Score level fusion of sift and surf for iris, in Devices,
Circuits and Systems (ICDCS), 2012 International Conference on, pp. 527 531, Marzo 2012.
[6] A. Kumar, M. Hanmandlu, A. Das, and H. Gupta, Biometric based personal authentication using
fuzzy binary decision tree, in Biometrics (ICB), 2012 5th IAPR International Conference on,
pp. 396 401, 29 2012-april 1 2012.
[7] P. Sukarno, N. Bhattacharjee, and B. Srinivasan, Increasing level of confidence of iris biometric
matching, in Neural Networks (IJCNN), The 2012 International Joint Conference on, pp. 1 8,
Junio 2012.
[8] A. Kumar and T.-S. Chan, Iris recognition using quaternionic sparse orientation code (qsoc), in
Computer Vision and Pattern Recognition Workshops (CVPRW), 2012 IEEE Computer Society
Conference on, pp. 59 64, Junio 2012.
[9] Z. Zhou, E. Du, N. Thomas, and E. Delp, A new human identification method: Sclera recognition,
Systems, Man and Cybernetics, Part A: Systems and Humans, IEEE Transactions on, vol. 42,
pp. 571 583, Mayo 2012.
[10] P. Thumwarin, N. Chitanont, and T. Matsuura, Iris recognition based on dynamic radius matching
of iris image, in Electrical Engineering/Electronics, Computer, Telecommunications and Information Technology (ECTI-CON), 2012 9th International Conference on, pp. 1 4, Mayo 2012.
[11] M. Wilber, W. Scheirer, and T. Boult, Privv: Private remote iris-authentication with vaulted verification, in Computer Vision and Pattern Recognition Workshops (CVPRW), 2012 IEEE Computer
Society Conference on, pp. 97 104, Junio 2012.

BIBLIOGRAFIA

66

[12] K. Wang, B. Babenko, and S. Belongie, End-to-end scene text recognition, in Computer Vision
(ICCV), 2011 IEEE International Conference on, pp. 14571464, Noviembre 2011.

You might also like