Professional Documents
Culture Documents
•ooS
-'' 4 eü, J,ja'P!Jki
1) c'o 3
o
k
e
Loja - Ecuador
2007
INDICE
INDICE
Contenido Pág.
CAPITULO 1
SELECCIÓN DE LA HERRAMIENTA DE DESARROLLO.................................3
CAPITULO II
CLASIFICACIÓN DE IMÁGENES SATELITALES LANDSAT POR MEDIO DE
REDES NEURONALES SUPERVISADAS
Resumen.................... ..................................................... ... .................... 7
Estado Actual del Arte .............................................................................8
1. Introducción .....................................................................................16
2. Imágenes de satélite Landsat... ........................ .... .................... . ...... ...17
111
3. Estructura del archivo de datos de la imagen de satélite Landsat .........20
4. Red Neurona¡ .................................................................................... 22
4.1 Arquitectura de la red y Algoritmo de aprendizaje....................22
4.2 Tamaño de la arquitectura de la red .......................................30
S. Documentación del Algoritmo NETLAB ................... .. ........................ ...31
6. Experimentación ...............................................................................32
6.1 Verificación de resultados .............................. . ........................ 39
6.2 Clasificación de Fotografía Aérea ............................................39
7. Discusión de resultados ......................................................................41
8. Conclusiones .................................... . ................................... . ............ 42
9. Recomendaciones .............................................................................47
10. Trabajos futuros .............. . ........................... ... ..... . .... . ................. . ..... 48
ANEXOS...............................................................................................51
iv
Figuras
No. Figura Descripción Pág.
LIPA
Tablas
No. Tabla Descripción Pág.
vi
Anexos
vii
Ing. Héctor F. Gómez A.
DOCENTE DE LA ESCUELA DE CIENCIAS DE LA COMPUTACION DE LA
U.T.P.L.; Y, DIRECTOR DE TESIS
CERTIFICA:
DIRECTOR DE TES 5
viii
AUTO RÍA
/U,Mw-.
Nixon Geovanny Acaro Vega
C.I. 1103042402
lx
AGRADECIMIENTO
El Autor
Ki
DEDICATORIA
Para Soledad
Sin su apoyo, esto no habría sido posible.
xi
ACTA DE CESIÓN DE DERECHOS DE TESIS DE
GRADO
El Autor
/91WI
Nixon Geovanny Acaro Vega
xli
Proyecto de Tesis
Ingeniero
Nelson Piedra
Director de la Escuela de Ciencias de la Computación
Universidad Técnica Particular de Loja
Ciudad.-
De mi consideración:
Atentamente,
Nixon Geovanny Acaro Vega Ing. Héctor Gómez
Tesista Docente sugerido como
Director de tesis
Ing. Nelson Piedra Sr. Carlos Correa
DIRECTOR DE LA ESCUELA DE DIRECTOR DE UPSI
CIENCIAS DE LA COMPUTACION
Proyecto de Tesis
Héctor F. Gómez A.
(DIRECTOR DE TESIS)
F) .....................................
Ing. Nelson Piedra
Director de la Escuela Ciencias de la Computación
xv
Proyecto de Tesis
PROYECTO DE TESIS
Privado:
xv'
Proyecto de Tesis
Por otro lado como el objetivo principal del proyecto es clasificar una imagen
satelital, tomamos las características propias de cubierta vegetal, vegetación
sana y agua los mismos que son los patrones con los cuales compararemos
nuestras entradas a la salida de una red neuronal.
xvii
Proyecto de Tesis
II. OBJETIVOS
General:
Específicos:
III. JUSTIFICACION
2
La metodología para el desarrollo del presente proyecto es la propuesta por Martín del Brio.
En el presente trabajo se desarrollará una metodología para la clasificación de usos de
suelos en imágenes satelitales.
xviii
Proyecto de Tesis
Por otro lado, una vez que se entendió el funcionamiento de los módulos
anteriores se procedió a construir y modelar aplicaciones, en donde los
datos se ingresan desde Excel o desde una base de datos y el programa
desarrollado se encarga de arrojar los resultados, los mismos que han sido
comparados con los módulos anteriores y otros programas existentes en el
mercado.
W. METODOLOGÍA
Hipótesis:
Metodología:
xix
Proyecto de Tesis
•:. Huir de las aplicaciones a ciegas de los sistemas de neuronas ' artificiales.
• Se puede usar sistemas comerciales de simulación que proporcionan una
interesante visión del problema, aunque casi siempre es necesario crear
un software específico para la aplicación en desarrollo.
•:• Si la aplicación precisa además tratar muchos datos en tiempo real, o
bien se requiere de un circuito dedicado, pequeño y de bajo consumo,
puede resultar necesario el empleo de hardware neuronal específico.
V. RECURSOS
Humanos:
- 1 Tesista
- 1 Director de tesis
- 1 Asesor del área ambiental
- 1 Asesor de resultados del proyecto
Equipos
Cronograma de actividades
ACTIVIDAD - flEMPOfmesesj - -
123456789
Data Minning / X X
Investigación
Determinación de X X
vectores de
entrada
Uso de X
simuladores y/o
construcción de
aplicaciones
Pruebas y X X
conclusiones
finales
xx
Proyecto de Tesis
Presupuesto
ACTIVIDAD COSTO
Data Mining 2000
Investigación 1000
Determinación de vectores de entrada 1000
Uso de simuladores y/o construcción de 1000
aplicaciones
Pruebas y conclusiones finales 2000
Fuente: Sistema de Información Geogratica U.T.P.L.
VI BIBLIOGRAFÍA
584 páginas.
•:• Martin del Brio, Sanz Molina. Redes Neuronales y Sistemas Difusos, Alfa-
PDF:
XXI
í41
L TE
RECONOCIMIENTO
SUPERVISADO DE PATRONES A
PARTIR DE IMÁGENES
f
SATELITALES DE LA CIUDAD
DE LOJA AÑOS 1980 Y 2000
CAPITULO 1
Selección de la herramienta de
desarrollo
'U niversi6a6 Técnica Particular de Loja
Selección d &i herramienta de Lesaro flTo
CAPITULO 1
SELECCIÓN DE LA HERRAMIENTA DE DESARROLLO
3
Vniversiaécnica (Paicur de Loja
Sección de la herramienta de 6esaro fío
siguientes procesos:
en el capítulo II.
Selección de la herramienta
4
niversiéa6 Técnicaaicu(ar6e Loja
Selección de la herramienta de éesarotío
CAPITULO II
CLASIFICACIÓN DE IMÁGENES SATELITALES LAN DSAT
POR MEDIO DE REDES NEURONALES SUPERVISADAS
Resumen
Abstract
Palabras clave
'4
'7) niversi6aé Técnica çParticulTar d
imágenes sateíita(es £\ÍÇDSfiT
necesario derivar una nueva regla. Con el fin de conseguir este propósito es
muy importante observar las unidades lineales y minimizar el error
cuadrático o en definitiva las salidas deseadas de las salidas obtenidas, una
vía para poder realizar esto es derivando la media del error con respecto a
cada peso, de la siguiente manera:
aE P aE
aw, ao
PY ji
11
7JniversüfadTécnica Particu(ar de
imágenes sate(ita1s L7DSI4T
Las unidades introducen una entrada extra para cada unidad, la cual por lo
general tiene el valor de 1. El peso de esta entrada extra es llamada bias y
es equivalente a un umbral de signo positivo. Esto puede ser tratado como
otro peso.
Una unidad tiene un valor real en la salida, y, como una función no lineal de
la entrada total:
1
x1 = -x
1+e
13
t)niversitfad'Técnica (Particular de Lo
imágenes satetit ates L8'ÍÇDSJ4q
E = —d)2
aE/8y1 =y—d
aE/ax1 =cE/ay1.dy1/dx1
Obteniendo con ello un promedio que se conoce como el cambio total de las
entradas hacia las salidas afectadas por el error. El número total de
entradas se constituye una función lineal (aquí debe recordarse el concepto
de linealmente separables) para los pesos y sus dendritas o conexiones, por
14
Universiéa6'Técnica Particular de Loj
supervisada de imágenes satetit ates £X)'[ÇDSJ4
aEIa =aE/ay.,(l-y1)
Aw = -s8E/?iw
15
'Universiiaé Técnica ÇParticufar de £oj
supervisada de imágenes
1. Introducción
16
L)niversifadTécnica Particu[ar de Loja
C[asficación supervisacfa di imágenes satefita [es L7'f'DSJ4F
Una imagen LANDSAT 7 ETM+ está compuesta por 8 bandas espectrales que
Figura 2.1:
-
--
-
-: -.
17
t)niversidacfTécnica ÇParticu&zr de Lojc
imágenes satelitates
18
1Jniversifa6 Técnica (Particular de Loja
C(as flcación supervisada di imágenes satefitaCes 4V'Í(DSJ4'T
1
CHUVIECO, Emilio. Teledetección Espacial, Editorial Ariel, España, 2006.
19
Onhersi6adTécnica Particular Le Loja
Cíasficación supervisada Le imágenes sateritares LXW)S)4'T
Una vez definidas las bandas que se encuentran en una imagen satelital
ciases:
Las imágenes Landsat (82 columnas por 100 filas) han sido organizadas en
píxeles. Cuatro bandas del satélite han sido tomadas en cuenta para la
clasificación, por lo tanto cada píxel tendrá información de las cuatro bandas,
por ejemplo existirá información del Píxel 1_1, Píxel 1_2, Píxel 1_3, Píxel 1_4.
21
VniversiadTcnica Particular Le Loja
Clasificación supervisada Le imágenes satefitafes LXN(DS4'T
4. Red Neurona¡
salida deseada u objetivo, e iterativamente esta ajusta sus pesos hasta que
del error que comete a cada paso, este proceso es también conocido como
Backpropagation.
siguiente manera:
22
W.. e, w'ki
II
W.. e, w,
23
Universiéad'Técnica Particular de Loja
Clasificación supervisada de imágenes satelTita íes LJ4'SJ4'T
x, w, (1)
la Figura 43:
24
niversicfadTécnica ÇParticufarde Loja
C[asficación supervisada de imágenes satefitafes L]VDS)4F
-JJsj
— MORE
kur ReongIe
IIJ1
f1lTIHhI1llUiilllIfIHhIH
... -MI.
H}1lIIIIl#1IllEIIiIRIlfiIU
R1VIflH14$Hl(
[kil1iUT
II1lIiIllUI1tllhIIiIIiJt
tIHItiítH
ruti: - nmrutvrin,
III WI1t1ffII
que en su forma más común, trabaja con una capa oculta y neuronas de
f(x) = (3)
1+e -
f(x) = -e tanh(x) (4)
« +e
25
Universic[adTécnica Çparticufar d Loj
supervisada de imágenes satefita (es LY1DSJ4'T
E[w,]=_Y:') (5)
2 ¡=1
2 Regla Widrow-Hoff o LMS - Least Mean Squares, mínimos cuadrados; regla de aprendizaje de Adalina.
Actualizaciones de tipo continuo, siendo la actualización de los pesos proporcional al error que la neurona comete.
26
para lo cual se usa el método del descenso por el gradiente [BASE GROUP
aqj =
—(1 / 2) .2 É (t,' - ;' ) = -É t;' - y ) (6)
f)
=—E aElw l
uI=s(t; —yc' (7)
como:
neurona¡ mientras que la ecuación (2) trata de representar todas las salidas
Por ejemplo en PART se puede optimizar el error disminuyendo el valor del nivel de confianza de 0.05 a 0.005.
27
salida sino que también en función de los pesos de las neuronas ocultas
significa que puedan tener respuesta tanto en relación a los pesos como
j]2
til — fwy (9)
11 k
Por lo que las expresiones de actualización de los pesos se obtienen sólo con
derivar, teniendo en cuenta las dependencias funcionales y aplicando
= s con I\"
( ' )i c(i ) (12)
k = t k - f Vk
ji
=EAl1yu con(13)
u k
28
Q)niversid2zdTécnica (Particular de Lojc
Le imágenes satelTita Les £'(çDST
2.1. Llevar a cabo una fase de ejecución para obtener la respuesta de la red
ante el patrón u-ésimo (8).
3. Calcular el incremento total (para todos los patrones) actual de los pesos Jw'kj
y Jw,(l2 y 13). Hacer lo mismo para los umbrales.
29
VniversicíadT[écnica Particular cíe Loja
Cfasficación supervisada cíe imágenes satefitaCes LVTDS)T
Por otro lado se puede limitar el tamaño de la red en base al análisis de las
entradas y aplicando métodos como componentes principales para reducir el
número de parámetros y por ende el número de pesos.
NetLab y NETImage
En este caso se prepara una arquitectura de 36 entradas, 10 nodos y 6
neuronas para la capa de salida, basados en la experiencia del problema.
Weka
Se ha trabajado con una arquitectura de 36 entradas, 21 nodos para la capa
oculta considerando el número de atributos más clases divido para dos y 6
neuronas para la capa de salida. Además existen otras formas de obtener el
número de neuronas en la capa oculta, por ejemplo solamente tomar en
cuenta el número de atributos, o tomar en cuenta el número de clases o por
último el número de atributos más clases.
30
Vniversidad'Técnica (Particular de Loja
Clasificación supervisada de imágenes sateCita1s L!'f(DST
INICIO
y
Crear y encerar a ceros el
vector de parámetros para
el entrenamiento -
1
el vector[1]
no
6. Experimentación
testeo:
los valores de los atributos, en este caso los valores para los píxeles
recordando que se enumeran como P1_1 hasta P9_4. Estos valores han sido
normalizados para que se encuentren en el rango [-1,1] y las clases han sido
net = mlp(nin,10,nout,'logistic')
1
Y=Lí Donde:
1+Ka)
L es la población límite, K = - —1
c
type: 'mip'
nin: 36
nhidden: 10
nout: 6
nwts: 436
outfn: 'softmax'
wl: [36x10 double]
bl: [0.0143 3.6376 4.0970 -5.4432 8.9724 -2.5600 6.1146 6.1730 6.7985 4.17911
w2: [10x6 double]
b2: [-1.0667 0.6672 9.0670 -2.2258 -2.7444 -2.8069]
siguiente manera:
entrenamiento.
options(1) = 1;
options(14) = 100;
33
?Jniversi6adTécnica Particular de Loja
Clasificación supervisada de imágenes sa teíitafes L)45'Í(DS)4T
[net,options] = netopt(net,options,x,xt,scg')
i:iiiiiiiiiiiiiii
Crossvalidation
xf = mlpfwd(net,x);
[C,rate]=confmat(xf,xt)
6
Tasa de aprendizaje.- Se refiere a la dificultad que tiene la red neurona¡ en su proceso de
entrenamiento.
Matriz de confusión.- Matriz de resultados de la clasificación
34
1038
o 13
o 21
O
463
o 3
12
o
4
o 900
44
12
9 3 82 197 6 118
o
18 9 7 392 44
o
1 17 101 32 887
Se logra concluir que existe una clasificación problemática para las clases 4,
la clase 2, 900 a la clase 3, 197 para la clase 4, 392 para la clase 5 y 887
para la clase 7.
Con:
35
1025
3
15
o 28
5 445 O 10 16 3
2 1 856 75 4 23
4 2 76 216 10 107
16 16 4 6 388 40
0 O 22 105 48 863
Test
yf = mlpfwd(net,y);
36
c=
454 0 3 0 4 0
o 211 0 1 12 0
3 1 372 19 0 2
o 2 34 103 2 70
7 6 1 2 193 28
0 1 14 49 13 393
37
?Jniversi6adTécnica Particular de £oj
supervisada de imágenes satetitales LJ7]V(D54q
Los datos que sirven como vector entrada se los tomó a partir de una
entrenamiento. Los resultados fueron los siguientes para una época 8 = 1500
8
Epoca.- Número de ciclos de entrenamiento
Learning rate = Tasa de aprendizaje
38
?)niversi6ad'Técnica ÇParticu&ir de Loja
Clasificación supervisada de imágenes satefitaCes LIrJsf(DSI4T
matriz de confusión:
a b c d e f <-- classified as
10630 6 2 1 0 1 a=1
1 474 0 2 1 1 1 b=2
3 0 833 106 2 17 1 c=3
1 0 44 325 3 42 1 d=4
29 3 0 4 40826 1 e=5
0 0 1 43 9 985 1 f=7
clasificadas.
Para más información del uso del programa WEKA ver anexo No. 4.
39
?JniversicfadTécnica Particu[ar de Loja
C[asficación supervisada de imágenes satefita [es LX7VDSJ4T
Red Neurona¡ - MLP PART 348
a b c d e <-- classified as a b c d e <-- classifled as a b c d e <-- classified as
clasificadores.
40
t)niversicfadTécnica ÇParticuíar d
CCasficación supervisada de imágenes sateCitafs LY1]VDS)4TF
7. Discusión de resultados
sido también utilizados por los clasificadores 348 y PART de los cuales se ha
NA = no aplica
suponer lógicamente que el error tomando las 7 capas del satélite disminuye
notablemente, aunque los resultados obtenidos por Weka a un 92% se
acercan relativamente.
clasificar a los datos con un 92.9% de exactitud o sea con un 7.1% de error.
'° En la columna archivo se utiliza dos tipos de entrenamiento y testeo, debido a que, el
algoritmo presenta características de reducción de error o poda del árbol de clasificaciones.
41
Vniversidad!écnica Particucar ífe Loja
Clasificación supervisada Le imágenes satefitales LXt[DSJ4'T
8. Conclusiones
de la red neurona¡.
de respuesta.
puesto que la red neurona¡ se entrena con éste archivo y además las
presente trabajo.
43
?JniveriaadTécnica Particular Le Loja
Cfasficación supervisada Le imágenes satefitafes L)4]ST(D521'T
c) Para zonas diversas como Loja se debe tener cuidado ya que los
cambios en el uso de suelo es radical, en una zona podemos
es de 30 metros.
44
Vniversic[adTécnica (Particular de Loja
Clasificación supervisada di imágenes satefitaCes LJ4]f'DS.i4'T
1. Resultados
1038 O 13 O 21 O
463 0 3 12 O
4 O 900 44 1 12
9 3 82 197 6 118
18 9 O 7 392 44
0 1 17 101 32 887
Lo que nos permite concluir que para la clase uno que tenemos
suelo gris, 187 de suelo gris húmedo, 392 suelo con vegetación
El P
454 0 3 0 4 0
o 211 0 1 12 0
3 1 372 19 0 2
o 2 34 103 2 70
7 6 1 2 193 28
0 1 14 49 13 393
Matriz que nos permite concluir que los resultados son válidos
resultados.
2. Efectividad
46
?JniversüfadTécnica (Particular de Lo
imágenes satefit ates £J4fDSfiq
9. Recomendaciones
47
Universidaé Técnica Particular de Loja
Cfasficación supervisada de imágenes sateCita (es LMDSJ4T
Por otro lado se puede repetir el ejercicio propuesto para el presente trabajo
para tratar la red con las 7 bandas del satélite Landsat.
48
'Universi6a6Técnica ÇParticu(ar de £oj
supervisada cíe imágenes
BIBLIOGRAFIA
•. NETLAB: www.ncrg.aston.ac.ak
49
7.) niversifaé 'Técnica (Particular de Loj
imágenes sateiÇitalTes LXNÇDSfiT
50
ANEXOS
Anexo N° 1
Procesamiento de datos de imágenes
LAN DSAT
VniversiadTécnica Particular de Loja
J4neo 1. Procesamiento 6e datos Le Imágenes LV?DS)4'T
b. Obtener los valores de cada uno de los pixeles con sus respectivos
respaldos en las bandas:
1 2 3
J236
53
Pixel
Banda
1.1 1.2 1.3 1.4
2.1 2.2 2.3 2.4
3.1 3.2 3.3 3.4
4.1 4.2 4.3 4.4
5.1 5.2 5.3 5.4
4- PIXEL CENTRAL
u 6.1 6.2 6.3 6.4
(51 7.1 7.2 7.3 7.4
8.1 8.2 8.3 8.4
-4 9.1 9.2 9.3 9.4
Red
Green
1 X = Pixel
Blue J
54
Anexo N 0 2
Aplicativo NETLAB
1JniversiaradTíécnica (Pa rticu(ar cíe Loja
)4neo 2: )4pficación .W'FJFLI4ÇB
Aplicativo NETLAB
[x,xt,nn,nout,xndata] =datread('sattrn.txtT);
[y,yt,nin,nout,yndata] =datread('sattst.txt');
net = mlp(nin,10,nout,'IogisticT)
type: 'mip'
nin: 36
nhidden: 10
nout: 6
nwts: 436
outfn: 'softmax'
wl: [36x10 double]
bl: [0.0143 3.6376 4.0970 -5.4432 8.9724 -2.5600 6.1146 6.1730 6.7985 4.17911
w2: [10x6 double]
b2: [-1.0667 0.6672 9.0670 -2.2258 -2.7444 -2.8069]
Crossvalidation:
Test:
57
Anexo N° 3
Aplicativo NETImage
t)niversitfacf'Técnica Particular de Loja
3: )4pfícación rNLTImage
Aplicativo NETImage
INICIO
c
Entrenamiento de la Red
Backpropagation
Presentación de resultados
por vector - grid
C: D
59
Test: Ejecuta la red neurona¡, con los vectores que tiene por entrada los
cuales son tomados desde una base de datos.
Run: Sirve para examinar la red neuronal, en este caso los valores que le
ingresan es el vector de testeo, sin las clases.
60
7)niversi6adTécnica ÇParticu/Tar d £
neo 3: I4píicación ]V'LTImage
Archivos de entrada
Eeenderdo ieet de la ed
Veco de Ertedee
Trainl Ep-
fineuronas
intermedias
10
Salida
Excel
61
kiíir-ouow 1IJ1J]
Arcleo Ed!:5n e- IlserteÇ FOrmetÓ Her-arfi-rte, ra105 Ient,CC - -- - - ÉF x
° ÚE
A.
API •
AH Al AJ A AL AHJ A13
-0 -024117647 -016073431 -0 11372049 -3 3176406 O O 1 0 31
2 -0 31 7 64706 -034 117617 -022352341 -013431373 -030035216 0 0 1 0 0
3 -030033216 -034117647 -322352941 -016431373 -0 30030216 0 0 1 0 0 0
I4 -336039216 -034117647 -310215666 -010431373 -030030216 0 0 1 0 0 0
O -338039216 -0 38039216 -016070431 -0 11803804 -0 31764 7 06 0 0 1 0 0 0
6 -331764736 -0 30039216 -3 16070431 -0 14308004 -031764 7 06 3 0 1 0 0 0
7 — -334801961 -039030216 -018215606 -010431373 -039639216 0 0 1 0 0 0
O -038030216 -030039216-025490106 -021060627 -039039216 0 0 1 0 0 0
9 -044313720 -030039216 -031764706 -027058024 -044313725 0 0 0 1 0 0
10 -044013720 -0 39330216 -031764706 -027050824 -04745093 0 0 0 1 0 0
11 -04 745000 -0 41176111 -001704706 -024705082 -044310725 0 0 0 1 0 0
12 -07746088 -044313 728-031764 7 06 -030196078 -07 7 40090 0 0 0 1 0 0
13 -04745090 -044313725 -030039216 -0364 7 8500 -001372048 0 0 0 1 0 0
14 -081372049 -0445090 -041176471 -033333333 -001272040 0 0 0 1 0 0
15 -04746000 -0 44313 725 -041176471 -036470809 -001372840 0 0 0 1 0 0
11 -351372549 -04746098 -041176471-033333333 -044313725 0 0 0 1 0 0
17 -344313725 -04745000 .041176171 -024705002 -908039215 0 0 0 1 9 0
18 -336036216 -041176471 -0 34001064 -024705002 -0:14901061 0 0 0 1 0 0
19 -1 -0 '1l7r,4706 -034117647 .822302941 -014800004 -031761706 0 0 1 0 9 0
20 -001764786 -030980302 -0 16070434 -014809804 -034001001 3 0 1 0 0 0
211 -3 31 7 64706 -030903392 -019210696 -004809004 -0 31764706 0 0 1 0 0 0
122 -301764786 -034117617 -019215606 -0013 72049 -021764 7 06 0 0 1 0 0 0
L -331764 7 06 -030900392 -012041176 -011372549 -0 2043137 3 0 1 0 0 0
24: -027643137 -027059324 -812041176 -011372549 -02704313 7 0 0 1 3 0 0
-031764706 -1) 2 7 000024 -0 16078431 -0 11372049 -0 31764706 0 0 1 0 0 0
20 -031764706 -0 30900302 -016078431 -0 14500904 -027013437 0 0 1 0 0 0
27 -027013137 -030880332 -016076431 -014509904 -031 764786 0 0 1 3 3 0
-031 754 7 09- -038090302 -016073431 -014000004 -031 764700 0 0 1 0 0 0
29 1 .031164706 -030900392 -0 16070131 -0 14509504 -331764 7 06 0 0 1 0 0 0
33' -031 7 64 7 36 -827089824 -019215696 -011809004 -031 764 7 06 0 0 1 0 01 0
U i \ sattrn/ 1<
. Atofw \ \ DCJ: 1J -= e
En este caso la primera fila ha sido clasificada como tipo 3 puesto que
sostiene ceros para las demás clases.
Los datos obtenidos en la columna clase final son los datos respuesta de la
red neurona¡ (Valores obtenidos) que corresponden a la nueva clasificación
del archivo de testeo, en donde la clase escogida es la que por cada columna
tiene el menor error.
63
)niversiíaé'Técnica ÇParticu(ar di £
J4neo 3: )4p(icación METImage
El botón EXCEL nos sirve para exportar todos los datos del grid de test al
programa Microsoft Excel, con el fin de realizar el análisis de la clasificación.
Para que los datos se exporten de forma correcta, luego de la clasificación,
se debe ubicar y seleccionar la primera fila del grid.
64
Anexo N° 4
Manual de WEKA
t)niversiéacf 'Técnica Particularée Loja
J4nexo 4: 1'EK$
funciona en cualquier plataforma sobre la que haya una máquina virtual lava
disponible.
Una vez que Weka esté en ejecución aparecerá una ventana denominada
selector de interfaces, que nos permite seleccionar la interfaz con la que
66
UniversidadTécnica cParticulTar d
J4ne.p 4: WEK11
. :
GUI
Simple CLI Expio rer
Experimenter K ieeFiow
presente trabajo.
67
UniversidadTécnica Particular de £
)4ncxp 4: 'r1i/ER)4
Ficheros .arff
©relation <nombre-de-la-relación>
es la siguiente:
son:
c) DATE Expresa fechas, para ello este tipo debe ir precedido de una
etiqueta de formato entrecomillada.
68
VniversifadTécnica Particular d
)4ne,Co 4: WE?(A
dd Día.
MM Mes.
yyyy Año.
HH Horas.
mm Minutos.
ss Segundos.
@data
4,3.2
de los elementos que son nulos, rodeando cada una de las filas entre
atributo.
©data
{1 4, 3 3}
Es posible añadir comentarios con el símbolo " %", que indicará que
prueba.arff
Particu[ar6e Loja
J4neo 4: 'l4AER,2t
Explorer
la siguiente:
-
- VuaflPAiiJ
Status
Welcome to the Weka Explorer o
S. Selección de atributos.
6. Visualización de datos.
71
Q)niversifadTécnica Particufar d
.4neo 4. í1i/E?Ç4
1. Preprocesado
Open File
único que admita, para ello tiene interpretadores de otros formatos. Éstos
son:
Open Un
Con este botón se abrirá una ventana que nos permitirá introducir una
el apartado anterior.
Open DB
Con este botón se nos da la posibilidad de obtener los datos de una base de
datos.
wekaexperimentlnstanceQuery
databaseURL jJd3cJdb=probancloweka.prp
password ¡prueba 1
query ISELECT * Írom monos-tratados
sparseData FIse
usernarne 1roDt
L9Ii1
í LiicLJ
Para configurarla lo primero es definir la url por la cual es accesible la base
(sparse data).
73
t)niversifad'Técnica (ParticuCarde Loj
neco 4:
Una vez seleccionado el origen de los datos podremos aplicar algún filtro
sobre él o bien pasar a las siguientes secciones y realizar otras tareas. Los
botones que acompañan a abrir el fichero: Undo y Save, nos permiten
deshacer los cambios y guardar los nuevos datos ya transformados (en
formato arif). Además, se muestra en la ventana siguiente cada uno de los
atributos que componen los datos, junto con un resumen con estadísticas de
los mismos (media aritmética, rango de los datos, desviación estándar,
número de instancias distintas, de qué tipo son, etc.).
2 5 8
Status
---
OK mg
74
Aplicación de filtros
Weka permite aplicar una gran diversidad de filtros sobre los datos,
botón Choose dentro del recuadro fi/terse nos despliega un árbol en el que
-- -----------------------------------------------------
Preproces Ciiiyt Clister AsSOCI4te 1 Selert 1
D Normalize
D NumericTotinary
N ti tu e nc T ras Sto rm
Obtuscate
fl PKlDiscrelize
oH
Status
OK L±J ixO
categoría unsupervísed
75
Vniversi6ací 'Técnica Particufarfe Loja
)4twp 4: '4'E
refiriéndonos a los otros atributos por "a" seguido del número del
cos, exp, sqrt, floor (función techo), ce!! (función suelo), rint
(redondeo a entero), tan, sin, (, )
atributos que deseamos excluir para aplicar este filtro. Dicho intervalo
podemos expresarlo por cada uno de los índices los atributos
76
Q)niversic[adTécnica çparticurar d
Ane.*co 4: 1'EK)l
filtro es útil en conjunción con otros, ya que hay ciertos filtros (la
menos uno).
77
?Jniversidad2Técnica Particular de Loja
)4nexo 4: fri)E1ÇJ4
X(i) =
78
7Jniversiaaf 'Técnica ÇParticu[ar de Loja
J4ne,o 4: 4zLRJ4
será el O.
Obfuscate Ofusca todas las cadenas de texto de los datos. Este filtro
es muy útil si se desea compartir una base de datos pero no se quiere
mismos.
79
t)niversic[adTécnica ÇParticufarde Loja
I4neo 4: '11'EKJ4
con probabilidad
80
'lJniversi6adTécnica Particu&zr d
4ne.o 4: 4'EJCJ4
NúrneroDeAtributosDisi mt os *100
VariacionObtenida
NúmeroDeA tributos
= x(i) — x
X(i)
U(X)
n° de instancias
frec. de la palabra i en la instancia j * log -----------------------------------------
n° de instancias con la palabra i
TfTransform Otra regla de transformación:
log(1+frecuencia de la palabra i en la instancia j)
81
niversiadTTcnica Particular de L
J4ne,co 4: WflÇ
instancia.
82
'U niversidac[ 'Técnica Particular di
4ne(p 4: 4'ERI
aleatoria.
NonSparseToSparse.
2. Clasificación
Pr
eprare 1 Classify rC!,r tAóCiat Vsu$Iz 1 -
Class,fier - - -- -
Choose ZeroR 111111
Test options •----- CIassiIier output
lite training set
Supplied test set -
i Cross-validation Folds iOJ
Percentaqe split
More optons... H
ons)dass
P statt H
Result tist ight-ctick for options)
Status
OK LJo J xo
84
?Jniversi6acRFécnica ÇParticufar de Loja
J4ne,o 4: 'WEKJ4
dentro del área C/ass/fier. Una vez pulsado se desplegará un árbol que nos
permitirá seleccionar el clasificador deseado. Una vez seleccionado
filtro con la interfaz y luego obtener el resultado apto para línea de mandato.
4 modos de prueba:
Con esta opción Weka entrenará el método con todos los datos disponibles y
Cross-validation
cada clase).
Percentage split
restante se probará.
Una vez definido el método de prueba Weka nos permite seleccionar algunas
Rl Output mnht
Rl Output per-(Iass stats
Rl Output entropy evaluation rneasures
IYJ Output Confusion matrix
Rl Store prediuions Tor visualization
fl Cost-sensltive evaluation
Randorn seed for XVaI / Y. SpIit
OK
construido.
86
t)niversiifad'Técnica ÇParticu(ar de Loja
ne,o 4: WLKJ4
clase.
refleja los errores producidos sino también informa del tipo de éstos.
Gordas Flacas
32 4 Gordas
4 43 Flacas
Donde las columnas indican las categorías clasificadas por el clasificador y las
filas las categorías reales de los datos. Por lo que los elementos en la
87
t) niversicfaé'Técnica (Particu/Tar Le
J4iwo 4: í1'L7C
- x
p enoecs Claeeufp Asod*t* VIsuøzej
Classifier
Choose ISMO -c 1.0 -E 1,0 -GO 01 -A 1000003 -T 0.0010 -P LOE-12 -N 0 -R -Y -1 -Ti
Test options - Classitier autput -----------------------------------
Use training set Stratltled cross-ealiclatlOfl
Sun ea ry
Supplied test set
(orrectly (lassfied lostances 139 92.6667
i Cross-valldation FoIdS iOJ Incorrectly Classified Inutances 11 7.3333 E
(1: Percentaqe split Kappa statistir 0.89
Mean absol ate error 0.2385
More options Root coas sqaared error 0.3005
Relative absol ate error 53.6667 E
Root reative squared error 63.7704 8
'Iom) dass Total Number of Instantes 150
Start Detailed Accuracy By Class
Result Iist
Qiqht-click Por options) TP tate PP Rote Preciaba tecali F-Measre (lasa
Iris-set005
185347 tunctionsSMO 10 1 1 1
0.92 0.07 0.868 0.92 0.893 Iris-versicolor
0.86 0.04 0.915 0.86 0.887 Iris-virginica
Ceofasi os Matri u
b c c-- classified as
50
a 0 0 1 a = Iris-setosa
0 46 4 1 5 - Iri 5-ocmi color
0 7 43 1 c Iris-virbnica
Status --
------------- -
xO
OK
88
Oniersícfad'Técnica cParticuíar d
ne)co 4: 'r'VL NYÍ
89
Piot iris_predicted
••: ;:
C dSS U)OUI
Irissetos It'1s-ericc1cr
90
Universic[ac['ILcnica ÇparticufardTe Loja
J4ne,o 4: 141EKJ4
x Y-: Instcenurnber
a um) "n
rYinstancenumberUm) -
[iourInstance_nurnberum)" 1 [PoIygon"j
SuhrnvtCIear J Savel Jitter ÇJ1
I
Piot irN_t)redirtíi
Class colour
74.5 149
Una vez seleccionada a nuestro gusto con el botón Submit nos mostrará
sólo los datos capturados en el área de la figura que hemos trazado. El botón
Reset sirve para volver a la situación inicial y el botón Save es para guardar
los valores de los datos en un fichero arif.
91
L)niversid2zif 'Técnica çTParticufardé Loja
)4 neo 4: 'f4"ER4
ventana que nos permitirá modificar los colores en una extensa gama.
LUt] ii 1 RGC1
Reciente:
jjjjJjjJ.J_iJi11JJ1J11
JJLJJL)J J .IJJJ LJ1J JJJJJJ J
J%JI1 un 1iJ 1 JLLIJ_LLLi
JIJJJ
_J J11J
Vista previa
II
Tree View
29-29
1- ; -
36 36 10,5 >= 10.5
92
Vniversidad'Técnica Particufar Le Loja
Anexo 4: 4'LR)4
• Select Font Nos permite ajustar el tamaño del tipo de letra del texto.
Si pulsamos el botón secundario sobre un nodo del grafo nos dará la
opción de Visualize the node, si hay instancias que correspondan a
ese nodo nos las mostrará.
3. Clustering
___ -
p rep rocess 1 iier Áate st1u1but 1**
Clusterer
Choose jSimpIeKMeans -N 2 - S10
- SlmpIeKMeaflS
0 1 <-- assgned tu cluster
0 50 1 Iris-setcua
50 0 1 Iris-versiculur
50 0 1 Iris-virçflnica
Status
01< -J Loq X
assignments con esto obtendremos una ventana similar a las del modo
explorador para mostrar gráficas en el que nos mostrará el clustering
realizado.
94
VniversiaadTécnica ÇParticu [ar d
ne)co 4: 'TiIÁTE?Ç4
4. Búsqueda de Asociaciones
reseñar que estos métodos sólo funcionan con datos nominales. Éste es sin
Associator output
Start - -------
-
3. / 0,607625 0,571429 0,000000 */ terperature = coci ==> humidity normal
Result list Oight-clict 4. / 0,594071 1,000000 0,300000 */ humi dity = normal ==> temperature = roo]
S. / 0,590214 0,600000 0,000000 W/ outlook = sunny and humidity = hiqh ==> play = no
6. /* 0,555556 0,555556 0,000000 */ play = no ==> outlook = ounoy or nndy = TRUE
Tertius
-
7• /W 0,486606 0,636364 0,000000 */ humidity = normal ==> nutinok = rainy or play = yes
- priori 8. /* 0,486606 0,428571 0,000000 */ outlook = nunny aol play = no ==> humility hgh
22:33:10 Apriori 9 /* 0,469374 0,444444 0,000000 */ outlook = osercaat ==> play = yen
10. / 0,469374 0,444444 0,000000 */ temperature hot ==> outlook = overcast or humidlt
11. / 0,469374 0,500000 0,000000 */ temperature = hot ano play = yes ==> outlook = oeer
12. /* 0,469374 0,444444 0,000000 / temperature = hot ==> outlnnk = osercast nr play =
13. /' 0,469374 0,444444 0,000000 */ outlook = overcast ==> temperature hoz nr eindy =
14. /* 0,469374 0,500000 0,000000 */ outlook = ooercast aol windy = FALSE ==> temperatur
15. / 0,469374 0,500000 0,000000 */ play = no ==> huoidity hiqh nr windy = TRUE
16. /* 0,469374 0,444444 0,000000 */ humidity = hi9h aol play = no ==> outleok = ounry o!
17. /* 0,469374 0,444444 0,000000 */ temperature = mill and play yen ==> outlook = ral
18. 0,469374 0,500000 0,000000 */ nutlook = sunny ==> temperature = con] nr vindy = T
/ 0,467119 1,000000 0,500000 */ play = yes ==> oatlook = overcast
19.
20. /* 0,458333 0,800000 0,250000 */ play = yes ==> oatlook = overcaot nr e4ndy = FALSE 3
21. /' 0,458333 0,600000 0,111111 y humlu]ty = n1 911 ano PI ay = no ==> nUtinOk sunny
22. /' 0,439100 0,571429 0,142857 */ play = no ==> hunidity = hiph
23. /* 0,439100 0,666667 0,200000 */ humidity = hiOb ==> temperature = mill nr play =no
:24. 0,439100
/* 0,666667 0,200000 */ humidity = hi9h ==> outlnnk = ounny nr temperature
Status
Smc error ;oij L_.!iii!!J _1
-
1x x 0 1
S. Selección de Atributos
de datos que poseen unos ciertos atributos, aquellos atributos que tienen
más peso a la hora de determinar si los datos son de una clase u otra.
95
t)niversiíadFécnica Particular d
,4 nexo 4: WL?C:4
Search Method
Choosellestíirst -D 1 -N 5
Attribute Seieilion Mode Attríbute seleilion output
i tice fui¡ training set
Cross-vafldation
Attri bote Sel ecti on on al] input data
Search Method:
Best first.
Start set: no attributes
Start Search direction: forard
Stal e search arte r 5 node expansi sos
ResuIt Iist (right-ctick lar aptions)
Total nusber oC subseto evaluated: 33
Merit 01' best subset found: 0.924
—
Status ..............
OK
10 9 '(°
6. Visualización
ss - tJ*4
VsuJize
ncr MMIN CACH CHMIN
c las
L..
CHMA\
(HM IN
ç
. ------------------- ________
Status ---------. .
x 0
OK
97
Jniversifad'Técnica Particular de Loja
)4neo 4: WL?()
Pulsando doble dllck sobre cualquier gráfica se nos mostrará en una ventana
nueva con el interfaz para gráficas ya explicado. Las opciones que ofrece
este modo se activan mediante las barras deslizantes. Las posibles opciones
son:
Plotsize Define el tamaño del lado de cada una de las gráficas en píxeles,
de 50 a 500.
Jitter Añade un ruido aleatorio a las muestras, de manera que espacia las
muestras que están físicamente muy próximas, esto tiene utilidad cuando se
en un área.
Atributes, que nos permite elegir los atributos que se representarán en las
gráficas. El último botón que se encuentra en esta ventana es el Subsample
que permite definir el tanto por ciento de muestras (que escogerá
98
t)niversiaa6'Técnica çparticurar d
iw,p 4: 4'E1(4
trabajo se usan los archivos sattrn.arff y sattst.arff, los cuales contienen los
C:\Lenguajes\j2sdkl.4.2_08\bin\data.
99
Anexo N° 5
Método de Gradiente Conjugado
Escalado
'Universic[adTécnica Particular de Loja
)4neo 5: Método de SCÇ
el usuario. Los valores de estos parámetros son cruciales para el éxito del
algoritmo.
El algoritmo SCG denota una aproximación cuadrática para el error Een una
en orden para determinar el mínimo para Eqw (y) deben encontrarse los
puntos críticos para Eqw (y) los cuales son la solución para el sistema lineal
definido por:
101
Anexo N° 6
Imagen satelital y Fotografía aérea
(JníversidacfTécnica Particufar de Loja
)4nexo 6: Imágenes sateL(itaíesy 'Fotografías aéreas
r' P!•i
r'
4
d4.
.VL ¡1 ,,1..b%
1 ."& •»
, *
. . •1
11
•-. .I.• ) ;
•4l..'& i
103
7JniversidadTécnica Particular de Loja
)4nexo 6: Imágenes satefita(esy 'Fotografías aéreas
104