You are on page 1of 8

SECUENCIA DE ACTIVIDADES P1 Curso 2013-14

Seman Activida Contenido


a d
I Presentacin de la asignatura y definir detalles del curso.
Febrero
15 QU ES LA MINERA DE DATOS? Conceptos generales
de MD. Nuevas necesidades, El concepto de minera de
datos. Ejemplos. Descubrimiento de Conocimiento en
Datos (KDD). Identificar problemticas que requieran del
empleo de tcnicas de Minera de Datos (MD).

La minera de datos y el proceso de descubrimiento de


conocimiento en bases de datos. Relacin con otras
disciplinas. Campo de aplicacin y algunos ejemplos
AP#1 concretos.

Que son los Modelos, tareas y herramientas de MD.


Etapas del desarrollo que ha tenido la MD, disciplinas
ligadas o vinculadas y ejemplos de algunas aplicaciones
realizadas.

Explicar que es el KDD. Explicar la necesidad de emplear


metodologas para el desarrollo del KDD, mencionar
algunas y hablar sobre sus diferencias y puntos de
contacto.

ANP#1 Metodologa CRISP-DM, caractersticas generales.


Principio en que se sustenta. El contexto del la
metodologa de MD. Las fases del CRISP-DM. Anlisis del
Negocio, Entendiendo los datos, Preparacin de los datos.
Modelado, Evaluacin e Implementacin.

Herramientas de MD. Mencionar y diferenciar algunas


herramientas disponibles para la realizacin de MD.

WEKA, caractersticas generales. Recomendaciones para


su instalacin. Contexto de la Herramienta Weka.
Orgenes. Cules son sus caractersticas principales. Qu
posibilidades nos ofrece como herramienta? Detalles de su
instalacin, relaciones con los diferentes sistemas
operativos.

Orientaciones para la ejercitacin del la Herramienta Weka.


Su instalacin, ficheros .arrf, caractersticas, compatibilidad
con procesadores de texto y con hojas de clculo de
tipo .csv.

II Metodologa CRISP-DM, caractersticas generales.


Febrero Principio en que se sustenta. El contexto del la
22 metodologa de MD. Las fases del CRISP-DM. Anlisis del
Negocio, Entendiendo los datos, Preparacin de los datos.
Modelado, Evaluacin e Implementacin.

Herramientas de MD. Mencionar y diferenciar algunas


herramientas disponibles para la realizacin de MD.

WEKA, caractersticas generales. Recomendaciones para


AP#2 su instalacin. Contexto de la Herramienta Weka.
Orgenes. Cules son sus caractersticas principales. Qu
posibilidades nos ofrece como herramienta? Detalles de su
instalacin, relaciones con los diferentes sistemas
operativos.

Orientaciones para la ejercitacin del la Herramienta Weka.


Su instalacin, ficheros .arrf, caractersticas, compatibilidad
con procesadores de texto y con hojas de clculo de
tipo .csv.

ANP#2 Fuente de datos, Recopilacin de datos, informes escritos,


archivos antiguos, generadores de datos on line, procesos
OLTP y OLAP. Almacenes de datos y bases de datos
transaccionales. Datamarts. Datawarehouse.

La Preparacin de los Datos, etapas que involucra y


algunas de las tecnologas y tcnicas utilizadas en cada
una. Situaciones o problemas frecuentes en la preparacin
de los datos y sus posibles soluciones.

Pre procesado de Datos. Recopilacin e integracin.


Limpieza y transformacin. Exploracin y seleccin. En qu
consiste la recopilacin de datos. Procesos de Extraccin
transformacin y Carga. Fases de la integracin de datos.

Identificar objetos. Descomposicin de objetos. Unificacin


de formatos. Unificacin de unidades de medidas. Datos
faltantes e inconsistentes. Contradicciones. Datos que no
aportan al anlisis.

Acciones para eliminar errores. Reduccin de la


dimensionalidad por transformacin. Mtodos. Creacin de
nuevas caractersticas. Uso de la Discretizacin.
Numerizacin. Normalizacin de rango. Exploracin.
Seleccin de atributos.
III Fuente de datos, Recopilacin de datos, informes escritos,
Marzo archivos antiguos, generadores de datos on line, procesos
1 OLTP y OLAP. Almacenes de datos y bases de datos
transaccionales. Datamarts. Datawarehouse.

La Preparacin de los Datos, etapas que involucra y


algunas de las tecnologas y tcnicas utilizadas en cada
una. Situaciones o problemas frecuentes en la preparacin
de los datos y sus posibles soluciones.

Pre procesado de Datos. Recopilacin e integracin.


Limpieza y transformacin. Exploracin y seleccin. En qu
consiste la recopilacin de datos. Procesos de Extraccin
AP#3
transformacin y Carga. Fases de la integracin de datos.

Identificar objetos. Descomposicin de objetos. Unificacin


de formatos. Unificacin de unidades de medidas. Datos
faltantes e inconsistentes. Contradicciones. Datos que no
aportan al anlisis.

Acciones para eliminar errores. Reduccin de la


dimensionalidad por transformacin. Mtodos. Creacin de
nuevas caractersticas. Uso de la Discretizacin.
Numerizacin. Normalizacin de rango. Exploracin.
Seleccin de atributos.

ANP#3
El Pre procesado de Datos en WEKA, (Preprocces),
Carga de ficheros, Interfaz de usuario del pre procesado,
Explicacin de las acciones Undo, Edit, Save.

Manejo de atributos, All, None, Invert, Remove. La Tabla de


Atributos, informacin que brinda, manejo de la misma.
Informacin sobre el atributo seleccionado, nombre, tipo,
valores notables, Visualize, base de visualizacin.

Aplicacin de filtros, tipos de filtros por instancias, por


atributos, supervisados o no.

Seleccin de filtros, especificaciones para un filtro


especfico, aplicacin del filtrado, observacin y valoracin
de la accin, rechazar la accin con undo, aceptar la
accin usando save versin #

IV El Pre procesado de Datos en WEKA, (Preprocces),


Marzo
8 Carga de ficheros, Interfaz de usuario del pre procesado,
Explicacin de las acciones Undo, Edit, Save.

Manejo de atributos, All, None, Invert, Remove. La Tabla de


Atributos, informacin que brinda, manejo de la misma.
Informacin sobre el atributo seleccionado, nombre, tipo,
valores notables, Visualize, base de visualizacin.
AP#4
Aplicacin de filtros, tipos de filtros por instancias, por
atributos, supervisados o no.

Seleccin de filtros, especificaciones para un filtro


especfico, aplicacin del filtrado, observacin y valoracin
de la accin, rechazar la accin con undo, aceptar la
accin usando sabe versin #

Entrega de la ejercitacin # 1 para el Laboratorio de la CE


#5
ANP#4
Auto preparacin individual para el Laboratorio # 1
Introduccin a WEKA
AP#5 Laboratorio # 1 Ejercicio Integrador sobre el uso del Weka.
V
Marzo
15
ANP#5 Auto preparacin individual para TCC

AP#6 TCC # 1

Tareas Descriptivas. Asociacin. Reglas de Asociacin.


Definicin. Ejemplos. Clasificacin de las reglas de
asociacin. Distintas Reglas de Asociacin, Cobertura
(support), Confianza (confidence), Otras mtricas de
VI calidad. Lift, Leverage, Conviccin.
Marzo
22 Uso de WEKA para el tratamiento de la tarea de
ANP#6
asociacin.
Seleccin del algoritmo y fijacin de parmetros de este,
puesta en marcha, icono de estado, Lista de resultados y
salida de resultados de la asociacin.
Algoritmo A priori.

VII
Marzo
29 Tareas Descriptivas. Asociacin. Reglas de Asociacin.
Definicin. Ejemplos. Clasificacin de las reglas de
asociacin. Distintas Reglas de Asociacin, Cobertura
(support), Confianza (confidence), Otras mtricas de
calidad. Lift, Leverage, Conviccin.
AP#7
Uso de WEKA para el tratamiento de la tarea de
asociacin.
Seleccin del algoritmo y fijacin de parmetros de este,
puesta en marcha, icono de estado, Lista de resultados y
salida de resultados de la asociacin.
Algoritmo A priori.

ANP#7
Agrupamiento (Clustering). Concepto, ejemplos. Formas de
determinar los grupos. Tipos de agrupamiento. Formas de
lograr el agrupamiento. Clustering Numrico (k-medias).
Tipos de Agrupamiento y caractersticas generales de los
mtodos de agrupamiento. Los mtodos basados en
vecindad. Medidas de similitud vs distancia. Identificar
medidas de distancia y similitud para atributos nominales y
numricos. Agrupamiento en WEKA. Tipos de
Agrupamiento y algoritmos. K-media en WEKA,
observacin grafica de los resultados.

Agrupamiento (Clustering). Concepto, ejemplos. Formas de


determinar los grupos. Tipos de agrupamiento. Formas de
lograr el agrupamiento. Clustering Numrico (k-medias).
Tipos de Agrupamiento y caractersticas generales de los
mtodos de agrupamiento. Los mtodos basados en
AP#8
vecindad. Medidas de similitud vs distancia. Identificar
medidas de distancia y similitud para atributos nominales y
VIII numricos. Agrupamiento en WEKA. Tipos de
Abril Agrupamiento y algoritmos. K-media en WEKA,
5 observacin grafica de los resultados.

Clasificacin. Definicin. Clasificadores en Weka. rboles


de Decisin en Weka como herramientas de clasificacin.
ANP#8 Caractersticas generales de los rboles de Decisin.
Algoritmo ID3 y J48. Caractersticas de estas herramientas.
Ejercitacin y ejemplos.

IX
Abril Clasificacin. Definicin. Clasificadores en Weka. rboles
12 de Decisin en Weka como herramientas de clasificacin.
AP#9 Caractersticas generales de los rboles de Decisin.
Algoritmo ID3 y J48. Caractersticas de estas herramientas.
Ejercitacin y ejemplos.

ANP#9
Las Redes Neuronales como herramientas de clasificacin
y caractersticas generales de las Redes Neuronales
Artificiales. Aprendizaje de las Redes Neuronales
Artificiales. Caracterizar el aprendizaje de las Redes
Neuronales Artificiales. Multilayer Perceptron,
caractersticas de esta herramienta en Weka.

Las Redes Neuronales como herramientas de clasificacin


y caractersticas generales de las Redes Neuronales
Artificiales. Aprendizaje de las Redes Neuronales
AP#10
Artificiales. Caracterizar el aprendizaje de las Redes
Neuronales Artificiales. Multilayer Perceptron,
X caractersticas de esta herramienta en Weka.
Abril
26
El teorema de Bayes y la Hiptesis MAP. Caractersticas
generales de los mtodos bayesianos. Clasificador
ANP#10 Bayesiano Simple. Caracterizar el clasificador bayesiano
simple en Weka. Utilizar Weka para obtener modelos
probabilsticos a partir del clasificador bayesiano simple.

El teorema de Bayes y la Hiptesis MAP. Caractersticas


generales de los mtodos bayesianos. Clasificador
AP#11 Bayesiano Simple. Caracterizar el clasificador bayesiano
XI simple en Weka. Utilizar Weka para obtener modelos
Mayo probabilsticos a partir del clasificador bayesiano simple.
3
Auto preparacin individual para el Laboratorio # 2
Clasificadores, Arboles de decisin, Redes Neuronales,
ANP#11
Mtodos Bayesianos.

XII AP#12 Laboratorio # 2 Ejercicio Integrador sobre el uso del Weka.


Mayo
10 Auto preparacin individual para TCC
ANP#12
XIII
Mayo AP#13 TCC # 2
17
ANP#13
Auto preparacin individual para el Laboratorio # 3
Caractersticas generales de las tcnicas de evaluacin.
Evaluacin de clasificadores. Identificar y caracterizar las
tcnicas de evaluacin de clasificadores. Evaluacin de
clasificadores en WEKA. Evaluacin de mtodos de
agrupamiento. Identificar y caracterizar las tcnicas de
evaluacin de mtodos de agrupamiento.

Laboratorio # 3 Ejercicio Integrador sobre el uso del Weka.


AP#14
XIV
Mayo
24 Auto preparacin individual para discusin de Tarea de
ANP#14
Curso

XV
Discusin de la Tarea de Curso. Evaluacin del proyecto de
Mayo
AP#15 MD del ejercicio integrador utilizando la metodologa
31
CRISP-DM y la herramienta WEKA.

Revista general de los temas ms importantes tratados en


XVI
la asignatura, Aclaracin general de dudas en especial
Junio AP#16
sobre las caractersticas generales de las tcnicas de
7
evaluacin.

You might also like