You are on page 1of 4

Clase 1: Introduccin General y Proceso de Extraccin de Conocimiento

Presentacin de posgrado y cuerpo docente. Presentacin de alumnos.


Calendario. Forma de aprobacin
Motivacin del Data Mining y Evolucin de los sistemas para la toma de
decisiones
Minera de datos y descubrimiento de conocimiento. Definiciones y
conceptos.
Dominios de aplicaciones y ejemplos.
Presentacin de las diferentes tcnicas de Data Mining. Aprendizaje
supervisado y no supervisado.
El proceso de extraccin de conocimiento. Etapas.
Presentacin del Trabajo Prctico

Clase 2: Exploracin y preparacin de datos

Tipos de atributos (categricos, ordinales, continuos).


Anlisis exploratorio de datos. Medidas estadsticas resumen (media,
mediana, ). Visualizaciones (Histogramas, box plot, matriz de
dispersin, coordenadas paralelas, diagramas estrella, etc)
Calidad de datos. Problemas (Ruido, outliers, valores faltantes)
Preparacin de datos (Agregaciones, Muestreo, Reduccin de la
dimensionalidad, Seleccin de atributos, Creacin de atributos,
Discretizacin, Transformacin de atributos.
Prctica con Weka. Ejemplos, Ejercicios y TP

Clase 3: Mtodos de Clasificacin. rboles de decisin

Definicin. Caractersticas.
Ejemplo de aplicacin del modelo.
Mecanismo de construccin.
Condiciones de corte segn el tipo de atributo.
Homegeneidad e Impureza. Entropa. Criterios de parada.
Sobreajuste. Poda.
Mtricas de evaluacin.
Prctica con Weka. Ejemplos, Ejercicios y TP

Clase 4: Mtodos de Clasificacin. Bayes Ingenuo y Vecinos ms cercanos

Bayes Ingenuo
o Teorema de Bayes. Ejemplo de aplicacin.
o Clasificador Bayes Ingenuo. Caractersticas.
Vecinos ms cercanos
o Caractersticas y consideraciones.
o Eleccin del K.
o Distancias.
o Diagramas de Voronoi.
Comparacin de las tcnicas
Ejemplos de trabajos utilizando tcnicas de clasificacin
Prctica con Weka. Ejemplos, Ejercicios y TP

Clase 5. Prctica sobre TP

Trabajo sobre el caso de negocio y la herramienta de SW.


Objetivos. Consultas de avance. Creacin de variables.

Clase 6: Prediccin Numrica. Regresin lineal simple y mltiple

Regresin lineal simple y mltiple.


Estimacin por Cuadrados Mnimos. Suposiciones del modelo. Prueba
de hiptesis. Coeficiente de determinacin R. Anlisis de la varianza y
de residuales. Multicolinealidad.
Transformaciones. Variables dummy.
Interaccin. Mtodos de ajuste paso a paso.
Prctica con Weka. Ejemplos y Ejercicios.

Clase 7: Regresin Logstica

Odds Ratio. Riesgo Relativo (RR). Modelo de Regresin logstica


Estimacin por Mxima Verosimilitud.
Interpretacin de los coeficiente. Significacin de variables. Intervalo de
Confianza. Seleccin de variables. Comparacin de modelos
Medidas de ajuste: R, test de Hosmer-Lemeshow.
Puntos influyentes y outliers. Anlisis de residuales. Residuos de
Pearson, Leverage, Distancia de Cook.
Clasificacin. Precisin. Curvas ROC, grficos lift, ganancia, etc.
Prctica con Weka. Ejemplos, Ejercicios y TP

Clase 8: Redes Neuronales


2

Definicin. Similitudes entre neuronas biolgicas y artificiales. Estructura


de procesamiento de una RNA.
Algoritmo de aprendizaje. Funciones de activacin.
Arquitecturas. Perceptrn. Backpropagation.
Caractersticas. Dificultades
Prctica con Weka. Ejemplos, Ejercicios y TP

Clase 9: Reglas de Asociacin

Definiciones.
Construccin de las reglas. Algoritmo Apriori.
Evaluacin (Soporte, Confianza, Lift, ...)
Distintos tipos de asociaciones.
Ejemplos de trabajos realizados
Prctica con Weka. Ejemplos y Ejercicios.

Clase 10: Mtodos de Aglomeramiento (Clustering)

Mtodos jerrquicos y no jerrquicos (Kmeans).


Distancias.
Construccin de los clusters.
Ventajas y limitaciones de cada tcnica.
Evaluacin.
Ejemplos de agrupamientos ptimos y problemticos.
Ejemplos de trabajos realizados utilizando clustering.
Prctica con Weka. Ejemplos y Ejercicios.

Clase 11: Ensamble. Evaluacin. Implementacin

Votacin por mayora. Boosting. Bagging. Ensambles personalizados


Evaluacin de modelos. Matriz de confusin, mtricas, costos. Curvas
ROC, etc
Implementacin del modelo.
PML. Integracin de los modelos en suite de BI.
Consultas sobre TP

Clase 12: Presentacin de otras herramientas de DM.

Presentacin de diferentes herramientas del mercado, libres y no.


3

Ejemplos de modelos desarrollados.


Consultas sobre TP

Clases 13 y 14: Tpicos relacionados. Tendencias en Data Mining


El contenido de estas clases se ir actualizando continuamente en relacin con
las tendencias del mercado.
Algunos ejemplos: SNA (Anlisis de redes sociales), Web Mining, Big Data,
Text Mining, Recuperacin de informacin, Visualizacin de informacin, etc.
Clase 15: Exposicin de los Trabajos Prcticos
Presentacin y defensa del trabajo prctico integrador
Repaso de temas para el examen
Clase 16: Examen
Cronograma de Clases
1. Introduccin a DM y KDD. Presentacin del Trabajo Prctico
2. Exploracin y preparacin de datos
3. rboles de decisin
4. Bayes Ingenuo y Vecinos ms cercanos
5. Trabajo sobre TP
6. Regresin lineal simple y mltiple
7. Regresin Logstica
8. Redes Neuronales
9. Reglas de Asociacin
10. Mtodos de Aglomeramiento (Clustering)
11. Ensamble. Evaluacin. Implementacin
12. Herramientas de DM.
13 y 14. Clases Especiales. Tpicos relacionados. Tendencias en Data Mining
15. Presentacin de TP
16. Examen

You might also like