You are on page 1of 3

Objetivos Generales

Análisis y Extracción de Conocimiento en


Sistemas de Información: El objetivo fundamental de este curso es:
conocer el potencial, la problemática y la tecnología
(DW+DM) de análisis y extracción de conocimiento
Datawarehouse y Datamining sobre sistemas de información

Chihuahua, 9-11 de octubre de 2003 Se instancia en dos subobjetivos principales:


conocer las técnicas de almacenes de datos y
José Hernández Orallo DW OLAP para facilitar el procesamiento analítico de
apoyo a la toma de decisiones estratégicas.
jorallo@dsic.upv.es
Departamento de Sistemas Informáticos y Computación
saber aplicar las técnicas de minería de datos
Universidad Politécnica de Valencia DM apropiadas para problemas concretos de
extracción de conocimiento. 2

Objetivos Específicos (1/4) Objetivos Específicos (2/4)

• Reconocer el potencial y la problemática del análisis de • Reconocer los beneficios de su uso sistemático de técnicas de
sistemas de información para la toma de decisiones. extracción de conocimiento para la obtención de modelos y
patrones predictivos o descriptivos.
• Conocer las ventajas y casos donde es aconsejable recopilar
información interna y externa en un Almacén de Datos. • Conocer las fases del Descubrimiento de Conocimiento de
Bases de Datos y la importancia de las mismas en el éxito del
• Conocer el modelo multidimensional de datos de los proceso (en especial las de limpieza y selección de datos).
almacenes de datos y los operadores de refinamiento
asociados: drill, roll, slice & dice, pivot. • Conocer las distintas técnicas de aprendizaje automático y
estadísticas utilizadas en minería de datos, su potencial, su
• Conocer la arquitectura y diferentes implementaciones coste computacional y sus limitaciones de representación y
(ROLAP, MOLAP) de Almacenes de Datos. de inteligibilidad.

• Reconocer pautas para el diseño y mantenimiento de ADs. 3 4

Objetivos Específicos (3/4) Objetivos Específicos (4/4)

• Elegir, para un problema concreto, qué técnicas de minería de


datos son más apropiadas. Además, y especialmente dirigido a los asistentes del mundo
académico:
• Generar los modelos y patrones elegidos utilizando una
herramienta o paquete de minería de datos. • Conocer los problemas abiertos en la investigación de
almacenes de datos y minería de datos.
• Evaluar la calidad de un modelo, utilizando técnicas sencillas
de evaluación (validación cruzada). • Conocer los congresos y foros más importantes, así
• Utilizar métodos de combinación de técnicas (p.ej. voting) y como las redes, recursos, etc., relacionados con ambas
de reiteración (p.ej. boosting). disciplinas.

• Conocer la problemática especial de la minería sobre la web


(documentos textuales e hipertextuales) y las técnicas más
usuales. 5 6

1
Temario (1 de 4) Temario (2 de 4)

PARTE I: INTRODUCCIÓN
1.1. Finalidades y Evolución de los Sistemas de
(tiempo estimado: 1 hora)
Información.
PARTE II: ALMACENES DE DATOS
1.2. Herramientas para la Toma de Decisiones:
(tiempo estimado: 4 horas) Parte I:
Introducción diferencias e interrelación.
PARTE III: MINERÍA DE DATOS
1.3. Almacenes de Datos, OLAP y Minería de Datos:
(tiempo estimado: 7 horas)
definición e interrelación.
PRÁCTICAS SOBRE PARTE III: 8 horas.

7 8

Temario (3 de 4) Temario (4 de 4)
2.1. Introducción a los almacenes de datos: motivación 3.1. Introducción a la Minería de Datos (DM)
definición y características. 3.1.1. Motivación
3.1.2. Problemas tipo y aplicaciones
3.1.3. Relación de DM con otras disciplinas
2.2. Arquitectura de un sistema de almacén de datos. 3.2. El proceso de KDD
3.2.1. Las Fases del KDD
2.3. Explotación de un almacén de datos: herramientas 3.2.2. Tipología de Técnicas de Minería de Datos
Parte II: Parte III: 3.2.3. Sistemas Comerciales
OLAP. 3.2.4. Visualización
Almacenes Minería
3.3. Técnicas de Minería de Datos
de Datos de Datos
2.4. Sistemas ROLAP y MOLAP. 3.3.1. El Problema de la Extracción Automática de Conocimiento.
3.3.2. Evaluación de Hipótesis
3.3.3. Técnicas no supervisadas y descriptivas.
2.5. Carga y Mantenimiento de un Almacén de Datos. 3.3.4. Técnicas supervisadas y predictivas.
3.4. Web Mining
2.6. Diseño de un almacén de datos. 3.4.1. Los Problemas de la Información No Estructurada.
3.4.2. Extracción de Conocimiento a partir de Documentos HTML y texto.
3.4.3. Extracción de Información semi-estructurada (XML).
2.7. Líneas de investigación abiertas. 9 3.5. Líneas de Investigación Abiertas 10

Material y Organización Bibliografía (1/3). Almacenes de Datos

Material: • Inmon, W.H. "Building the Data Warehouse", John Wiley, 1992
• Inmon, W.H. et al. "Managing the Data Warehouse", John Wiley,
• Transparencias y boletines. 1997
• Software: • Inmon, W.H. et al. "Data Warehouse Performance", John Wiley,
SPSS Clementine 6.0 1999
• Otra Documentación: • Kimball, R. "The Data Warehouse Toolkit", John Wiley, 1996
• Kimball, R et al. "The Data Warehouse Lifecycle Toolkit", John
Wiley, 1998
http://www.dsic.upv.es/~jorallo/cursoDWDM • Giovinazzo, W. "Object-Oriented Data Warehouse Design",
Prentice-Hall, 2000.
Sesiones de 4 horas: • Jarke, M. et al. "Fundamentals of Data Warehouses", Springer,
• 2 exposición 2000.
• 2 prácticas con Clementine

11 12

2
Bibliografía (2/3). Minería de Datos Bibliografía (3/3). Minería de Datos

• Berry M.J.A.; Linoff, G.S. “Mastering Data Mining” Wiley 2000. • Hand, D.J.; Mannila, H. and Smyth, P. “Principles of Data Mining”, The
• Berthold, M.; Hand, D.J. (ed) “Intelligent Data Analysis. An MIT Press, 2000.
Introduction” Springer 1999. (Nueva edición a aparecer en 2002). • Hernández, J.; Ramírez, MJ.; Ferri, C. “Introducción a la Minería de
• Dunham, M.H. “Data Mining. Introductory and Advanced Topics” Datos” Pearson Prentice Hall, a aparecer 2004.
Prentice Hall, 2003. • Kosala, R.; Blockeel, H. “Web Mining Research: A Survey” ACM
• Dzeroski, S.; Lavrac, N. “Relational Data Mining” Springer 2001. SIGKDD Explorations, Newsletter of the ACM SIG on Knowledge
• Etzioni, O. “The World- Wide Web. Quagmire or Gold Mine” Discovery and Data Mining, June 2000, Vol. 2, nº1, pp. 1-15.
Communications of the ACM, November 1996, Vol. 39, nº 11, 1996. • Mena, Jesus “Data Mining Your Website”, Digital Press, July 1999.
• Fayyad, U.M.; Piatetskiy-Shapiro, G.; Smith, P.; Ramasasmy, U. • Mitchell, T.M. “Machine Learning” McGraw-Hill 1997.
“Advances in Knowledge Discovery and Data Mining”, AAAI Press / • Pyle, D. “Data Preparation for Data Mining” Morgan Kaufmann,
MIT Press, 1996. Harcourt Intl., 1999.
• Fayyad, U.M.; Grinstein, G.; Wierse, A. “Information Visualization in • Thuraisingham, B. “Data Mining. Technologies, Techniques, Tools, and
Data Mining and Knowledge Discovery” Morgan Kaufmann, Harcourt Trends”, CRC Press, 1999.
Intl., 2001. • Witten, I.H.; Frank, E. “Tools for Data Mining”, Morgan Kaufmann, 1999.
• Han, J.; Kamber, M. “Data Mining: Concepts and Techniques” Morgan • Wong, P. C. “Visual Data Mining”, Special Issue of IEEE Computer Graphics
Kaufmann, 2001. 13 and Applications, Sep/ Oct 1999, pp. 20- 46. 14

You might also like