Professional Documents
Culture Documents
• Reconocer el potencial y la problemática del análisis de • Reconocer los beneficios de su uso sistemático de técnicas de
sistemas de información para la toma de decisiones. extracción de conocimiento para la obtención de modelos y
patrones predictivos o descriptivos.
• Conocer las ventajas y casos donde es aconsejable recopilar
información interna y externa en un Almacén de Datos. • Conocer las fases del Descubrimiento de Conocimiento de
Bases de Datos y la importancia de las mismas en el éxito del
• Conocer el modelo multidimensional de datos de los proceso (en especial las de limpieza y selección de datos).
almacenes de datos y los operadores de refinamiento
asociados: drill, roll, slice & dice, pivot. • Conocer las distintas técnicas de aprendizaje automático y
estadísticas utilizadas en minería de datos, su potencial, su
• Conocer la arquitectura y diferentes implementaciones coste computacional y sus limitaciones de representación y
(ROLAP, MOLAP) de Almacenes de Datos. de inteligibilidad.
1
Temario (1 de 4) Temario (2 de 4)
PARTE I: INTRODUCCIÓN
1.1. Finalidades y Evolución de los Sistemas de
(tiempo estimado: 1 hora)
Información.
PARTE II: ALMACENES DE DATOS
1.2. Herramientas para la Toma de Decisiones:
(tiempo estimado: 4 horas) Parte I:
Introducción diferencias e interrelación.
PARTE III: MINERÍA DE DATOS
1.3. Almacenes de Datos, OLAP y Minería de Datos:
(tiempo estimado: 7 horas)
definición e interrelación.
PRÁCTICAS SOBRE PARTE III: 8 horas.
7 8
Temario (3 de 4) Temario (4 de 4)
2.1. Introducción a los almacenes de datos: motivación 3.1. Introducción a la Minería de Datos (DM)
definición y características. 3.1.1. Motivación
3.1.2. Problemas tipo y aplicaciones
3.1.3. Relación de DM con otras disciplinas
2.2. Arquitectura de un sistema de almacén de datos. 3.2. El proceso de KDD
3.2.1. Las Fases del KDD
2.3. Explotación de un almacén de datos: herramientas 3.2.2. Tipología de Técnicas de Minería de Datos
Parte II: Parte III: 3.2.3. Sistemas Comerciales
OLAP. 3.2.4. Visualización
Almacenes Minería
3.3. Técnicas de Minería de Datos
de Datos de Datos
2.4. Sistemas ROLAP y MOLAP. 3.3.1. El Problema de la Extracción Automática de Conocimiento.
3.3.2. Evaluación de Hipótesis
3.3.3. Técnicas no supervisadas y descriptivas.
2.5. Carga y Mantenimiento de un Almacén de Datos. 3.3.4. Técnicas supervisadas y predictivas.
3.4. Web Mining
2.6. Diseño de un almacén de datos. 3.4.1. Los Problemas de la Información No Estructurada.
3.4.2. Extracción de Conocimiento a partir de Documentos HTML y texto.
3.4.3. Extracción de Información semi-estructurada (XML).
2.7. Líneas de investigación abiertas. 9 3.5. Líneas de Investigación Abiertas 10
Material: • Inmon, W.H. "Building the Data Warehouse", John Wiley, 1992
• Inmon, W.H. et al. "Managing the Data Warehouse", John Wiley,
• Transparencias y boletines. 1997
• Software: • Inmon, W.H. et al. "Data Warehouse Performance", John Wiley,
SPSS Clementine 6.0 1999
• Otra Documentación: • Kimball, R. "The Data Warehouse Toolkit", John Wiley, 1996
• Kimball, R et al. "The Data Warehouse Lifecycle Toolkit", John
Wiley, 1998
http://www.dsic.upv.es/~jorallo/cursoDWDM • Giovinazzo, W. "Object-Oriented Data Warehouse Design",
Prentice-Hall, 2000.
Sesiones de 4 horas: • Jarke, M. et al. "Fundamentals of Data Warehouses", Springer,
• 2 exposición 2000.
• 2 prácticas con Clementine
11 12
2
Bibliografía (2/3). Minería de Datos Bibliografía (3/3). Minería de Datos
• Berry M.J.A.; Linoff, G.S. “Mastering Data Mining” Wiley 2000. • Hand, D.J.; Mannila, H. and Smyth, P. “Principles of Data Mining”, The
• Berthold, M.; Hand, D.J. (ed) “Intelligent Data Analysis. An MIT Press, 2000.
Introduction” Springer 1999. (Nueva edición a aparecer en 2002). • Hernández, J.; Ramírez, MJ.; Ferri, C. “Introducción a la Minería de
• Dunham, M.H. “Data Mining. Introductory and Advanced Topics” Datos” Pearson Prentice Hall, a aparecer 2004.
Prentice Hall, 2003. • Kosala, R.; Blockeel, H. “Web Mining Research: A Survey” ACM
• Dzeroski, S.; Lavrac, N. “Relational Data Mining” Springer 2001. SIGKDD Explorations, Newsletter of the ACM SIG on Knowledge
• Etzioni, O. “The World- Wide Web. Quagmire or Gold Mine” Discovery and Data Mining, June 2000, Vol. 2, nº1, pp. 1-15.
Communications of the ACM, November 1996, Vol. 39, nº 11, 1996. • Mena, Jesus “Data Mining Your Website”, Digital Press, July 1999.
• Fayyad, U.M.; Piatetskiy-Shapiro, G.; Smith, P.; Ramasasmy, U. • Mitchell, T.M. “Machine Learning” McGraw-Hill 1997.
“Advances in Knowledge Discovery and Data Mining”, AAAI Press / • Pyle, D. “Data Preparation for Data Mining” Morgan Kaufmann,
MIT Press, 1996. Harcourt Intl., 1999.
• Fayyad, U.M.; Grinstein, G.; Wierse, A. “Information Visualization in • Thuraisingham, B. “Data Mining. Technologies, Techniques, Tools, and
Data Mining and Knowledge Discovery” Morgan Kaufmann, Harcourt Trends”, CRC Press, 1999.
Intl., 2001. • Witten, I.H.; Frank, E. “Tools for Data Mining”, Morgan Kaufmann, 1999.
• Han, J.; Kamber, M. “Data Mining: Concepts and Techniques” Morgan • Wong, P. C. “Visual Data Mining”, Special Issue of IEEE Computer Graphics
Kaufmann, 2001. 13 and Applications, Sep/ Oct 1999, pp. 20- 46. 14