Professional Documents
Culture Documents
Minería de Datos
Participante:
Raúl Torres Hernández
Actividad:
“Descripción KDD”
1
Knowledge Discovery in Databases (KDD)
Pasos KDD:
1.- Selección de los datos a tratar: es importante que estén bien identificados y
definido de donde serán extraídos con todos sus atributos requeridos, ya que en
el paso del Data Mining estos son utilizados para el aprendizaje.
2.- Preprocesamiento y limpieza de datos: en esta etapa los datos que pudieran
estar corruptos o que no se encuentren son incrustados, corregidos o eliminados
según sea el caso, para tener set de muestras más homogéneas.
3.- Transformación de los Datos: en esta etapa los datos son adaptados para una
mejor presentación, desechados datos que no ofrecen algún valor, mediante
agrupamientos, reducción de dimensiones y técnicas como la “normalización”.
4.- Minería de Datos: en esta etapa se selecciona el algoritmo de clasificación a
utilizar y se define una estrategia para obtener aprendizaje, se aplica el método
seleccionado las veces que sea necesario hasta obtener los resultados
esperados, obviamente cambiando variables y parámetros para sus re-
ejecuciones.
5.- Evaluación de Resultados: etapa final donde se evalúan los resultados que
son mostrados mediante patrones o reglas contrastados contra los objetivos, en
esta etapa se puede regresar a repetir el proceso, y se decide si se puede hacer
uso del conocimiento obtenido.