You are on page 1of 2

Curso:

Minería de Datos

Participante:
Raúl Torres Hernández

Actividad:
“Descripción KDD”

Fecha: 15 de noviembre 2018

1
Knowledge Discovery in Databases (KDD)

El KDD es un análisis exploratorio, automático y de modelado de grandes


repositorios de datos, es el proceso organizado que identifica patrones válidos,
novedosos, útiles y comprensibles a partir de conjuntos de datos grandes y
complejos. Dentro de este proceso, se considera que la minería de datos (Data
Mining) es el núcleo del proceso ya que implica la deducción de algoritmos que
exploran los datos, desarrollan el modelo y descubren patrones previamente
desconocidos.
Previamente a las etapas que corresponden a este proceso, sería necesario
realizar un paso previo en el cual se definen los objetivos, los diferentes
escenarios que pueden resultar para la toma de decisiones, así como la definición
inicial de tiempos y recursos para el proyecto de KDD.

Pasos KDD:
1.- Selección de los datos a tratar: es importante que estén bien identificados y
definido de donde serán extraídos con todos sus atributos requeridos, ya que en
el paso del Data Mining estos son utilizados para el aprendizaje.
2.- Preprocesamiento y limpieza de datos: en esta etapa los datos que pudieran
estar corruptos o que no se encuentren son incrustados, corregidos o eliminados
según sea el caso, para tener set de muestras más homogéneas.
3.- Transformación de los Datos: en esta etapa los datos son adaptados para una
mejor presentación, desechados datos que no ofrecen algún valor, mediante
agrupamientos, reducción de dimensiones y técnicas como la “normalización”.
4.- Minería de Datos: en esta etapa se selecciona el algoritmo de clasificación a
utilizar y se define una estrategia para obtener aprendizaje, se aplica el método
seleccionado las veces que sea necesario hasta obtener los resultados
esperados, obviamente cambiando variables y parámetros para sus re-
ejecuciones.
5.- Evaluación de Resultados: etapa final donde se evalúan los resultados que
son mostrados mediante patrones o reglas contrastados contra los objetivos, en
esta etapa se puede regresar a repetir el proceso, y se decide si se puede hacer
uso del conocimiento obtenido.

You might also like