EN EL SECTOR ASEGURADOR Por : Estefana Cano Martnez POR QUE EL PROBLEMA? Por el alto porcentaje en la cancelacin de plizas, alcanzando en algunos productos niveles de cancelacin del 80% con respecto al total emitido. Al mismo tiempo, cerca del 70% de las cancelaciones se realizan durante el primer ao de vigencia del seguro, lo cual significa un alto costo para las empresas. FASES DEL KDD Seleccin del objetivo: En este paso se observo el problema el cual era las altas cancelaciones de plizas que se presentan en una de las principales empresas de seguros, una vez definido el problema, se identificaron fuentes de datos y posteriormente, se seleccionaron un subconjunto que sea til para la aplicacin de un algoritmo de minera de datos. Preproceso de datos: el preproceso consisti bsicamente en la estandarizacin y el agrupamiento de datos, ya que, como se mencion anteriormente, dicha muestra fue proporcionada por la empresa en estudio.
Minado de datos: se ha elegido al algoritmo J4.8 de WEKA para la construccin de un modelo de minera de datos. El algoritmo J4.8 genera rboles de decisin los cuales clasifican los datos en clases o categoras. Esta clasificacin sirve adems para predecir la clase de instancias que an no han sido clasificadas. Interpretacin de resultados: Como resultado de la induccin, WEKA obtuvo un rbol de decisin QU TIPO DE TAREA SE CONCENTRO EN ATENDER LA MINERA? CMO LO HIZO?
Construir modelos predictivos que clasifiquen a los clientes de una institucin Seguros de acuerdo a su grado de lealtad. Todo ello fue realizado mediante arboles de prediccin donde dada una base de datos se construyen diagramas de construcciones lgicas y que en base a caracteristicas dadas se llega a las soluciones. RESULTADOS OBTENIDOS Como resultado de la induccin, WEKA obtuvo un rbol de decisin de tamao 6,421 (suma de nodos internos y nodos hoja), con 4,318 salidas o nodos hoja.