Professional Documents
Culture Documents
MATERIA
METODOS DE ANALITICA PARA LA INDUSTRIA
INTEGRANTES:
ALVARADO LAVANDA STEVEN.
HENRIQUEZ SAMANIEGO DANIEL.
VERA CALDERON HOMERO.
MANOBANDA DURAN DENISSE.
NAVARRETE GARCIA ANNABELLE.
EXAMEN PRIMER PARCIAL FECHA: 07/07/2018
La variable que podríamos agregar después de analizar los datos ofrecidos por la base es
el de DiasPlazo que corresponde a los días que hay entre la fecha de facturación y la fecha
de vencimiento así podríamos obtener un valor para comparar directamente con DiasPago
3. Particionar los datos en 70% para entrenamiento del modelo y 30% para prueba.
Hacerlo aleatoriamente, utilizando la función sample. (10 puntos)
Aquí dividimos los datos para entrenamiento y para prueba para ser utilizados en las
corridas posteriores.
Y la el orden en el que se van subdividiendo las ramas que tienen esos 3 datos claros es :
fecha de pago, si la respuesta es SI consulta la fecha de vencimiento, si en la rama de
fecha de vencimiento dice SI consulta los Días pago y al final entrega la probabilidad de
acuerdo a el factor inicial de análisis que no se ve por las Z.
7. Haga un análisis comparativo de los resultados de los modelos obtenidos en los
literales 4 y 5; recomiende cuál de los dos modelos utilizar (20 puntos)
Realizando un análisis de los datos obtenidos se identifica que al trabajar con un modelo
de regresión logística se obtiene un error superior al de árbol, por lo que se recomienda
que para el pronóstico se utilice un árbol de decisión.
REGRESIÓN LOGISTICA
ARBOL DE DECISIONES