Professional Documents
Culture Documents
ANALISIS FACTORIAL
Previamente al hacer el análisis factorial se determinó el número de missings que presentaban cada
una de las 111 variables, si alguna de estas tenía 30% en sus registros se omitía del análisis, tal
depuración se realizó en Excel
V_AVG_CSH_3
V_MED_CSH_3
V_RATIO_CSH_BAL_3
V_AVG_CSH_6
V_MED_CSH_6
V_RATIO_CSH_BAL_6
V_AVG_CSH_9
V_MED_CSH_9
V_RATIO_CSH_BAL_9
V_AVG_CSH_12
V_MED_CSH_12
V_RATIO_CSH_BAL_12
Podemos observar que tenemos la mayor parte de missings en las variables que controlan alguna
medida de la disposición de efectivo de los clientes en su cuenta
Se quedaron 100 variables para el análisis factorial, tenemos los siguientes resultados:
Observamos que con 18 factores explicamos la mayor parte de la varianza al tratar de explicar las
variables mediante estos factores, en la matriz rotada de los factores se observaron las cargas del
modelo factorial y pudimos observar que cada variable si tributaba por lo menos en 0.3 a cada factor
por lo que no obtuvimos una reducción de las variables.
ANALISIS DE MUTICOLINEALIDAD
CLUSTERING DE VARIABLES
Una vez determinado el número de variables a utilizar procedemos a agruparlas en conjuntos de tal
manera que en cada conjunto tengamos variables homogéneas y los conjuntos entre si sean
heterogéneos entre sí, el resumen clustering de variables arroja que las variables se pueden agrupar
en 39 clusters , sin embargo con 25 clusters explicamos el 90% de la varianza esto lo observamos en lo
siguiente:
Procedemos a hacer un segundo clustering entre variables pero esta vez para obtener las
características de cada uno de los 25 clusters, después nos fijamos en cada cluster ,en la variable
representativa , esto es , la que tenga mayor correlación con las demás variables de ese cluster, esto lo
podemos identificar mediante el coeficiente r-squared tal coeficiente lo podemos definir
coloquialmente como la razón de cuanta varianza del modelo es explicada por esa variable con
respecto a la varianza que aportan todas las variables del modelo(esta varianza considera errores
ajenos a la obtención de la medición de las cargas de cada variable al modelo) obvio dentro del cluster.
En la siguiente tabla se muestran las variables que tienen mayor correlación dentro de cada cluster,
esto tendrá sentido en el siguiente análisis:
ANALISIS CLUSTER
Notamos que mediante este número de clusters, logramos una segmentación correcta, ya que es un
buen número de grupos, ni muy bajo, ni muy grande, todas están distribuidas de una manera
deseable, ni muy concentradas en un solo cluster, o muy poco concentradas en uno; entre todos los
clusters.
A continuación queremos averiguar cuanto significado tiene cada variable dentro de cada cluster,
medir su nivel de “importancia” dentro del mismo. Para esto recurrimos a la técnica del ANOVA y
medir las medias de cada variable dentro del cluster, con cierto nivel de “confianza”. Mediante esta
técnica lograremos entender el nivel de significancia de cada cluster por cada variable, esto quiere
decir, lo que opinan o como se sienten los integrantes de cada cluster con respecto a cada variable; lo
explicamos de la siguiente manera:
CLUSTER VARIABLE 1 VARIABLE 2
1 BAJA ALTA
2 MEDIA BAJA
3 MEDIA ALTA
Gracias a esto pudimos perfilar a cada cluster, descubrir el comportamiento de cada uno y así poder
actuar de diferente manera para cada uno, buscando siempre el beneficio de la empresa. Esto nos
permitirá implementar diferentes estrategias para cada uno, con el objetivo de lograr los mejores
resultados dentro de los miembros de cada cluster.
1. “En rehabilitación”: Son aquellos clientes que están amortizando cierta deuda pendiente, ya
que paga más de lo que compra, notamos que ya no compra tanto nuestros productos y
siempre paga más o menos la misma cantidad. Por esto concluimos que su objetivo es el de
dejar de debernos.
2. “Constante”: Aquel cliente que va al corriente con sus pagos, paga aquello que compra,
sospechamos que no está amortizando una deuda específica, sino que paga lo que compra.
También dedujimos que compra por temporadas y no se endeuda más.
3. “El bueno”: Es nuestro buen cliente, no amortiza una deuda importante, como el grupo 1,
consume mucho de nuestros productos y paga lo que compra.
4. “Rehabilitado”: Notamos que es un cliente que sus pagos en sus deudas han ido
disminuyendo, pero que no se encuentra en morosidad, por lo que concluimos que está
terminando de pagar una deuda, a pesar de esto no nos deja de comprar, aunque en menor
cantidad, pensamos que los del grupo 1 pueden llegar a terminar dentro de este grupo.
5. “Responsable”: Es un cliente sin mucha deuda, no usa mucho su tarjeta y paga todo aquello
que compra por lo que va al corriente con sus pagos, por esto pensamos que se puede tratar
de clientes primerizos y de responsables, tendremos grandes oportunidades con ellos.
6. “Por temporada”: Notamos que últimamente ha comprado mucho, a la larga o deja de usarnos
y sin grandes incrementos, pero no se endeuda pues paga casi lo que compra y es un
consumidor constante.
7. “Olvidándonos”: Este cliente ha estado dejando de usar nuestros servicios, no se encuentra
tan al corriente con sus pagos y casi no compra, por lo que pensamos que algo lo hizo alejarse
de nosotros y como no se nota una gran reducción en su deuda pensamos que solo se
encuentra pagando intereses.
8. “Comprador no deudor”: Aquel que no nos deja de comprar, aumento en el uso de sus
créditos y sus deudas han ido bajando, por lo que es un cliente que nos consume pero no
quiere endeudarse.