Professional Documents
Culture Documents
Discretización
Análisis de
Correspondencias
INDICE
ABEXO 2 AFCS
Discretización
Análisis de
Correspondencias
ANEXO 2 AFCS
a. Análisis Factorial de Correspondencias Simples con Xlstat
El análisis de correspondencias simples se utiliza cuando queremos analizar dos variables
categóricas, que definen una tabla de contingencia. El interés recae en analizar las
asociaciones entre las categorías de ambas variables, y su proyección en un biplot. Utilice el
análisis factorial de correspondencias con el fin de estudiar la conexión entre dos conjuntos
de modalidades que constituyen las filas y columnas de una tabla de contingencia.
Una tabla de contingencia (TC) se obtiene al clasificar dos variables cualitativas. El
conjunto de las filas representan a las categorías de una variable y el conjunto de las
columnas, a las categorías de la otra variable. El valor de una celda representa al numero de
unidades estadísticas = individuos, que poseen simultáneamente las categorías de la fila y
de la columna que se cruzan. Al dividir la tabla sobre su total se obtiene la tabla de
frecuencias relativas asociada a la TC, esta representa la distribución conjunta de
probabilidad bivariada de la población en estudio, según las dos variables cualitativas que
dan origen a la tabla. La suma de las filas (marginal fila), representa la distribución de
probabilidad según la variable fila y la suma de las columnas (marginal columna), la
distribución de probabilidad asociada a la variable columna. La división de cada una de las
filas (respectivamente, columnas) por su marginal origina las distribuciones condicionales
o perfiles fila (columna). El análisis de correspondencias simples (ACS) permite la
descripción de una TC, cumpliendo con tres objetivos: 1) obtener y comparar una tipología
de los perfiles fila; 2) obtener y comparar una topología de los perfiles columnas y 3)
estudiar las asociaciones entre las dos variables.
En aplicaciones más complejas las filas y las columnas pueden estar estructuradas
mediante sendas particiones, definidas por otras variables cualitativas. En este documento
se utiliza como ejemplo una tabla sobre marcas de ropa, en donde se valora a cada marca
según su asociación con diferentes características como precio, calidad, prestigio,
exclusividad, elegancia, vanguardia y complementos.
Usaremos los datos (Tabla Contigencia - consumo Proteinas kg.xls), que representan las
estimaciones del consumo promedio en kg, de 9 fuentes diferentes de proteínas, por los
habitantes de 25 países, Greenacre (1984).
Discretización
Análisis de
Correspondencias
Discretización
Análisis de
Correspondencias
Discretización
Análisis de
Correspondencias
Los resultados son visualizados después de especificar algunas opciones relativas a los
gráficos. Están disponibles numerosos detalles, incluido la prueba del chi-cuadrado de
independencia de filas y columnas.
Las frecuencias observadas siempre serán distintas de las frecuencias esperadas. Sin embargo,
en estadística queremos saber si estas diferencias son suficientemente grandes como para
contradecir la hipótesis de que las filas son homogéneas. Es decir, queremos saber si es poco
probable que las discrepancias entre las frecuencias observadas y las frecuencias esperadas se
deban sólo al azar. Para responder a esta pregunta calcularemos una medida de discrepancia
entre las frecuencias observadas y las frecuencias esperadas. Concretamente, calcularemos
las diferencias entre cada par de frecuencias observadas y esperadas, las elevaremos al
cuadrado, las dividiremos por las frecuencias esperadas e iremos acumulando los resultados
hasta llegar a un valor final.
En nuestro caso esta calidad es buena en la medida en que los dos primeros valores propios
totalizan el 74,28 % de la varianza total.
Inercias. Dado que la suma de las masas es 1, podemos decir que la inercia es la media
ponderada de los cuadrados de las distancias χ2 entre los perfiles fila y su perfil media. Por
tanto, la inercia será alta cuando los perfiles fila presenten grandes desviaciones con
relación a su media, y será baja cuando éstos se hallen cerca de la media. Cuanto mayor sea
la inercia, más cerca se hallarán los perfiles fila de los vértices columna. Es decir, mayor
será la asociación entre las filas y las columnas.
Podríamos comprobar que el resultado del cálculo de la inercia, sería idéntico si lo
calculáramos a partir de los perfiles columna. Es decir, la inercia total de la tabla, sería igual
a la media ponderada de los cuadrados de las distancias χ2 entre los perfiles columna y su
perfil media, ponderadas ahora con las masas de las columnas.
La descomposición de la inercia en sumas de componentes positivos nos permite llevar a
cabo un «análisis de inercia» útil para la interpretación de los resultados del AC.
Césari 2018 Página 5
ANEXO 2 N04
Discretización
Análisis de
Correspondencias
Discretización
Análisis de
Correspondencias
Mostramos las contribuciones de las filas y de las columnas a la primera inercia principal,
calculadas a partir de las coordenadas principales de las filas y columnas.
También podemos expresar las contribuciones a la inercia en términos relativos con
relación a la inercia de las filas, como proporciones, en porcentajes o en tantos por mil.
Estos resultados nos informarán sobre la inercia de las filas explicada por cada eje. Se trata
de una miniversión de lo que hacíamos al determinar el porcentaje de inercia total que
explicaba cada eje.
Podemos interpretar los cosenos de los ángulos entre vectores como coeficientes de
correlación. Por tanto, las contribuciones relativas son correlaciones al cuadrado
Discretización
Análisis de
Correspondencias
Gracias al teorema de Pitágoras, podemos sumar los cuadrados de los cosenos de los
ángulos formados por un perfil y cada uno de los ejes, para obtener una suma de cosenos al
cuadrado que relaciona el perfil con el subespacio definido por estos ejes. Así por ejemplo,
podemos calcular el ángulo entre un perfil fila y el plano principal a partir de la suma de las
contribuciones relativas de los dos ejes principales.
Interpretamos estas sumas como una
medida de la calidad de la representación
de los perfiles en los mapas
bidimensionales, de la misma manera que
la suma de los dos primeros porcentajes
de inercia nos da una medida de la
calidad global (o media) de la
representación. Además, podemos ver
qué perfiles están bien representados y
cuáles no.
Algunos perfiles no estarán bien
representados por hallarse más en el
tercer y cuarto ejes que en los dos
primeros.
Discretización
Análisis de
Correspondencias
Cuando la calidad del análisis es buena el plano permite interpretar fácilmente los datos.
Los criterios de interpretación del Análisis de Correspondencias se basan en los principios
siguientes:
La proximidad de perfiles fila de la variable X revela un comportamiento similar de
esas categorías respecto a la otra variable Y (y a la inversa).
La presencia de perfiles fila de la variable X, radicalmente opuestos a perfiles de Y,
puede ser también interpretada como relación inversa entre ellos.
Los perfiles situados en las proximidades del centroide de la representación son los
que no expresan relación alguna.
La proximidad de un perfil a un cierto eje expresa su mayor contribución en su
definición. Esta contribución aumenta cuanto más alejado se encuentre del centroide
de la representación.
Es decir, las asociaciones no serán más que la cuantificación numérica de la relación
existente entre categorías fila y columna:
Mayor alejamiento del centroide y menor ángulo → MAYOR ASOCIACIÓN
Acercamiento al centroide y aumento del ángulo → MENOR ASOCIACIÓN
Puntos opuestos (π/2 < ángulo < 3π/2) → ASOCIACIÓN NEGATIVA
La variabilidad explicada por cada eje es proporcional al valor singular que lo define.
En un ACS las modalidades aparecen repartidas a ambos lados de los ejes, lo que conlleva a
la lectura de las contraposiciones más importantes entre modalidades.
En una tabla de contingencia de gran tamaño se puede buscar las modalidades más
importantes sobre cada eje recurriendo a las denominadas contribuciones absolutas.
Las proyecciones sobre los ejes y sobre los planos factoriales serán muy ‘buenas’ para
algunos puntos pero también pueden ser de ‘mala’ calidad para otros puntos. Se requiere
entonces de un índice que ponga en evidencia este hecho, que se denomina coseno
cuadrado o contribución relativa.
Discretización
Análisis de
Correspondencias
Discretización
Análisis de
Correspondencias
Discretización
Análisis de
Correspondencias
Este estadístico se utiliza en una distribución teórica Chi-cuadrado para generar un valor
de p. Cuanto mayor sea el estadístico chi-cuadrado, menor será el valor de p. Observe que
XLSTAT permite el cálculo de las frecuencias teóricas (véanse las secciones siguientes).
La prueba exacta de Fisher calcula la probabilidad de tener los datos observados
(utilizando la distribución hipergeométrica), así como las probabilidades de conseguir todos
los conjuntos de datos más extremos posibles bajo la hipótesis nula.
Estas probabilidades se utilizan para calcular el valor p de la prueba exacta de Fisher.
Cuando las frecuencias teóricas incluyen frecuencias que son inferiores a 5, o cuando las
sumas marginales del conjunto de datos (sumas por fila o por columna) son muy
desiguales, es mejor confiar en la prueba exacta de Fisher.
En el caso en que sus datos estén dispuestos en forma vertical (individuos en filas y
variables en columnas), active la opción de formato de datos Variables cualitativas.
Discretización
Análisis de
Correspondencias
En la pestaña Opciones,
active las
opciones Prueba de Chi-
cuadrado y Prueba exacta
de Fisher.
En la pestaña Resultados,
active todas las opciones,
sobre todo Frecuencias
teóricas, así
como significación por
celda.
Haga clic en el botón OK para iniciar los cálculos. Los resultados aparecen en una nueva
hoja.
Discretización
Análisis de
Correspondencias
La tabla de significación por celda muestra de manera simbólica los resultados por celda de
la prueba exacta de Fisher.
Discretización
Análisis de
Correspondencias
Discretización
Análisis de
Correspondencias
El cuadro de diálogo que permite esta elección se presenta a continuación. Tanto en una
como en otra opción la cadena o programa de instrucciones que se genera prevé un método
adicional, de nombre DEFAC, para la descripción de los ejes factoriales.
Si optamos por realizar un cruce previo al ACS la ventana de SPAD con los procedimientos
ejecutados es la siguiente:
Discretización
Análisis de
Correspondencias
Discretización
Análisis de
Correspondencias
Elegiremos la variable que va en las filas, la V4 que corresponde a los ingresos. Las filas se
consideran como “casos”.
Discretización
Análisis de
Correspondencias
El análisis se puede realizar directamente con las opciones por defecto, solamente es
necesario precisar las variables de fila y columna. En los parámetros del análisis la
especificación más relevante es el número de factores retenidos. Siendo el máximo número
el mínimo de filas y columnas menos 1, el número lo podemos fijar después de ver los
resultados. Por defecto considera 10. En el ejemplo el número máximo es de 2 y es el valor
que hemos introducido.
Adicionalmente existe la opción, si fuera el caso, de estimar valores perdidos según un
algoritmo creado por Benzécri. También el método de cálculo de los vectores y valores
propios por defecto, In central memory, se puede cambiar por un método iterativo
recomendado para las tablas que incluyen un gran número de categorías (varios cientos)
donde el usuario controla los cálculos a partir del número de iteraciones, de casillas y la
dimensión del subespacio. Como en otros procedimientos disponemos igualmente de
opciones de control de los resultados que mantendremos sin cambios.
Discretización
Análisis de
Correspondencias
Finalmente el botón Created database abre un cuadro de diálogo que permite guardar la
tabla de contingencia construida en el formato de un archivo de datos del sistema SPAD. A
partir de esta base de datos, a continuación, se pueden aplicar otros métodos de SPAD.
Por su parte el procedimiento DEFAC complementa los resultados del análisis de
correspondencias con la descripción de los factores para ayudar a la interpretación a partir
de los elementos más significativos. Estos elementos pueden ser los casos, las variables
categóricas o las variables o frecuencias continuas, y se pueden utilizar como elementos
activos o ilustrativos. Los elementos característicos se clasifican en función de sus
coordenadas. En el caso de las variables categóricas se pueden clasificar de acuerdo con el
criterio estadístico de un valor-test.
En el cuadro de diálogo inicial, Command Description, se precisan los factores que serán
descritos. Por defecto aparece la opción 1 a 3, pero si en el análisis sólo se generan 2 o se
quieren más de 3 hay que cambiarlo al valor correspondiente.
Discretización
Análisis de
Correspondencias
Por otro, el criterio de selección de las categorías se basa en una prueba estadística de
utilidad para tablas de datos de gran tamaño y para la lectura de los análisis
multidimensionales complejos. Con la disposición de los elementos (variables o categorías)
de forma descendente se ponen de manifiesto los rasgos más sobresalientes de
caracterización de los factores. Para evaluar la magnitud de las diferencias más
significativas entre las proporciones (si son categorías de variables cualitativas) o entre las
medias (si son variables cuantitativas), la prueba estadística que se aplica da lugar a un
valor del estadístico z de la normal. Si el valor, el número de desviaciones estándar, es
mayor que 2, en valor absoluto, una desviación es significativa en el umbral habitual del
5%2.
De la ejecución de estos procedimientos comentaremos los aspectos más relevantes de las
salidas de tablas y gráficos, y remitimos al lector/a a la interpretación realizada
anteriormente. En las dos imágenes que siguen se recogen resultados parciales de la salida
del procedimiento del ACS con SPAD. En la primera se puede ver la tabla de Burt y en la
siguiente la información de los valores propios y las tablas con las coordenadas, las
contribuciones absolutas y las contribuciones relativas en relación a los dos factores
considerados.
2 Cuando se trata de la comparación de dos proporciones se utiliza la ley hipergeométrica para evaluar las
diferencias. Para comparar dos medias se utiliza la t de Student. Una presentación de estos conceptos se
encuentra en Morineau (1984) y Lebart, Morineau y Piron (1997).
Césari 2018 Página 21
ANEXO 2 N04
Discretización
Análisis de
Correspondencias
Discretización
Análisis de
Correspondencias
Algunos de los resultados que acabamos de comentar se pueden exportar a Excel con una
plantilla de presentación de las tablas que genera el propio software. Haciendo doble clic
sobre el icono se generan automáticamente.
Nos queda finalmente comentar el editor gráfico para reproducir el gráfico factorial del
análisis. Una vez abierto el editor haciendo doble clic sobre el icono nos aparece esta
ventana inicial donde podemos abrir o crear un nuevo gráfico:
Clicaremos sobre New graph y accederemos a un cuadro de diálogo donde nos facilita la
elección de qué elementos aparecerán en el gráfico:
Discretización
Análisis de
Correspondencias
De la relación de elementos, los que aparecen en blanco son los elegibles mientras que los
que aparecen marcado en gris no están disponibles. En este caso marcaremos tanto la
opción actives cases (categorías en fila de la tabla de correspondencias) como actives
frequencies (categorías en columna) para ver la representación simultánea y analizar sus
correspondencias. Cuando se activa la selección los botones cases draft y variables
selection ofrecen la posibilidad de seleccionar individuos y seleccionar categorías. Al
apretar sobre OK nos aparece una ventana como esta:
Discretización
Análisis de
Correspondencias
El gráfico aparece por defecto con un tamaño que maximiza su presentación en la pantalla
del ordenador. Este tamaño se puede ajustar a través del menú Display y la opción Scales
and axis:
Podemos clicar sobre identical en la opción SCALES con lo que obtendremos una imagen
proporcional entre el eje horizontal y vertical del gráfico. Adicionalmente podemos clicar
sobre with inertia % para visualizar sobre el gráfico el porcentaje de inercia explicada por
cada factor.
Césari 2018 Página 25
ANEXO 2 N04
Discretización
Análisis de
Correspondencias
Las etiquetas de los puntos se pueden mover para ubicarlas en un espacio distinto. Esto
será especialmente últil cunado el número de categorías sea numeroso. Para cambiar el
formato de los puntos y las etiquetas se pueden seleccionar y a través del menú Format /
Colours, symbols,… cambiarlos de tamaño, color, tipo de letra, etc.:
A través del botón de segments drawing podemos también trazar líneas que unan los
diferentes puntos para así obtener una imagen del recorrido de las categorías como ayuda
visual para dar también identidad a los ejes factoriales.
Discretización
Análisis de
Correspondencias
Al operar estos distintos cambios es habitual que se desdibujen los diferentes elementos
del gráfico, por ello es necesario refrescar la pantalla a través del botón
Por último, en relación al ACS, comentaremos los cuadros de diálogo específicos del
procedimiento CORBI cuando se realiza un análisis de correspondencias simples con una
matriz de datos que corresponde a una tabla de correspondencias ya construida.
Discretización
Análisis de
Correspondencias
La novedad son las dos pestañas referidas a las columnas y a las filas, mientras que la de
parámetros coincide con la comentada anteriormente. La pestaña de columnas permite
seleccionar las categorías en columna de la tabla, denominadas frecuencias, y seleccionar
las que se considerarán como frecuencias activas (opción obligatoria) o frecuencias
suplementarias. La pestaña de filas permite la selección de las categorías de las filas
consideradas como casos. Se dispone de diversas alternativas de selección en un cuadro de
diálogo similar en diversos procedimientos. Esta modalidad es la que hemos aplicado en el
caso del análisis de la relación entre las provincias y el nivel educativo.
Discretización
Análisis de
Correspondencias
Discretización
Análisis de
Correspondencias
Discretización
Análisis de
Correspondencias
3 Fuente: López-Roldán, P.; Fachelli, S. (2016). Análisis factorial. En P. López-Roldán y S. Fachelli, Metodología de
la Investigación Social Cuantitativa. Bellaterra (Cerdanyola del Vallès): Dipòsit Digital de Documents, Universitat
Autònoma de Barcelona. Capítulo III.11. 1ª edición. Versión 3 (octubre de 2016). Edición digital:
http://ddd.uab.cat/record/142928
Césari 2018 Página 31
ANEXO 2 N04
Discretización
Análisis de
Correspondencias
Con excepción del análisis de regresión categórica, se caracterizan por ser técnicas de
análisis factorial destinadas a la reducción de dimensiones a partir de un conjunto inicial de
variables para describir estructuras y modelos de relación entre el conjunto de ellas.
Todas ellas, como técnicas de escalamiento óptimo, permiten detectar relaciones no
lineales y buscan obtener la máxima correlación entre las variables. Siguen los principios
del análisis de componentes principales y del análisis de correlación canónica, adaptados a
la utilización de variables categóricas o mixtas.
Como técnicas factoriales los resultados incluyen puntuaciones óptimas o cuantificaciones
óptimas tanto para las categorías de cada variable (cuantificación de categorías) como de
los individuos u objetos (cuantificación de objetos), por tanto, se derivan variables
continuas; es por eso que se llaman técnicas de cuantificación de datos cualitativos (como
también lo es la técnica del Escalamiento Multidimensional No Métrico). Una cuantificación
es óptima en el sentido de que las categorías están separadas entre ellas a la dimensión o
dimensiones consideradas tanto como sea posible y, a la vez, dentro de cada categoría los
individuos están lo más próximos posible, es decir, con puntuaciones lo más homogéneas
entre sí.
Finalmente todas ellas permiten la representación gráfica para visualizar los resultados
como ayuda a la interpretación de las estructuras subyacentes.
Discretización
Análisis de
Correspondencias
En primer lugar se trata de especificar las dos variables del análisis, la que se considera
como variable-fila, en nuestro caso IngresosH y la que se considera como variable-
columna, OCUPAFAM. Una vez determinadas las variables que intervienen en el análisis
hay que detallar su rango.
Si hacemos clic sobre el botón Definir rango se abre un cuadro de diálogo como el
siguiente:
Discretización
Análisis de
Correspondencias
Se trata de especificar los valores mínimo y máximo que corresponden a los valores o
categorías de la variable considerada. En este caso se han escrito los valores 1 como valor
mínimo y 3 como valor máximo, ya que define el rango de valores de la variable IngresosH.
A continuación se debe hacer clic sobre el botón de Actualizar y estos valores pasarán al
recuadro inferior de Restricciones para las categorías. Las restricciones se concretan en
tres posibilidades excluyentes entre sí, si bien en nuestro caso no se fijará ninguna
restricción, consideraremos todas las categorías como activas.
La opción que especifica que las categorías deben ser iguales es una restricción de igualdad
que se aplica si el orden obtenido por las categorías no es el deseado o si no se corresponde
con el intuitivo.
La opción que especifica que la categoría es suplementaria permite considerar algunas de
las categorías como pasivas, para que no influyan en el análisis pero sí se representen en el
espacio definido por las categorías activas, así las categorías suplementarias no juegan
ningún papel en la definición de las dimensiones.
Una vez hecha la especificación del rango de las filas hay que hacer clic en el botón
Continuar y se repite la operación para la variable-columna, OCUPAFAM, con los valores 1 a
9.
En el cuadro de diálogo de Modelo podemos especificar cuatro tipos de opciones:
Discretización
Análisis de
Correspondencias
Discretización
Análisis de
Correspondencias
Discretización
Análisis de
Correspondencias
Como resultado de la ejecución de estas instrucciones, ya sea a través del menú o del editor
de sintaxis, se obtienen los resultados que siguen.
En primer lugar, aparece la tabla de correspondencias (de contingencia) con las frecuencias
de la distribución conjunta:
Discretización
Análisis de
Correspondencias
En la tabla que sigue se presenta la información del valor singular (la raíz cuadrada del
valor propio que aparece en la columna con el nombre de inercia), la inercia (de hecho es el
valor propio) así como la proporción de varianza que suponen. Se incluye asimismo una
prueba estadística que da cuenta de la significación del modelo testando la hipótesis nula
de independencia entre las dos variables (el valor del chi-cuadrado dividido por el número
de casos es la inercia total que se descompone en cada dimensión), que en este caso
permite ser rechazada.
Así pues, los factores obtenidos expresan las correspondencias (proximidades) que se dan
entre la filas, las columnas, y también entre filas y columnas por la propiedad de la
equivalencia distribucional.
Discretización
Análisis de
Correspondencias
En las tablas siguientes se presentan para cada categoría de las variables, de fila y de
columna, las puntuaciones en la dimensión (las coordenadas del gráfico factorial), la masa
(frecuencia o importancia de cada categoría), la inercia (la varianza explicada por cada
categoría), la contribución a la inercia de la dimensión (las contribuciones absolutas) y la
contribución de la dimensión a la inercia del punto (las contribuciones relativas).
Al conservar el 100% de la inercia las contribuciones relativas suman el total 1 para cada
categoría (suma por fila), mostrando la distribución de la aportación de cada categoría a
cada una de las dos dimensiones. La contribución absoluta, por su parte, nos muestra qué
categorías definen cada factor o dimensión (suman 1 por columna).
Las categorías con mayor valor en una dimensión se corresponderán con las más alejadas
del centro en la representación gráfica del gráfico factorial, es decir, tendrán una mayor
coordenada.
Discretización
Análisis de
Correspondencias
Discretización
Análisis de
Correspondencias
El cual se puede editar para que adopte la forma siguiente donde hemos incluido la unión
de los puntos a través de una línea de interpolación para destacar el recorrido de las
categorías de cada variable:
Discretización
Análisis de
Correspondencias
CA Correspondence Analysis
Description. Realiza el análisis de correspondencias (CA), incluyendo fila y/o columna
suplementarias
Sintaxis del commando en R:
CA(X,ncp = 5, row.sup = NULL, col.sup = NULL,
graph = TRUE, axes = c(1,2), row.w = NULL)
Argumentos
X un dataframe con n filas y p columnas, que equivale a una tabla de contingencia
ncp número de dimensiones que se mantienen en los resultados (por defecto 5)
row.sup un vector que indica los índices de las filas suplementarias
filas col.sup un vector que indica los índices de las columnas suplementarias.
graph boolean, si es TRUE se visualiza un gráfico.
axes una longitud de 2 vectores que especifica los componentes para graficar
row.w peso fila - opcional (por defecto, los pesos fila son uniforme)
Valores de Salida
Devuelve una lista que incluye:
eig una matriz que contiene todos los valores propios, el porcentaje de
variación y el porcentaje acumulativo de la varianza
col una lista de matrices con todos los resultados de la variable en columnas
respecto a los factores (las coordenadas, del coseno cuadrado, las
contribuciones, la inercia)
row una lista de matrices con todos los resultados de la variable en filas
respecto a los factores (las coordenadas, del coseno cuadrado, las
contribuciones, la inercia)
Discretización
Análisis de
Correspondencias
col.sup una lista de matrices con todos los resultados de la variable en columnas
suplementarias (las coordenadas, del coseno cuadrado)
row.sup una lista de matrices con todos los resultados de la variable en filas
suplementarias (las coordenadas, del coseno cuadrado)
call una lista con algunas estadísticas
Valores de Salida
Returns the individuals factor map y the variables factor map.
Autores(s) Jeremy Mazet, Francois Husson <Francois.Husson@agrocampus-ouest.fr>
Ver tambien CA
Ejemplos
data(children)
res.ca <- CA (children, col.sup = 6:8, row.sup = 15:18)
Discretización
Análisis de
Correspondencias
print.CA
Print the Correspondance Analysis (CA) results
Sintaxis del commando en R:
## S3 method for class 'CA'
print(x, file = NULL, sep = ";", ...)
Argumentos
El análisis de correspondencias: las filas activas son de color azul, las columnas de activos son de color rojo, las líneas
adicionales son de color azul oscuro, las columnas adicionales son de color rojo oscuro
Discretización
Análisis de
Correspondencias
Discretización
Análisis de
Correspondencias
Las funciones dudi de ade4 reciben los datos en un objeto data.frame y utlizan todas las
columnas como activas. El paquete ade4 tiene varias funciones para obtener los planos
factoriales; si embargo en FactoClass se incluye la función planfac que recibe un objeto dudi y
produce un plano factorial similar a los del paquete ade4.
La función ward.cluster transforma la distancia euclidiana en distancia de Ward y llama la
función hclust del paquete básico stats. En ward.cluster se incluye una gráfica de los índices de
nivel para facilitar la decisión de cuántas clases seleccionar para la partición.
La función kmeans de stats no maneja pesos distintos para las filas. Estos pesos influyen en los
centros de gravedad y en las inercias intra de las clases. Se modificó (Campo, 2007) esta función
para incluir los pesos de las filas y obtener las inercias intra clases; se nombra kmeansW. En su
opción por defecto la función kmeans utiliza el algoritmo de Hartigan & Wong (1979).
Para la caracterización de las clases, se incluye la función cluster.carac, donde se calculan los
valores test y se retorna un objeto list con información similar a la que se obtiene en los
programas SPAD (Lebart et al. 1999) y DTM (Lebart 2007).
La función analisis.clus calcula las características geométricas de cada clase: el tamaño, la
inercia, el peso y el cuadrado de la distancia de origen.
Para impresión en formato de látex ver FactoClass.tex ()
Para dibujar planos factorial ver con el grupo plotFactoClass (), recibe un objeto de tipo
FactoClass y produce el plano factorial solicitado.
Discretización
Análisis de
Correspondencias