You are on page 1of 16

Programa de Formacin en Investigacin, Ciencia y Tecnologa (ProFInCyT)

Anlisis de Datos II: Anlisis bivariados y multivariados

Unidad 1:

Introduccin a las tcnicas bivariadas y multivariadas

1 Introduccin
El origen histrico del anlisis multivariado o multivariante, se encuentra a principios del siglo XX. Surge en el marco de la psicologa aplicada como una teora matemtica que trata de explicar el concepto de inteligencia.

A diferencia de lo que sucede con los mtodos y anlisis bivariados, los multivariados son herramientas estadsticas que estudian el comportamiento de tres o ms variables al mismo tiempo.

Se usan principalmente para buscar las variables menos representativas para poder eliminarlas y para comprender la relacin entre varios grupos de variables. Es decir, si trabajamos con personas no medimos solo un aspecto (e.g. edad), sino que consideramos varios (e.g. altura, peso, sexo, clase social) y tratamos de determinar la relacin entre estas medidas.

2 Clasificacin
1. Mtodos Dependientes Interesa la asociacin entre las distintas variables. Algunas de estas variables dependen o se miden en funcin de las otras. Inters predictivo. 2. Mtodos Independientes Interesa la asociacin entre variables. No dependen unas de otras. Inters descriptivo. 3. Mtodos Estructurales

1. Mtodos Dependientes
a. Regresin mltiple:
Estudia la dependencia de una variable en funcin de otras. A diferencia del modelo de regresin lineal simple, utiliza ms de una variable como explicacin de otra. Ventaja de utilizar ms informacin para la construccin del modelo y realizar estimaciones ms precisas. de un conjunto de variables explicativas (independientes), cules son las que ms influyen en la variable dependiente?

b. Anlisis discriminante
Identificar la combinacin de caractersticas o variables que mejor permitan diferenciar (discriminar) a dos o ms grupos. La pertenencia a los grupos se utiliza como variable dependiente.
Las variables en las que suponemos que se diferencian los grupos se utilizan como variables independientes (tambin denominadas de clasificacin o discriminantes). Solo admite variables cuantitativas.

c. Mtodos log-lineales
Los modelos log-lineales son una alternativa de anlisis estadstico para datos categricos. Un modelo log-lineal pretende explicar el comportamiento de una variable respuesta, como resultado del efecto de un conjunto de variables categricas independientes.

Son muy utilizados para la realizacin de tablas de contingencia.

d. Anlisis de correlacin cannica


til en situaciones donde se tienen mltiples variables dependientes.

Se utiliza si las varianzas predictoras o independientes son numricas.


Permite la valoracin de la relacin entre variables predictoras numricas y mltiples medidas dependientes.

e. Anlisis multivariante de la varianza (MANOVA)


El anlisis de la varianza multivariante es una generalizacin del anlisis de la varianza univariante (ANOVA) para el caso de ms de una variable dependiente.

Se trata de contrastar la significacin de uno o ms factores (variables independientes) para el conjunto de variables dependientes.

2. Mtodos Independientes
a. Anlisis de componentes principales
Tcnica estadstica de sntesis de la informacin, o de reduccin del nmero de variables, perdiendo la menor cantidad de informacin posible. Los nuevos componentes principales o factores sern una combinacin lineal de las variables originales, y adems sern independientes entre s. La interpretacin de los factores no viene dada a priori, sino que ser deducida tras observar la relacin de los factores con las variables iniciales.

b. Anlisis Factorial
Tcnica de reduccin de datos que sirve para encontrar grupos homogneos de variables a partir de un conjunto numeroso de las mismas. Esos grupos homogneos se forman con las variables que correlacionan mucho entre s. Su propsito ltimo consiste en buscar el nmero mnimo de dimensiones capaces de explicar el mximo de informacin contenida en los datos. A diferencia de lo que ocurre en otras tcnicas, en el anlisis factorial todas las variables son independientes ya que no existe a priori una dependencia conceptual de unas variables sobre otras.

c. Tcnicas de Escalamiento Multidimensional


Para un conjunto de similitudes (o distancias) observadas entre un par de objetos, se trata de encontrar una representacin grca de estos en pocas dimensiones, de modo que sus posiciones casi ajusten las similitudes (o distancias) originales.
Si se usan las magnitudes originales de las distancias (o similitudes), se tiene el llamado escalamiento multidimensional mtrico. Si se usan rangos (orden de las observaciones), en vez de distancias, se tiene el escalamiento multidimensional no mtrico.

d. Anlisis de correspondencias
Tcnica descriptiva o exploratoria cuyo objetivo es resumir una gran cantidad de datos en un nmero reducido de dimensiones, con la menor prdida de informacin posible. Objetivo similar al de los mtodos factoriales, pero este se aplica solo sobre variables categricas u ordinales. El anlisis de correspondencias se utiliza a menudo en la representacin de datos que se pueden presentar en forma de tablas de contingencia de dos variables nominales u ordinales.

e. Anlisis de cluster
Tcnica cuya idea bsica es agrupar un conjunto de observaciones en un nmero dado de clusters o grupos. Este agrupamiento se basa en la idea de distancia o similitud entre las observaciones y su obtencin depende del criterio o distancia considerado. Por ejemplo, una baraja de cartas espaolas se podra dividir de distintos modos: en cuatro clusters (los cuatro palos), en ocho clusters (los cuatro palos y segn sean guras o nmeros), en dos clusters (guras y nmeros), siempre dependiendo de lo que consideremos como similar.

3. Mtodos Estructurales
Analizan las relaciones existentes entre un grupo de variables representadas por sistemas de ecuaciones simultneas, en las que se supone que algunas de ellas (constructos) se miden con error a partir de otras variables observables (indicadores).
Los modelos utilizados constan de dos partes: un modelo estructural que especifica las relaciones de dependencia existente entre las constructos latentes y un modelo de medida que especifica como los indicadores se relacionan con sus correspondientes constructos.

You might also like