You are on page 1of 26

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS

LIMA – PERÚ

FACULTAD DE CIENCIAS ECONÓMICAS


CARRERA PROFESIONAL DE ECONOMÍA

“¿Qué es correlación?, ¿Qué es causalidad?; Regresión y


predicción”

YAIPÉN PAREDES, EDWARDS GERALD


15120057

DOCENTE: SANDOVAL ORTIZ, GERARDO

Lima, 16 de abril de 2019


Tema 1. ¿Qué es correlación?, ¿Qué es
causalidad?; Regresión y predicción
¿Qué es correlación?
• ¿Es posible que el tiempo practicando deporte
tenga que ver con una vida más longeva?
• ¿Hay alguna relación entre la cantidad de pan
comido al día y el nivel de azúcar medio en
sangre?
• ¿Puedes afirmar que estudiando más horas
sacarás mejor notas en el examen de
investigación?
• ¿Cómo puedes contestar todas estas
preguntas?
• La correlación estadística constituye una técnica
estadística que nos indica si dos variables están
relacionadas o no.
• Por ejemplo, considera que las variables son el ingreso
familiar y el gasto familiar.
• De la misma manera, los precios y la demanda de un
producto.
• Por lo tanto, podemos decir que el ingreso familiar y
gastos familiares y el precio y la demanda están
correlacionados.
• La correlación puede decir algo acerca de la relación
entre las variables:
• si la relación es positiva o negativa
• la fuerza de la relación.
• En el caso del ingreso familiar y el gasto familiar, es
fácil ver que ambos suben o bajan juntos en la misma
dirección. Esto se denomina correlación positiva.
• En caso del precio y la demanda, el cambio se
produce en la dirección opuesta, de modo que el
aumento de uno está acompañado de un descenso en
el otro. Esto se conoce como correlación negativa.
• Datos de la clasificación de la liga española de fútbol del 2016:
• Como siempre el análisis de datos quiere resolver problemas,
contestar preguntas, en este caso:

•¿Qué es más importante en un partido de


fútbol: marcar goles o que no te marquen?
• Ahora, la relación que hay entre los goles a favor y los partidos ganados los
llevamos a un diagrama de dispersión, de esta manera podremos intuir cómo
crece una variable con la otra o decrece.

• Relación creciente, recta tiene pendiente positiva y covarianza positiva.


• Tienes una relación decreciente, el signo de la covarianza sería negativo y
también el signo de la correlación.
El coeficiente de correlación o correlación
de Pearson
•Es un indicador para saber si hay relación entre
dos variables numéricas.
Y como pasaba con la covarianza la correlación es
una matriz.
•En el caso de trabajar con dos variables tienes una
matriz 2×2. La diagonal de la matriz son unos,
porque la relación es perfecta cuando
relacionados una variable consigo misma.
¿De qué te informa la Correlación?

• La correlación indica el grado de relación lineal entre 2 variables


numéricas
• No tiene unidades y puede tener valores entre -1 y 1.
• El signo positivo indica relación lineal creciente.
• El signo negativo indica relación lineal decreciente.
• Si la correlación es igual a -1, la relación lineal es perfecta. Es
decreciente. Los puntos estarían encima de una recta perfecta con
pendiente positiva.
• Si la correlación es igual a 1, la relación lineal es perfecta. Es
creciente. Los puntos estarían encima de una recta perfecta con
pendiente negativa.
• Si la correlación es 0 significa que la variables NO tienen ninguna
relación lineal.
• Para los más matemáticos. La correlación es un ratio entre
la dispersión entre las dos variables
conjuntamente (covarianza) entre la dispersión de cada
variable (desviaciones típicas de cada variable). En palabras
es algo así:
• correlación Partidos ganados vs Goles a Favor = Covarianza
entre Partidos Ganados y Goles Favor / Desv. Típica Partidos
Ganados x Desv. Típica Goles a Favor
• En notación matemática:

𝑆𝑋𝑌
𝑟𝑋𝑌 =
𝑆𝑋 𝑆𝑌
Correlación con 3 variables

• Ahora estás relacionando parejas de variables dos a dos:


• Partidos Ganados vs Goles a Favor
• Partidos Ganados vs Goles en Contra
• Goles a Favor vs Goles en Contra
• Con estos números puedemos cuantificar la relación entre las
parejas que:
• Partidos Ganados vs Goles a Favor = 0.843
• Partidos Ganados vs Goles en Contra = -0.808
• Goles a Favor vs Goles en Contra = -0.545
• ¿Cuál dirías que es la relación lineal más importante?
• Según los datos que tienes la relación más importante es Partidos
Ganados vs Goles a Favor.
• Los Partidos Ganados tienen una relación BUENA con los Goles a
Favor y los Goles en Contra.
• Pero tienen una relación más alta con los Goles a Favor.
• Con los datos de la temporada 2016 los goles a favor son más
importantes que los goles en contra (si no marcas goles difícilmente
vas a ganar partidos).
CAUSALIDAD
•En estadística, la causalidad se refiere a una
relación de necesidad de concurrencia de dos
variables estadísticas correlacionadas.
•En epidemiologia, el hecho de que dos
fenómenos estén estadísticamente relacionados
no implica necesariamente que uno sea causa del
otro. “Una correlación no implica necesariamente
una relación de causa a efecto entre dos factores
(Cohen y Manion, 1990: 213), pero la ausencia de
correlación supone ausencia de causalidad”
• Pese a que el concepto causalidad se haya discutido durante siglos,
no existe ninguna definición universalmente aceptada.
• El punto de encuentro de todas las caracterizaciones de la
causalidad es que las relaciones causales se componen al menos de
dos elementos: una causa, que también se suele denominar input,
elemento causal, variable independiente, variable exógena o
simplemente X, y un efecto, que a su vez se conoce también como
output, resultado, variable dependiente, variable endógena o
simplemente Y.
• De este modo, se puede manejar como definición mínima de la
causalidad la que ofrece Gerring (2001: 129 y 138; 2005: 169): las
“causas” son factores que incrementan las probabilidades (previas)
de que suceda un acontecimiento o, más formalmente, X puede ser
considerado la causa de Y si (y sólo si) eleva la probabilidad de que
Y ocurra.
• Con mayor precisión, King, Keohane y Verba (1994: cap. 3) definen el efecto
causal como la diferencia en los valores de la variable dependiente cuando la
variable explicativa adopta dos valores distintos y todo lo demás sigue igual.
En otras palabras, el efecto causal de X es la diferencia en el resultado en Y
que tendría lugar si pudiéramos realizar un experimento perfecto en el que
sólo X cambia.
• Por ejemplo, supongamos que queremos saber qué influencia tiene el género (la X)
sobre el salario (la Y). Un hombre determinado gana 30.000 euros anuales. Para definir
el efecto causal (teórico) deberíamos convertir al hombre que teníamos antes en una
mujer. Como todo sigue igual, a excepción de que ahora ha cambiado el género, la
diferencia entre el salario en la situación real, cuando la persona es un hombre, y la
simulada, cuando es una mujer, es el efecto causal del género sobre el salario.
• Como es evidente, el problema de esta comparación es que resulta imposible que una
persona sea hombre y mujer. En otras palabras, no se puede observar
simultáneamente X y no-X para una determinada unidad. Se trata, en los términos de
Holland (1986), del problema fundamental de la inferencia causal.
Diferencia entre correlación y causalidad

• Por ejemplo, existe una correlación entre el número de iglesias en una ciudad
y el número de alcohólicos en la misma.
• Te habrá incluso chocado leer la frase anterior, ¡pues es cierta! Aunque no
pienses mal, he dicho que hay correlación, pero en ningún momento he dicho
que una cosa cause la otra. En este caso habría detrás una tercera variable no
considerada en mi frase que está correlacionada con las dos y que sería la
variable explicativa. Estoy hablando, claro está, de la cantidad de población
que haya en esa ciudad, a más población más iglesias y a más población más
alcohólicos.
• La lección teórica y práctica de esta diferencia nos enseña a tener cuidado a la
hora de aprender a interpretar los datos. No siempre que exista correlación,
querrá decir que una variable cause a la otra. Así pues, es importante
entender muy bien la diferencia entre correlación y causalidad. Esto nos
ayudará a no caer en errores a la hora de realizar estudios o investigaciones.
Regresión y predicción
Análisis de la regresión

• En estadística, el análisis de la regresión es un proceso estadístico


para estimar las relaciones entre variables.
• Más específicamente, el análisis de regresión ayuda a entender
cómo el valor de la variable dependiente varía al cambiar el valor
de una de las variables independientes, manteniendo el valor de
las otras variables independientes fijas.
• El análisis de regresión es ampliamente utilizado para
la predicción y previsión, donde su uso tiene superposición
sustancial en el campo de aprendizaje automático (machine
learning).
Historia

• La primera forma de regresión fue el método de mínimos


cuadrados, que fue publicado por Legendre en 1805, y por
Gauss en 1809. Legendre y Gauss aplicaron el método para
el problema de determinar, a partir de observaciones
astronómicas, las órbitas de los cuerpos alrededor del Sol
(principalmente cometas, pero también más tarde los
entonces recién descubiertos planetas menores). Gauss
publicó un desarrollo posterior de la teoría de los mínimos
cuadrados en 1821, incluyendo una versión del teorema de
Gauss-Markov.
Aplicaciones prácticas del análisis de regresión

• Este tipo de estudios tiene aplicaciones para la vida cotidiana, desde el


estudio de accidentes de tráfico en una determinada zona geográfica hasta
comprobar si un plan de estudios es recomendable o no desde el punto de
vista de la tasa de abandono escolar, por ejemplo.

Crítica al análisis de regresión

• Una crítica común a este tipo de modelo de predicción matemática es no son


óptimo, pues suele confundir correlación con causalidad. Esto quiere decir
que las conclusiones que aporta este tipo de procesos están siempre sujetas a
factores que pueden influir en su exactitud, como la falta de información
sobre lo estudiado o la existencia de fallos en la medición o recolección de
datos.
Bibliografía
• Conceptos Claros. (2019). Importancia de la Correlación Estadística - Relacionando variables.
[online] Available at: https://conceptosclaros.com/importancia-correlacion-estadistica/ [Accessed
16 Apr. 2019].
• Ollé, J., Oliva, O. and Ollé, J. (2019). Cómo interpretar la relación entre más de una variable sin
morir en el intento. Qué es la Covarianza y cómo se calcula - Estadística Descriptiva Parte 5 -
Conceptos Claros. [online] Conceptos Claros. Available at: https://conceptosclaros.com/que-es-la-
covarianza-y-como-se-calcula-estadistica-descriptiva [Accessed 16 Apr. 2019].
• Ditutor.com. (2019). Correlación estadística. [online] Available at:
https://www.ditutor.com/estadistica_2/correlacion_estadistica.html [Accessed 16 Apr. 2019].
• Explorable.com. (2019). Correlación y Causalidad. [online] Available at:
https://explorable.com/es/correlacion-y-causalidad [Accessed 16 Apr. 2019].
• Anon, (2019). [online] Available at:
https://www.upf.edu/documents/3298404/3311450/metodologia-espaxol.pdf/5687bff8-80c2-
452e-acee-adf9a04bb0ee : [Accessed 16 Apr. 2019].

You might also like