You are on page 1of 48

ANALISIS DE CORRELACION y REGRESION LINEAL

Prof. Hincho
INTRODUCCIÓN

Cuando observamos dos caracteres X e Y en una investigación. se


desea determinar la existencia de algún tipo de relacionamiento entre
las variables en estudio.
El análisis de este relación.
Estudia la Correlación de Pearson ( en datos cuantitativas ) se lleva
acabo mediante el Coeficiente de Correlación.

Observación.-
cuando estamos seguros que existe un alto grado de asociación entre
las dos variables, el análisis se encamina a cuantificar la relación
existente con el fin de predecir cuáles serán los valores de la variable
respuesta, en este caso tenemos un problema de Análisis Regresión
Lineal.

Prof. Hincho
1. ANALISIS DE CORRELACION
DEFINICIÓN. La correlación es el método empleado para
determinar el grado de asociación o relación entre las variables
que se estudian, para así determinar en qué medida una relación
funcional lineal que describe o explica en una forma adecuada las
relaciones entre las variables.

TIPOS DE CORRELACIÓN. Atendiendo al relacionamiento entre


las variables X e Y podemos tener:

Correlación Directa o Positiva. Cuando las variables X e Y


presentan variaciones en un mismo sentido, esto es, para mayores
valores de X corresponde mayores valores de Y.
Correlación Inversa o Negativa. Cuando las variaciones de X e Y
son en sentidos contrarios, esto es, para mayores valores de X
corresponden menores valores de Y.
Correlación nula. Cuando no existe ningún tipo de
relacionamiento entre las variables.
1.1 DIAGRAMA DE DISPERSION

Se utiliza para graficar la relación entre dos variables X e Y,


consiste en una nube de puntos que indicará si existe o no
correlación dependiendo de la tendencia de la tendencia de los
puntos.

Correlación Correlación
Sin
Positiva Negativa
Correlación
(Directa) (Inversa)
1.1 GRAFICAS DE DISPERSION Y SU RELACION CON LA
CORRELACION

Y Y Y

X X X
r = -1 r = -0.6 r=0
Y
Y

X X X
r = +1 r = +0.3 r=0
FORMULA DE CORRELACION
Es un número que indica el grado de asociación entre las variables
y se define del siguiente modo:

n
 xi yi  nxy S xy
i 1
r n n

Sx S y
 xi2  nx 2
 yi2  ny 2
i 1 i 1

Prof. Hincho
CARACTERISTICAS
Características:
i) El coeficiente r es un número comprendido entre -1 y +1
1  r  1
ii) Si r 0 Existe una correlación directa o positiva

iii) Si r 0 Existe una correlación Inversa o negativa

iv) Si r  1 Existe una perfecta asociación positiva entre las dos variables
v) Si r  1 Existe una perfecta asociación negativa entre las dos variables
vi) Si r 0 No Existe asociación entre las dos variables, no existe asociación lineal.

COEFICIENTE DE DETERMINANTE ( R)

R= (r^2) se refiere a la variable Y que es explicado por la


variable X
Prof. Hincho
EJEMPLO 01 .- DATOS APLICATIVO

Ventas(miles)
Experiencia (X) (Y) XY X2 Y2

1 13 26 338 169 676

2 16 33 528 256 1089

3 30 36 1080 900 1296

4 2 16 32 4 256

5 8 26 208 64 676

6 6 19 114 36 361

7 31 38 1178 961 1444

∑X= 106 ∑Y=194 ∑XY=3478 ∑ X2=2390 ∑ Y2=5798


Análisis de Correlación con ( Ms EXCEL)

Resumen de Correlación

Resumen Estadísticas

Coeficiente de correlación múltiple 0.939433816

Coeficiente de determinación R^2 0.882535894


R^2 ajustado 0.859043073
Error típico 3.146513316

Observaciones 7

r = 0.939 = 94% significa que existe una relación


lineal fuerte entre las variables experiencia del
vendedor y la cantidad de venta en miles.
COEFICIENTE DE DETERMINANTE ( R)
R= (0.939^2) = 0.8825 se refiere a la variable ventas (Y) que es explicado
por la variable (X) experiencia

Prof. Hincho
2.- Ejemplo

Una agencia de publicidad tiene estrategias de ventas,


usando sienta publicidad por minuto en radio por cada mes

a.- realizar una grafica de dispersión


b.- determinar la correlación e interpretar
c.- determinar la regresión lineal
d.- Estimar una venta si la publicidad es 95 veces por mes
e.- realizar una inferencia de r a un nivel de confianza 99%
Publicidad 20 30 30 40 50 60 60 60 70 80

Ventas ( de 50 73 69 87 108 128 135 132 148 170


artículos
vendidos )

Prof. Hincho
INFERENCIA DE CORRELACION
Hipótesis a Contrastar
 Para evaluar si el coeficiente de correlación muestral
r, es estadísticamente significativo se tiene que
contrastar las siguientes hipótesis:
 1) Hipótesis

H0 :  = 0 ( No existe relación entre las variables X e Y)


 H1 :  = 0 ( Existe relación entre las variables X e Y)

2) Estadística de prueba

 3) Valor Critico
t(1- α/2); (n-2) ver tabla
4) Decisión

Si Tc > t (tabla), entonces rechazo Ho y acepto H1


TEMA 02: REGRESION LINEAL SIMPLE
02 REGRESION LINEAL SIMPLE
02 REGRESION LINEAL SIMPLE
Este tipo de regresión se utiliza cuando existe solo una variable independiente X
para una variable dependiente y ( bi ) se llaman parámetros o coeficientes de
estimación. Y. Está definida por la siguiente ecuación lineal en su forma general:

Y  b0  b1 X  e

Donde:

Y Es la variable respuesta o valor de la predicción de la variable Y dado un valor X .

b0 Es el valor de Y cuando X = 0, es decir, es el valor de Y cuando la línea de regresión


cruza el eje de las Y.

b1 Es la pendiente de la línea, o la variación promedio en Y por cada variación de una


unidad en X.

X Es cualquier valor seleccionado de la variable independiente X.


e Es el error de predicción
METODO DE MINIMOS CUADRADOS PARA
ESTIMAR LOS COEFICIENTES DE REGRESIÓN.
Es un método para obtener la recta que se ajuste mejor a los
datos, al graficar los datos sabemos que podemos trazar infinidad
de rectas pero este método nos proporciona la de mejor ajuste.
ei ~ N( µ, δ2 )

A ei se le llama desviación o error que puede ser negativo o positivo, si elevamos las
desviaciones al cuadrado, para obtener la recta más representativa la suma de los errores

al cuadrado e12  e22  e32  .....  en2 debe ser lo más pequeña posible.
Prof. Hincho
02 GRAFICA DE DISPERSION
02 ESTIMACION DE LOS COEFICIENTES

RECTA DE MINIMOS CUADRADOS. Para poder obtener la recta de regresión Y en X


utilizaremos la siguiente ecuación de estimación:

Ŷ  b0  b1 X

Donde los valores de b0 y b1 en la ecuación de regresión son conocidos como coeficientes


de regresión y las fórmulas para calcularlos son:

n
 xi yi  nxy
b  i 1 b  yb x
0 1
1 n

x 2
i
 nx 2
i 1

Nota: Para hallar las formulas anteriores se deriva la sumatoria de errores al cuadrado con
respecto a b0 y b1 . (Investigación del alumno)
ANALISIS DE REGRESION APLICADO

Prof. Hincho
OTRA FORMA DE ESTIMAR LA R.L.S.

Prof. Hincho
ANALISIS DE VARIANZA CON ( Ms EXCEL)
( INFERENCIA DE REGRESION )

ANÁLISIS DE VARIANZA

Suma de Promedio de los


Grados de libertad cuadrados cuadrados F

Regresión 1 371.925841 371.925841 37.5661948

Residuos 5 49.5027303 9.90054605

Total 6 421.428571

Coeficientes Error típico Estadístico t Probabilidad

Intercepción 17.29013469 2.07531582 8.33132698 0.00040731

Variable X 1 0.688387332 0.1123141 6.12912675 0.00167799


EJEMPLOS 01 .- EJEMPLO APLICATIVO
Entonces la ecuación de regresión estimada será:

Ŷ  17.29  0.688X
Interpretación:

b0  17.29 , Son las ventas de un empleado cuando X es cero o cuando no tienen

años de experiencia. En otras palabras un vendedor tendrá en promedio ventas de S/.


17290 si no tiene años de experiencia.

b1  0.688 , Es el incremento en 0.688 cuando X aumenta en una unidad. En otras

palabras es el aumento en S/. 688 por cada año de experiencia que adquiera un
empleado.

a) Predicción para X=40

Ŷ  17.29  0.688( 40 )  44.826


Un empleado con 40 años de experiencia en ventas, venderá aproximadamente
S/.44826
ANALISIS CON
SPSS
Modelos no lineales ?
Modelos no lineales ?
03 .- Ejemplo

horas de estudio 3 4 7 2 5 3 6

calificación 10 12 18 7 11 8 15

a.- Realizar una grafica de dispersión

b.- Determinar la regresión lineal simple

c.- Determinar la correlación de pearson e interpretar


e.- Determinar la inferencia de “ r “ con nivel de confianza 95%

Prof. Hincho
a.- Realizar una grafica de
dispersión

b.- Determinar la regresión


lineal simple

c.- Determinar la correlación


de pearson e interpretar

d.- Determinar el coeficiente


de determinación e interprete

e.- Determinar la inferencia


de “ r “ con nivel de
confianza 90%

Prof. Hincho
promedio de ingreso económica
mortalidad infantil madres analfabetas en % x semana por familia en $
05 .- EJEMPLO
a.- Realizar una grafica de y x1 x2

dispersión por variable 39 29 76

135 51 52
b.- Determinar la regresión
lineal simple por variable 85 46 62

23 5 97
c.- Determinar la
121 48 54
correlación de pearson por
variable e interpretar 39 8 41

60 45 38
d.- Determinar el
26 6 78
coeficiente de
determinación por variable 20 30 95

e interprete 30 23 85

40 40 65
e.- Determinar la inferencia
de “ r “ por variable con 40 11 32

nivel de confianza 95% 27 38 82

43 35 43

24 16 38
Prof. Hincho
26 21 92
Se desea ajustar un modelo lineal para estimar la presión sistólica (Y) para valores dados
del peso (X).
Usando EXCEL haremos lo siguiente:
a) Dibujaremos el diagrama de dispersión de los datos
b) En el mismo gráfico dibujaremos la recta que mejor se ajusta a los datos.
c) En el mismo gráfico escribiremos la ecuación de la recta ajustada y el coeficiente de
determinación R2

0 Procedimiento:
6 Primeramente se debe crear una base de datos con la información entregada, de la siguiente
forma:

E
J
E
M
P
L
O

Prof. Hincho
07 .- EJEMPLO

a.- Realizar una grafica de dispersión para cada variable.


b.- Determinar la regresión Multiple
c.- Determinar la correlación para cada variable
e.- Determinar el análisis de ANOVA con nivel de confianza 90%
Prof. Hincho
08 .- EJEMPLO

d.- Realizar una grafica de dispersión para cada variable.


e.- Determinar el análisis de ANOVA con nivel de confianza 90%

Prof. Hincho
09 .- EJEMPLO

a.- Realizar una grafica de dispersión


b.- Determinar la regresión lineal
c.- Determinar la correlación y el coeficiente de determinación
d.- determinar la inferencia de “ r “ con un nivel de confianza de 95%
e.- Determinar el análisis de ANOVA con nivel de confianza 90%
10.- EJEMPLO

a.- Realizar una grafica de dispersión


b.- Determinar la regresión lineal
c.- Determinar la correlación y el coeficiente de determinación
d.- determinar la inferencia de “r” con nivel de confianza de 99%
e.- Determinar el análisis de ANOVA con nivel de confianza 90%

Prof. Hincho
11 .- EJEMPLO

a.- Realizar una grafica de dispersión


b.- Determinar la regresión lineal
c.- Determinar la correlación y el coeficiente de determinación
d.- determinar la inferencia de “r” con nivel de confianza de 95%
e.- Determinar el análisis de ANOVA con nivel de confianza 90%
Prof. Hincho
12 .- EJEMPLO

e.- Determinar el análisis de ANOVA con nivel de confianza 90% Prof. Hincho
ANALISIS DE VARIANZA PARA REGRESION LINEAL
( ANOVA)

Prof. Hincho
CUADRO DE ANOVA

- SSR: suma de cuadrado debido a la regresión

- SSE: suma de cuadrado debido al error

- SST: suma de cuadrado Total


Prof. Hincho
SUMATORIAS
(σ 𝑋 ) 2
SXX = σ 𝑋2 −
𝑛

σ 𝑋 ∗σ 𝑌
SXY = σ 𝑋𝑌 −
𝑛

2 (σ 𝑌 ) 2
SYY = σ 𝑌 −
𝑛
𝑆𝑥𝑦
෢1 =
𝐵
𝑆𝑥𝑥

𝐵෠0 = 𝑌ത − 𝐵
෢1 𝑋ത

Prof. Hincho
PASOS: ANALISIS DE VARIANZA para EL MODELO REGRESION
LINEAL SIMPLE

 Para evaluar si el modelo 3) Valor Critico


estimado de la regresión es
estadísticamente significativo se F(1- α/2); (r-1);(n – r)
tiene que contrastar las ver tabla

siguientes hipótesis:
 1) Hipótesis 4) Decisión
H0 : Bi = 0 ( El modelo no es significativo)
Fc > Ft entonces se
H1 : Bi ≠ 0 ( El modelo es significativo) acepta Hi y se rechaza H0,
que significa que el modelo
2) Estadística de prueba estadísticamente es
significativo
( determinar anova y calcular Fc )
TAREA : ANALISIS DE VARIANZA PARA LA
REGRESION LINEAL
EJEMPLO

Un grupo de ingenieros desean exportar un producto de construccion

y el producto tiene un grado de conservación para su enlatado y esta tiene

un rendimiento en días

T C° 100 110 120 130 140 150 160 170 180 190

Rendimiento 45 51 54 61 66 70 74 78 85 89

a.- Realizar una grafica de dispersión


b.- Determinar la regresión lineal
c.- Determinar la correlación y el coeficiente de determinación
d.- determinar la inferencia de “r” con nivel de confianza de 95%
e.- Determinar el análisis de ANOVA con nivel de confianza 90%
Prof. Hincho
AUTOR 01

Prof. Hincho
Prof. Hincho
AUTOR 02

Prof. Hincho
Prof. Hincho
Prof. Hincho
Prof. Hincho

You might also like