Professional Documents
Culture Documents
Prof. Hincho
INTRODUCCIÓN
Observación.-
cuando estamos seguros que existe un alto grado de asociación entre
las dos variables, el análisis se encamina a cuantificar la relación
existente con el fin de predecir cuáles serán los valores de la variable
respuesta, en este caso tenemos un problema de Análisis Regresión
Lineal.
Prof. Hincho
1. ANALISIS DE CORRELACION
DEFINICIÓN. La correlación es el método empleado para
determinar el grado de asociación o relación entre las variables
que se estudian, para así determinar en qué medida una relación
funcional lineal que describe o explica en una forma adecuada las
relaciones entre las variables.
Correlación Correlación
Sin
Positiva Negativa
Correlación
(Directa) (Inversa)
1.1 GRAFICAS DE DISPERSION Y SU RELACION CON LA
CORRELACION
Y Y Y
X X X
r = -1 r = -0.6 r=0
Y
Y
X X X
r = +1 r = +0.3 r=0
FORMULA DE CORRELACION
Es un número que indica el grado de asociación entre las variables
y se define del siguiente modo:
n
xi yi nxy S xy
i 1
r n n
Sx S y
xi2 nx 2
yi2 ny 2
i 1 i 1
Prof. Hincho
CARACTERISTICAS
Características:
i) El coeficiente r es un número comprendido entre -1 y +1
1 r 1
ii) Si r 0 Existe una correlación directa o positiva
iv) Si r 1 Existe una perfecta asociación positiva entre las dos variables
v) Si r 1 Existe una perfecta asociación negativa entre las dos variables
vi) Si r 0 No Existe asociación entre las dos variables, no existe asociación lineal.
COEFICIENTE DE DETERMINANTE ( R)
Ventas(miles)
Experiencia (X) (Y) XY X2 Y2
4 2 16 32 4 256
5 8 26 208 64 676
6 6 19 114 36 361
Resumen de Correlación
Resumen Estadísticas
Observaciones 7
Prof. Hincho
2.- Ejemplo
Prof. Hincho
INFERENCIA DE CORRELACION
Hipótesis a Contrastar
Para evaluar si el coeficiente de correlación muestral
r, es estadísticamente significativo se tiene que
contrastar las siguientes hipótesis:
1) Hipótesis
2) Estadística de prueba
3) Valor Critico
t(1- α/2); (n-2) ver tabla
4) Decisión
Y b0 b1 X e
Donde:
A ei se le llama desviación o error que puede ser negativo o positivo, si elevamos las
desviaciones al cuadrado, para obtener la recta más representativa la suma de los errores
al cuadrado e12 e22 e32 ..... en2 debe ser lo más pequeña posible.
Prof. Hincho
02 GRAFICA DE DISPERSION
02 ESTIMACION DE LOS COEFICIENTES
Ŷ b0 b1 X
n
xi yi nxy
b i 1 b yb x
0 1
1 n
x 2
i
nx 2
i 1
Nota: Para hallar las formulas anteriores se deriva la sumatoria de errores al cuadrado con
respecto a b0 y b1 . (Investigación del alumno)
ANALISIS DE REGRESION APLICADO
Prof. Hincho
OTRA FORMA DE ESTIMAR LA R.L.S.
Prof. Hincho
ANALISIS DE VARIANZA CON ( Ms EXCEL)
( INFERENCIA DE REGRESION )
ANÁLISIS DE VARIANZA
Total 6 421.428571
Ŷ 17.29 0.688X
Interpretación:
palabras es el aumento en S/. 688 por cada año de experiencia que adquiera un
empleado.
horas de estudio 3 4 7 2 5 3 6
calificación 10 12 18 7 11 8 15
Prof. Hincho
a.- Realizar una grafica de
dispersión
Prof. Hincho
promedio de ingreso económica
mortalidad infantil madres analfabetas en % x semana por familia en $
05 .- EJEMPLO
a.- Realizar una grafica de y x1 x2
135 51 52
b.- Determinar la regresión
lineal simple por variable 85 46 62
23 5 97
c.- Determinar la
121 48 54
correlación de pearson por
variable e interpretar 39 8 41
60 45 38
d.- Determinar el
26 6 78
coeficiente de
determinación por variable 20 30 95
e interprete 30 23 85
40 40 65
e.- Determinar la inferencia
de “ r “ por variable con 40 11 32
43 35 43
24 16 38
Prof. Hincho
26 21 92
Se desea ajustar un modelo lineal para estimar la presión sistólica (Y) para valores dados
del peso (X).
Usando EXCEL haremos lo siguiente:
a) Dibujaremos el diagrama de dispersión de los datos
b) En el mismo gráfico dibujaremos la recta que mejor se ajusta a los datos.
c) En el mismo gráfico escribiremos la ecuación de la recta ajustada y el coeficiente de
determinación R2
0 Procedimiento:
6 Primeramente se debe crear una base de datos con la información entregada, de la siguiente
forma:
E
J
E
M
P
L
O
Prof. Hincho
07 .- EJEMPLO
Prof. Hincho
09 .- EJEMPLO
Prof. Hincho
11 .- EJEMPLO
e.- Determinar el análisis de ANOVA con nivel de confianza 90% Prof. Hincho
ANALISIS DE VARIANZA PARA REGRESION LINEAL
( ANOVA)
Prof. Hincho
CUADRO DE ANOVA
σ 𝑋 ∗σ 𝑌
SXY = σ 𝑋𝑌 −
𝑛
2 (σ 𝑌 ) 2
SYY = σ 𝑌 −
𝑛
𝑆𝑥𝑦
1 =
𝐵
𝑆𝑥𝑥
𝐵0 = 𝑌ത − 𝐵
1 𝑋ത
Prof. Hincho
PASOS: ANALISIS DE VARIANZA para EL MODELO REGRESION
LINEAL SIMPLE
siguientes hipótesis:
1) Hipótesis 4) Decisión
H0 : Bi = 0 ( El modelo no es significativo)
Fc > Ft entonces se
H1 : Bi ≠ 0 ( El modelo es significativo) acepta Hi y se rechaza H0,
que significa que el modelo
2) Estadística de prueba estadísticamente es
significativo
( determinar anova y calcular Fc )
TAREA : ANALISIS DE VARIANZA PARA LA
REGRESION LINEAL
EJEMPLO
un rendimiento en días
T C° 100 110 120 130 140 150 160 170 180 190
Rendimiento 45 51 54 61 66 70 74 78 85 89
Prof. Hincho
Prof. Hincho
AUTOR 02
Prof. Hincho
Prof. Hincho
Prof. Hincho
Prof. Hincho