You are on page 1of 22

Análisis de

Regresión y Correlación
Introducción
Muchas veces las decisiones se basan en la relación entre
dos o más variables.Ejemplos

• Dosis de fertilizantes aplicadas y rendimiento del cultivo.

• La relación entre la radiación que reciben los sensores con


la que se predicen los rendimientos por parcelas con los
rendimientos reales observados en dichas parcelas.

• Relación entre tamaño de un lote de producción y horas –


hombres utilizadas para realizarlo.

Distinguiremos entre relaciones funcionales y relaciones


estadísticas
Relación funcional entre dos
variables
Una relación funcional se expresa mediante
una función matemática.
Si X es la variable independiente e Y es la variable
dependiente, una relación funcional tiene la forma:
Y=f(X)
Ejemplo 1
Parcela Dosis Rend.(kg/h)
1 75 150
2 25 50
3 130 260
Figura 1
Relación funcional perfecta entre dosis y
rendimientos
300

250
Rendimiento

200

150
Rend.
100

50

0
0 20 40 60 80 100 120 140

Dosis

Nota: Las observaciones caen exactamente sobre la línea de


relación funcional
Relación estadística entre dos
variables
A diferencia de la relación funcional, no es una
relación perfecta, las observaciones no caen
exactamente sobre la curva de relación entre las
variables
Ejemplo 2
Lote de prod. Tamaño del lote Horas hombre
1 30 73
2 20 50
3 60 128
4 80 170
5 40 87
Figura 2
Relación estadística entre tamaño del lote y
horas hombre
1 80

1 60
Horas hombre

1 40

1 20

1 00

80

Horas hombre
60

40

20

0 10 20 30 40 50 60 70 80 90

Tamaño del lote

Nota: La mayor parte de los punto no caen directamente sobre


la línea de relación estadística.
Esta dispersión de punto alrededor de la línea representa la
variación aleatoria
Conceptos básicos
Análisis de Regresión: Es un procedimiento estadístico que estudia
la relación funcional entre variables.Con el objeto de predecir una
en función de la/s otra/s.
Análisis de Correlación: Un grupo de técnicas estadísticas usadas
para medir la intensidad de la relación entre dos variables
Diagrama de Dispersión: Es un gráfico que muestra la intensidad y el
sentido de la relación entre dos variables de interés.
Variable dependiente (respuesta, predicha, endógena): es la
variable que se desea predecir o estimar
Variables independientes (predictoras, explicativas exógenas). Son
las variables que proveen las bases para estimar.
Regresión simple: interviene una sola variable independiente
Regresión múltiple: intervienen dos o más variables independientes.
Regresión lineal: la función es una combinación lineal de los
parámetros.
Regresión no lineal: la función que relaciona los parámetros no es
una combinación lineal
Gráfico de dispersión
Los diagramas de dispersión no sólo muestran la
relación existente entre variables, sino también resaltan
las observaciones individuales que se desvían de la
relación general. Estas observaciones son conocidas
como outliers o valores inusitados, que son puntos de
los datos que aparecen separados del resto.
Coeficiente de correlación
lineal
El Coeficiente de Correlación (r)
requiere variables medidas en escala de
intervalos o de proporciones
– Varía entre -1 y 1.
– Valores de -1 ó 1 indican correlación perfecta.
– Valor igual a 0 indica ausencia de correlación.
– Valores negativos indican una relación lineal
inversa y valores positivos indican una relación
lineal directa
Correlación Negativa Perfecta
10
9
8
7
6
Y 5
4
3
2
1
0

0 1 2 3 4 5 6 7 8 9 10
X
Correlación Positiva Perfecta
10
9
8
7
6
Y 5
4
3
2
1
0

0 1 2 3 4 5 6 7 8 9 10
X
Ausencia de Correlación
10
9
8
7
6
Y 5
4
3
2
1
0

0 1 2 3 4 5 6 7 8 9 10
X
Correlación Fuerte y Positiva
10
9
8
7
6
Y 5
4
3
2
1
0

0 1 2 3 4 5 6 7 8 9 10
X
Fórmula para el coeficente de
correlación (r) Pearson

n(ΣXY) (ΣX)(ΣY)
r=
[n(ΣX ) (ΣX) ][n(ΣY ) (ΣY) ]
2 2 2 2
Modelos de Regresión

Un modelo de regresión, es una manera de


expresar dos ingredientes esenciales de
una relación estadística:
Una tendencia de la variable dependiente Y a
variar conjuntamente con la variación de la o
las X de una manera sistemática
Una dispersión de las observaciones alrededor
de la curva de relación estadística
Modelos de Regresión

Estas dos características están implícitas en un


modelo de regresión, postulando que:
En la población de observaciones asociadas con el
proceso que fue muestreado, hay una distribución
de probabilidades de Y para cada nivel de X.
Las medias de estas distribuciones varían de manera
sistemática al variar X.
Análisis de Regresión

Objetivo: determinar la ecuación de regresión para


predecir los valores de la variable dependiente (Y)
en base a la o las variables independientes (X).
Procedimiento: seleccionar una muestra a partir de
la población, listar pares de datos para cada
observación; dibujar un diagrama de puntos para
dar una imagen visual de la relación; determinar la
ecuación de regresión.
Supuestos de Regresión Lineal
Clásica
• Cada error está normalmente distribuido
con:
– Esperanza de los errores igual a 0
– Varianza de los errores igual a una constante
 2.
– Covariancia de los errores nulas para todo
ij
Proceso de estimación de la regresión lineal simple
Modelo de regresión Datos de la muestra
y=0+1x+ x y
x1 y1
Ecuación de regresión x2 y2
E(y)=0+1x . .
Parámetros desconocidos . .
0.1 . .
xn yn

Ecuación estimada de
b0 y b1 regresión
y=b0+b1x
proporcionan estimados Estadísticos de la muestra
0 y 1 b0.b1
Líneas posibles de regresión en la
regresión lineal simple
Sección A Sección B Sección C
Relación lineal positiva Relación lineal negativa No hay relación

Ey Ey Ey
La pendiente 1
Línea de regresión * es negativa
La pendiente 1
es 0

* La pendiente 1 *
es positiva Línea de regresión Línea de regresión

x x x

* Ordenada al origen 0
Estimación de la ecuación de
Regresión Simple
Y’= a + bX, donde:
Y’ es el valor estimado de Y para distintos X.
a es la intersección o el valor estimado de Y cuando X=0
b es la pendiente de la línea, o el cambio promedio de Y’
para cada cambio en una unidad de X
el principio de mínimos cuadrados es usado para obtener a
y b:

n( XY )  ( X )( Y )
b
n(  X 2 )  (  X ) 2
Y X
a  b
n n
Fuente
• file:///C:/Documents%20and%20Settings/B
achi44/Configuraci%F3n%20local/Archivo
s%20temporales%20de%20Internet/Content
.IE5/CPE94BCP/256,1,Diapositiva 1

You might also like