You are on page 1of 20

REGRESIN POR MNIMOS CUADRADOS

Anlisis de regresin
Genera una ecuacin para describir la relacin estadstica entre uno o ms
predictores y la variable de respuesta y para predecir nuevas observaciones. La
regresin generalmente utiliza el mtodo de mnimos cuadrados ordinarios, del cual
se obtiene la ecuacin al minimizar la suma de los residuos cuadrados.
Los resultados de regresin indican la direccin, el tamao y la significancia
estadstica de la relacin entre un predictor y una respuesta.
El signo de cada coeficiente indica la direccin de la relacin.

Los coeficientes representan el cambio de la media en la respuesta para una unidad


de cambio en el predictor mientras mantiene constantes otros predictores en el
modelo.
El valor p de cada coeficiente prueba la hiptesis nula de que el coeficiente es
igual a cero (no tiene efecto). Por lo tanto, los valores p bajos sugieren que el
predictor es una adicin significativa a su modelo.

La ecuacin predice nuevas observaciones dados valores predictores


especficos.

Por ejemplo, usted trabaja para una compaa de chips de patatas que analiza los
factores que afectan el porcentaje de chips desmenuzados por contenedor antes del
envo (la variable de respuesta). Usted lleva a cabo el anlisis de regresin e incluye
el porcentaje de patatas con respecto a otros ingredientes y la temperatura de coccin
(centgrados) como su dos predictores.

A continuacin, se muestra una tabla simplificada de resultados.

Los resultados de regresin indican que ambos predictores son significativos debido a
sus valores p bajos. Juntos, los dos predictores conforman el 67.2% de la varianza de
chips de patatas rotos. Especficamente:
Se espera que, por cada aumento del 1% en la cantidad de patatas, el porcentaje
de chips rotos baje en 0.044%.

Por cada aumento de 1 grado centgrado en la temperatura de coccin, se espera


que el porcentaje de chips rotos aumente en 0.023%.
Para predecir el porcentaje de chips rotos para valores de configuracin de 50% de
patatas y una temperatura de coccin de 175C, usted calcula un valor esperado de
4.831% de chips de patatas rotos.

Me entendiste????
O quieres un caso prctico en MINITAB?
De ser as realizar antes:
a) ejercicio de regresin lineal
b)Ejercicio de regresin mltiple

REGRESIN LINEAL

Usted es un fabricante que desea obtener una medida de calidad de un producto, pero el
procedimiento para obtener la medida es costoso. Existe un mtodo indirecto, el cual utiliza una
puntuacin del producto diferente (Puntuacin 1) en lugar de la medida de calidad real
(Puntuacin 2). Este mtodo es menos costoso pero tambin menos preciso. Usted puede
utilizar la regresin para ver si la Puntuacin 1 explica una cantidad significativa de varianza en
la Puntuacin 2 y para determinar si la Puntuacin 1 es un sustituto aceptable para la
Puntuacin 2.
1
2
3
4
5
6

Abra la hoja de trabajo EJA_REGR.MTW.


Elija Estadsticas > Regresin > Regresin.
En Respuesta, ingrese Puntuacin2.
En Predictores, ingrese Puntuacin1.
Haga clic en Aceptar.
Observe el resultado

Interpretacin de los resultados

Por opcin predeterminada, Minitab muestra los resultados en la ventana Sesin.

El valor p en la tabla Anlisis de varianza (0.000), indica que la relacin entre la Puntuacin 1 y la Puntuacin
2 es estadsticamente significativa en un nivel a de .05. Esto tambin lo muestra el valor p del coeficiente
estimado de la Puntuacin 1, el cual es 0.000.

El valor de R2 muestra que la Puntuacin 1 explica el 95.7% de la varianza en la Puntuacin 2, lo que indica
que el modelo se ajusta a los datos extremadamente bien.

La Observacin 9 se identifica como una observacin inusual porque su residuo estandarizado es menor que
-2. Esto podra indicar que esta observacin es un valor atpico. Vase Identificacin de valores atpicos en el
software MINITAB

Debido a que el modelo es significativo y explica una gran parte de la varianza en la Puntuacin 2, el
fabricante decide utilizar la Puntuacin 1 en lugar de la Puntuacin 2 como una medida de calidad para el
producto.

REGRESIN MLTIPLE

Como parte de una prueba de energa trmica solar, usted mide el flujo de calor total en un
conjunto de viviendas. Usted desea determinar si el flujo de calor total (FlujoCalor) puede
predecirse tomando en cuenta la posicin de los puntos focales en las direcciones de este, sur y
norte.
Usted determin, utilizando la regresin de los mejores subconjuntos, que el modelo de los
mejores dos predictores inclua las variables Norte y Sur, y que el modelo de los mejores tres
predictores agregaba la variable Este.
Usted evala el modelo de los mejores tres predictores utilizando la regresin mltiple.

1 Abra la hoja de trabajo EJA_REGR.MTW.


2 Elija Estadsticas > Regresin > Regresin.
3 En Respuesta, ingreseFlujoCalor.
4 En Predictores, ingrese Este Sur Norte.
5 Haga clic en Grficas.
6 En Residuos para grficas, elija Estandarizados.
7 En Grficas de residuos, elija Grficas individuales. Marque Histograma de residuos, Grfica
normal de residuos, y Residuos vs. ajustes. Haga clic en Aceptar.
8 Haga clic en Opciones.
9 En Mostrar, marque PRESS y R-cuadrada pronosticada. Haga clic en Aceptar en cada
cuadro de dilogo.

Interpretacin de los resultados


Salida de la ventana Sesin

El valor p en la tabla Anlisis de varianza (0.000) muestra que el modelo estimado


mediante el procedimiento de regresin es significativo en un nivel a de 0.05. Esto indica que
al menos un coeficiente es diferente de cero.
Los valores p para los coeficientes estimados de Norte y Sur son ambos de 0.000, lo cual
indica que estn significativamente relacionados con FlujoCalor. El valor p para Este es de
0.092, lo que indica que no est relacionado con FlujoCalor en un nivel a de 0.05.
Adicionalmente, la suma secuencial de los cuadrados indica que el predictor Este no explica
una cantidad sustancial de la varianza nica. Esto sugiere que un modelo que solamente
tome en cuenta Norte y Sur podra ser ms apropiado.

El valor R2 indica que los predictores explican el 87.4% de la varianza en FlujoCalor. El valor
de R2 ajustada es de 85.9%, lo cual explica el nmero de predictores en el modelo. Ambos
valores indican que el modelo se ajusta bien a los datos.
El valor de R2 pronosticada es de 78.96%. En virtud de que el valor de R2 pronosticada est
cerca de los valores de R2 y R2 ajustada, el modelo no parece estar sobreajustado y tiene
una capacidad predictiva adecuada.
Las observaciones 4 y 22 estn identificadas como inusuales porque el valor absoluto de los
residuos estandarizados es mayor que 2. Esto podra indicar que se trata de valores atpicos.
Vase Verificacin de su modelo, Identificacin de valores atpicos y Eleccin de un tipo de
residuo.

Salida de la ventana Grfica


El histograma indica que los datos podran tener valores atpicos, lo cual se muestra mediante
dos barras, en el extremo derecho de la grfica.

La grfica de probabilidad normal muestra un patrn aproximadamente lineal que concuerda con
una distribucin normal. Los dos puntos de la esquina superior derecha de la grfica pueden ser
valores atpicos. El Destacado de la grfica identifica estos puntos como 4 y 22, los mismos
puntos que fueron etiquetados como observaciones inusuales en la salida. Vase Verificacin de
su modelo e Identificacin de valores atpicos.
La grfica de residuos versus valores ajustados muestra que los residuos se hacen ms
pequeos (se acercan a la lnea de la referencia) a medida que aumentan los valores ajustados,
lo cual podra indicar que los residuos tienen una varianza no constante.

AHORA PODEMOS HACER LOS TRES EJERCICIOS PARA


COMPRENDER EL TEMA

You might also like