Professional Documents
Culture Documents
mnimos cuadrados
Enviado por victor_j_mata
1. Introduccin
2. Mtodos de los mnimos cuadrados
3. Error estndar en la estimacin
4. Coeficiente de determinacin
5. Coeficiente de correlacin
6. Regresin lineal mltiple
7. Estimacin de los coeficientes
8. Inferencias en la regresin lineal mltiple
9. Prediccin
10.Correlacin
11. Bibliografa
INTRODUCCIN
El presente trabajo forma parte de los objetivos y contenidos de aprendizaje de
la ctedra ESTADSTICA, que pretende desarrollar las habilidades para la
utilizacin de los mtodos lineales y estimacin de mnimos cuadrados.
Para lograr este fin, se realizo la consulta de una bibliografa bsica la cual
permiti desarrollar los conceptos y ejemplos, como base para realizar
una exposicin adecuada en el saln de clases.
y = na + bx
xy = ax + bx
4.2
4.9
7.0
6.2
3.8
7.6
4.4
5.4
43.5
el segundo termino es la
entonces
por tanto
obtenido con la
estimado de
. Se utiliza la siguiente
4.2
4.9
7.0
6.2
3.8
7.6
4.4
5.4
Coeficiente de determinacin.
El cambio de la variable Y generalmente depende de muchos factores, en
ocasiones, difciles de identificar; con el modelo lineal simple, slo tenemos
presente uno. Por ejemplo, en nuestro caso la mediana del ingreso depende no
slo del porcentaje de graduados en el nivel superior, que es, el factor que
tenemos presente, pueden entrar a jugar factores tales como, ladistribucin de
la edad en la poblacin, la distribucin por sexo en la poblacin, la
industrializacin de la ciudad, el numero de universidades y muchos otros.
media se denomina
4.2
4.9
7.0
6.2
3.8
7.6
4.4
5.4
43.5
r = 88.76%
Coeficiente de correlacin
Este Coeficiente como ya se dijo mide la fuerza de la relacin entre las
variables. El coeficiente tiene el signo que tiene b y su valor
estar
El signo menos en el ndice significa una relacin negativa
y un signo ms una correlacin positiva. El coeficiente se obtiene sacando la
raz cuadrada al coeficiente de determinacin y se simboliza con "r".
0.0
0.2
0.4
0.7
0.9
donde
(X'X)b = X'y
y
las ecuaciones normales se pueden escribir en la forma matricial
AB=g
Si la matriz A es no singular, podemos escribir la solucin para el coeficiente
de regresin como
b = A-1g =(XX)-1Xy
De esta forma se puede obtener la ecuacin de prediccin o la ecuacin de
regresin al resolver un conjunto de k + 1 ecuaciones con un nmero igual de
incgnitas. Esto implica la inversin de la matriz X'X de k + 1 por k + 1.
Las tcnicas para invertir esta matriz se explican en la mayora de
los libros de texto sobre determinantes y matrices elementales. Por supuesto,
se dispone de muchos paquetes de computadora de
alta velocidad para problemas de regresin mltiple, paquetes que no slo
imprimen estimaciones de los coeficientes de regresin, sino que tambin
proporcionan otra informacin relevante para hacer inferencias respecto a la
ecuacin de regresin.
Ejemplo 1
Se midi el porcentaje de sobrevivencia de cierto tipo de semen animal,
despus del almacenamiento, en varias combinaciones de concentraciones de
=
De los resultados de una computadora obtenemos los elementos de la matriz
inversa
=
Al resolver estas r + 1 ecuaciones, obtenemos las estimaciones b0, b1,....., br y
por ello generamos la ecuacin de prediccin de regresin polinomial
Ejemplo 2
Los siguientes datos representan el porcentaje de impurezas que ocurren a
varias temperaturas y tiempos de esterilizacin durante una reaccin asociada
con la fabricacin de cierta bebida.
b1 = -0,36235
b2 = -2,75299
menudo se aproximan a travs del uso de estos mtodos. Para una exposicin
ms amplia se remite al lector a Response Surface Methodology: Process and
Product Optimization Using Designed Experiments de Myers y Montgomery.
Regresin lineal mltiple.
En la mayor parte de los problemas de investigacin donde se aplica el
anlisis de regresin se necesita ms de una variable independiente en el
modelo de regresin. La complejidad de la mayor parte de los mecanismos
cientficos es tal que para ser capaces de predecir una respuesta importante se
necesita un modelo de regresin mltiple. Cuando este modelo es lineal en los
coeficientes se denomina modelo de regresin lineal mltiple. Para el caso de
k variables independientes X1, X2,....,Xk, la media de Y| X1, X2,....,XK est
dada por el modelo de regresin lineal mltiple
m Y|x1, x2 ,, xk = b 0 + b 1 x1 +..+ b k xk
Estas ecuaciones se pueden resolver para b0, b1,b2, ..., bk mediante cualquier
mtodo apropiado para resolver sistemas de ecuaciones lineales.
Ejemplo 1
Se realiz un estudio sobre un camin de reparto ligero a diesel para ver si la
humedad, temperatura del aire y presin baromtrica influyen en la emisin
de xido nitroso (en ppm). Las mediciones de las emisiones se tomaron en
diferentes momentos, con condiciones experimentales variantes. Los datos son
los siguientes:
xido
Hum
x
nitroso,
y
0,90
0,91
41
0,96
34
0,89
35
1,00
10
1,10
12
1,15
8,
1,03
20
0,77
72
1,07
24
El modelo es:
m Y|x1, x2, x3 = b 0 + b 1 x1 + b 2 x2 +..+ b 3 x3
Ajuste este modelo de regresin lineal mltiple a los datos dados y despus
estime la cantidad de xido nitroso para las condiciones donde la humedad es
50%, la temperatura 76F y la presin baromtrica 29,30.
SOLUCIN
Para las ecuaciones normales encontramos que
Regresin polinomial.
Suponga ahora que deseamos ajustar la ecuacin polinomial
m Y|x = b 0 + b 1 x +b 2 x2+ ..+ b r xr
a los n pares de observaciones {(xi, yi); i = 1,2,..., n}. Cada observacin, yi
satisface la ecuacin
9,1
SOLUCIN:
Un intervalo de confianza
donde ta /2 es un valor de
La cantidad
a menudo se llama error estndar de prediccin y
por lo general aparece en el impreso de muchos paquetes de regresin para
computadora.
Ejemplo 1
Con el uso de los datos del ejemplo 1 correspondiente al "Modelo de regresin
lineal con el uso de matrices", construya un intervalo de confianza de 95%
para la respuesta media cuando x1 = 3%, x2 = 8%, y x3 = 9%.
SOLUCIN
De la ecuacin de regresin del ejemplo 1 correspondiente al "Modelo de
regresin lineal con el uso de matrices", el porcentaje estimado de
sobrevivencia cuando x1 = 3%, x2 = 8%, y x3 = 9% es
Con el uso del cuadrado medio del error, s2 = 4.298 o s = 2.073, y de la tabla
A.4, vemos que t0.025 = 2.262 para 9 grados de libertad. Por tanto, un
intervalo de confianza de 95% para el porcentaje medio de sobrevivencia para
x1 = 3%, x2 = 8%, y x3= 9% est dado por
o simplemente
.
Como en el caso de la regresin lineal simple, necesitamos hacer una clara
distincin entre el intervalo de confianza de la respuesta media y el intervalo
de prediccin sobre una respuesta observada. Esta ltima proporciona un
lmite dentro del cual podemos decir con un grado de certeza preestablecido
que caer una nueva respuesta observada.
se
de la variable
y varianza
Ejemplo 2
Con el uso de los datos del ejemplo 1 correspondiente a el tema "Modelo de
regresin lineal con el uso de matrices" construya un intervalo de prediccin
de 95% para una respuesta individual del porcentaje de sobrevivencia cuando
x1 = 3%, x2 = 8%, y x3 = 9%.
SOLUCIN:
que se reduce a
. Ntese, como se espera, que el intervalo
de prediccin es considerablemente menos estrecho que el intervalo de
confianza para el porcentaje de sobrevivencia media en el ejemplo 1.
Un conocimiento de las distribuciones de los estimadores de los coeficientes
individuales permite al experimentador construir intervalos de confianza para
los coeficientes y probar hiptesis acerca de ellos.
De esta manera podemos utilizar la estadstica
calculamos la estadstica:
y no rechazamos H0 si
libertad.
donde
tiene n k 1 grados de
Ejemplo 3
Para el modelo del ejemplo 1 correspondiente al "Modelo de regresin lineal
con el uso de matrices", pruebe la hiptesis de que 2 = -2,5 en el nivel de
significancia 0.05 contra la alternativa de que 2> -2,5.
SOLUCIN:
Clculos:
PREDICCION.
Existen varias razones para construir una regresin lineal. Una, por supuesto,
es predecir valores de respuesta a uno o mas valores de la variable
independiente. En este aparte nos enfocamos en los errores asociados con la
prediccin.
La ecuacin = a +bx se puede usar para predecir o estimar la respuesta media
y x en x = xo no es necesariamente uno de los valores preseleccionados, o
se puede utilizar para predecir un solo valor o de la variable Yo cuando x =
xo. Esperaramos que el error de prediccin fuese mas alto en el caso de un
solo valor predicho en el caso donde se predice una media. Esto, entonces,
afectara el ancho de nuestros intervalos para valores que se predicen.
Suponga que el experimentador desea construir un intervalo de confianza para
y x . Utilizaremos el estimador puntual o = A + Bxo para estimar y x .
= a + b c o se puede mostrar que la distribucin muestral de o es normal con
media:
Y varianza:
La ultima se sigue del hecho que Cov(, B) = 0. De esta forma el intervalo de
confianza de (1 - a )100% sobre la respuesta media y x . Se puede construir
a partir de la estadstica :
CORRELACION.
Hasta este punto hemos supuesto que la variable de regresin independiente x
es una variable fsica o cientfica pero no una variable aleatoria. De hecho, en
este contexto , x a menudo se llama variable matemtica, que, en el proceso
de muestreo, se mide con un error insignificante. En muchas aplicaciones de
las tcnicas de regresin es mas realista suponer que X y Y son variables
aleatorias y que las mediciones {(Xi, Yi) ; i= 1, 2, ..., n} son observaciones de
una poblacin que tiene la funcin de densidad conjunta f(x, y). Consideremos
el problema de medir la relacin entre las dos variables X y Y. Por ejemplo, si
X y Y representan la longitud y circunferencia de una clase particular de hueso
en el cuerpo de un adulto, podemos realizar un estudio antropolgico para
determinar si los valores grandes de X se asocian con valores grandes de Y, y
viceversa. El anlisis de correlacin intenta medir la fuerza de tales relaciones
entre dos variables por medio de un solo numero llamado coeficiente de
correlacin.
BIBLIOGRAFA
Comentarios