You are on page 1of 24

En el mtodo de Mnimos Cuadrados deseamos minimizar la discrepancia entre los datos observados x[n] y la seal original s[n].

Esta seal se genera a travs de un modelo que depende un conjunto de parmetros de inters agrupados en el vector . Aunque s[n] es completamente determinista la presencia de inexactitudes en el modelo o ruido en los sensores hace que las observemos una versin perturbada de sta que denotamos por x[n]. A lo largo del tema preferiremos utilizar la notacin vectorial por su mayor simplicidad y claridad a la hora de permitir visualizar los resultados.
Mtodos de mnimos cuadrados. El procedimiento mas objetivo para ajustar una recta a un conjunto de datos presentados en un diagrama de dispersin se conoce como "el mtodo de los mnimos cuadrados". La recta resultante presenta dos caractersticas importantes: 1. Es nula la suma de las desviaciones verticales de los puntos a partir de la recta de ajuste (Y - Y) = 0. 2. Es mnima la suma de los cuadrados de dichas desviaciones. Ninguna otra recta dara una suma menor de las desviaciones elevadas al cuadrado (Y - Y) 0 (mnima). El procedimiento consiste entonces en minimizar los residuos al cuadrado Ci

Re emplazando

nos queda

La obtencin de los valores de a y b que minimizan esta funcin es un problema que se puede resolver recurriendo a la derivacin parcial de la funcin en trminos de a y b: llamemos G a la funcin que se va a minimizar:

Tomemos las derivadas parciales de G respecto de a y b que son las incgnitas y las igualamos a cero; de esta forma se obtienen dos ecuaciones llamadas ecuaciones normales del modelo que pueden ser resueltas por cualquier mtodo ya sea igualacin o matrices para obtener los valores de a y b.

Derivamos parcialmente la ecuacin respecto de a

Primera ecuacin normal

Derivamos parcialmente la ecuacin respecto de b

Segunda ecuacin normal

Los valores de a y b se obtienen resolviendo el sistema de ecuaciones resultante. Veamos el siguiente ejemplo: En un estudio econmico se desea saber la relacin entre el nivel de instruccin de las personas y el ingreso. EJEMPLO 1 Se toma una muestra aleatoria de 8 ciudades de una regin geogrfica de 13 departamentos y se determina por los datos del censo el porcentaje de graduados en educacin superior y la mediana del ingreso de cada ciudad, los resultados son los siguientes: CIUDAD : 1 2 3 4 5 6 7 8 % de (X) Graduados : 7.2 6.7 17.0 12.5 6.3 23.9 6.0 10.2 Ingreso (Y) Mediana : 4.2 4.9 7.0 6.2 3.8 7.6 4.4 5.4 (0000)

Tenemos las ecuaciones normales

y = na + bx xy = ax + bx

Debemos encontrar los trminos de las ecuaciones y, x, xy, x Por tanto procedemos de la siguiente forma:

XY

4.2 4.9 7.0 6.2 3.8

7.2 6.7

30.24 32.83

51.84 44.89

17.0 119.00 289.00 12.5 6.3 77.50 23.94 156.25 39.69

7.6 4.4 5.4 43.5

23.9 181.64 6.0 10.2 26.40 55.08

571.21 36.00 104.04

89.8 546.63 1292.92

Sustituyendo en las ecuaciones los resultados obtenidos tenemos: 43.50 = 8a + 89.8b 546.63 = 89.8a + 1292.92b multiplicamos la primera ecuacin por (-89.8) y la segunda por (8) as: 43.50 = 8a + 89.8b (-89.8) 546.63 = 89.8a + 1292.92b (8) -3906.30 = -718.4a - 8064.04b 4373.04 = 718.4a + 10343.36b 466.74 = -0- 2279.32b

Este valor de b lo reemplazamos en cualquiera de las ecuaciones para obtener a as:

Reemplazando b = 0.20477 en la primera ecuacin normal

43.5 = 8a + 89.8 (0.20477) 43.5 = 8a + 18.3880 43.5 - 18.3880 = 8a 25.1120 = 8a

Tenemos entonces que los coeficientes de regresin son : a = 3.139 y b = 0.20477. Por tanto la ecuacin de regresin nos queda:

Significa entonces que por cada incremento en una unidad en X el valor de 0.20477

se aumenta en

Esta ecuacin permite estimar el valor de para cualquier valor de X, por ejemplo: Una ciudad que tiene un porcentaje de graduados a nivel superior del 28% la mediana de ingreso para la ciudad ser:

Los valores a y b tambin se pueden obtener de la siguiente forma: partiendo de las ecuaciones normales tenemos:

Si dividimos todos los trminos de la ecuacin (1) entre n nos queda:

Tenemos entonces que el primer termino es termino es la incgnita b multiplicada por

el segundo termino es la incgnita a y el tercer por tanto nos queda:

entonces

Reemplazando a en la ecuacin (2) tenemos

a = 5.4375 0.20477 (11.2250) = 5.4375 2.2985 = 3.139 Se debe tener presente la diferencia entre el valor de obtenido con la ecuacin de regresin y

el valor de Y observado. Mientras es una estimacin y su bondad en la estimacin depende de lo estrecha que sea la relacin entre las dos variables que se estudian; Y es el valor efectivo, verdadero obtenido mediante la observacin del investigador. En el ejemplo Y es el valor mediano del ingreso que obtuvo el investigador utilizando todos los ingresos observados en cada ciudad y es el valor estimado con base en el modelo lineal utilizado para obtener la ecuacin de regresin Los valores estimados y observados pueden no ser iguales por ejemplo la primera ciudad tiene un ingreso mediano observado de Y = 4.2 al reemplazar en la ecuacin el porcentaje de graduados obtenemos un estimado de

Grficamente lo anterior se puede mostrar as:

Claramente se observa en la grfica que hay una diferencia entre el valor efectivo de Y y el valor estimado; esta diferencia se conoce como error en la estimacin, este error se puede medir. A continuacin se ver el procedimiento. Error estndar en la estimacin El error estndar de la estimacin designado por sYX mide la disparidad "promedio" entre los valores observados y los valores estimados de . Se utiliza la siguiente formula.

Debemos entonces calcular los valores de para cada ciudad sustituyendo en la ecuacin los valores de los porcentajes de graduados de cada ciudad estudiada.

4.2 4.9 7.0 6.2 3.8 7.6 4.4 5.4

7.2 6.7 17.0 12.5 6.3 23.9 6.0 10.2

4.6 4.5 6.6 5.7 4.4 8.0 4.4 5.2

-0.4 0.4 0.4 0.5 -0.6 -0.4 0.0 0.2

0.16 0.16 0.16 0.25 0.36 0.16 0.00 0.04 1.29

Syx = 0.46 (decenas de miles $)

Como esta medida trata de resumir la disparidad entre lo observado y lo estimado, es decir, trata de medir la diferencia promedio entre lo observado y lo estimado esperado de acuerdo al modelo, puede considerarse como un indicador del grado de precisin con que la ecuacin de regresin, describe la relacin entre las dos variables. Este error estndar se ve afectado por las unidades y sus cambios ya que es una medida absoluta, pues, se da en la misma unidad de medida que esta dada la variable Y; en el ejemplo 0.46 sern decenas de miles de pesos, razn por la cual no es posible comparar con las relaciones de variables dadas en distinta unidad de medida. Es necesario entonces calcular una medida que interprete o mida mejor el grado de relacin entre las variables.

Coeficiente de determinacin. El cambio de la variable Y generalmente depende de muchos factores, en ocasiones, difciles de identificar; con el modelo lineal simple, slo tenemos presente uno. Por ejemplo, en nuestro caso la mediana del ingreso depende no slo del porcentaje de graduados en el nivel superior, que es, el factor que tenemos presente, pueden entrar a jugar factores tales como, la distribucin de la edad en la poblacin, la distribucin por sexo en la poblacin, la industrializacin de la ciudad, el numero de universidades y muchos otros. El coeficiente de determinacin mide o interpreta la cantidad relativa de la variacin que ha sido explicada por la recta de regresin, es decir, la proporcin de cambio en Y explicado por un cambio en la variable X ( X es el factor que se utiliza para calcular la recta de ajuste o ecuacin de regresin, en el ejemplo es el porcentaje de graduados en el nivel superior en cada ciudad). Para el ejemplo el Coeficiente de determinacin va a medir la proporcin del cambio en el ingreso mediano de cada ciudad, debido o explicado por un cambio en el porcentaje de graduados en el nivel superior. Veamos algunos componentes de la variabilidad en el anlisis de regresin: La diferencia entre cada valor de Y observado y media se denomina variacin de Y.

La diferencia entre estimado y media , es la variacin tenida en cuenta por la ecuacin de regresin, razn por la cual se denomina variacin explicada de Y.

La diferencia entre Y observado y estimado, son variaciones consideradas debidas a factores diferentes al tenido presente por la ecuacin de regresin por eso se llama: variacin no explicada de Y.

La diferencia entre Y observado y estimado, son variaciones consideradas debidas a factores diferentes al tenido presente por la ecuacin de regresin por eso se llama: variacin no explicada de Y.

La sumatoria de las diferencias en cada una de las formas de variacin la podemos representar as:

Grficamente esta relacin se puede representar as:

Se dijo anteriormente, que el coeficiente de determinacin es la proporcin de cambio explicado en Y, por cambio en X, es decir, la proporcin que representa la variacin explicada de la variacin total. Recuerde una proporcin es la relacin de una parte con el total, por tanto, el coeficiente de determinacin ser:

En otras palabras el coeficiente de determinacin es la relacin entre la variacin explicada y la variacin total. Su valor siempre estar Para su calculo se procede as:

4.2 4.9 7.0 6.2 3.8 7.6 4.4 5.4

5.44 5.44 5.44 5.44 5.44 5.44 5.44 5.44

-1.24 -1.24 1.56 0.76 1.64 2.16 1.04 0.4

1.54 0.29 2.43 0.58 2.69 4.66 1.08 0.001

4.6 4.5 6.6 5.7 4.4 8.0 4.4 5.2

-0.84 -0.84 1.16 0.26 -1.04 2.56 -1.04 -0.24

0.71 0.88 1.35 0.07 1.08 6.55 1.08 0.06

-0.4 0.4 0.4 0.5 -0.6 -0.4 0.0 0.2

0.16 0.16 0.16 0.25 0.36 0.16 0.00 0.04

43.5

13.271

11.78

1.29

Generalmente esta proporcin se expresa como porcentaje por tanto podemos decir que

r = 88.76%

como conclusin podemos decir que el 88.76% de la variacin en el ingreso mediano de las ciudades de la muestra esta relacionada o explicada por la variacin en el porcentaje de graduados en educacin Superior en cada ciudad.

Coeficiente de correlacin Este Coeficiente como ya se dijo mide la fuerza de la relacin entre las variables. El coeficiente tiene el signo que tiene b y su valor estar El signo menos en el ndice significa una relacin negativa y un signo ms una correlacin positiva. El coeficiente se obtiene sacando la raz cuadrada al coeficiente de determinacin y se simboliza con "r".

En este caso el coeficiente r tiene signo positivo ya que toma el valor de b obtenido con las ecuaciones normales toma valor positivo. A continuacin se da, a modo de orientacin , como podran interpretarse los valores de r (positivo o negativo)

0.0 0.2 0.4 0.7

a a a a

0.2 0.4 0.7 0.9

Correlacin muy dbil, despreciable Correlacin dbil. bajo Correlacin moderada Correlacin fuerte, alto, importante

0.9

1.0

Correlacin muy fuerte, muy alto

La correlacin entre los valores de dos variables es un hecho. El que lo consideremos satisfactorio o no, depende de la interpretacin. Otro problema que representa la correlacin es cuando se pregunta si una variable, de algn modo causa o determina a la otra. La correlacin no implica causalidad. Si las variables X e Y estn correlacionadas, esto puede ser por que X causa a Y, o porque Y causa a X o porque alguna otra variable afecta tanto a X como Y, o por una combinacin de todas estas razones; o puede ser que la relacin sea una coincidencia.

Modelo de regresin lineal con el uso de matrices. Al ajustar un modelo de regresin lineal mltiple, en particular cuando el nmero de variables pasa de dos, el conocimiento de la teora matricial puede facilitar las manipulaciones matemticas de forma considerable. Suponga que el experimentador tiene k variables independientes x1, x2,....,xk, y n observaciones y1, y2,...., yn, cada una de las cuales se pueden expresar por la ecuacin yi = b 0 + b 1x1i +b 2x2i +.+ b kxki +e i Este modelo en esencia representa n ecuaciones que describen cmo se generan los valores de respuesta en el proceso cientfico. Con el uso de la notacin matricial, podemos escribir la ecuacin
y=Xb + e

donde

Entonces la solucin de mnimos cuadrados para la estimacin de b que se ilustra en la seccin Estimacin de coeficientes, "Regresin lineal mltiple" implica encontrar b para la que SSE = (y - Xb)'(y - Xb) se minimiza. Este proceso de minimizacin implica resolver para b en la ecuacin

No presentaremos los detalles relacionados con las soluciones de las ecuaciones anteriores. El resultado se reduce a la solucin de b en
(X'X)b = X'y

Ntese la naturaleza de la matriz X. Aparte del elemento inicial, el i-simo rengln representa los valores x que dan lugar a la respuesta yi. Al escribir

y las ecuaciones normales se pueden escribir en la forma matricial AB=g Si la matriz A es no singular, podemos escribir la solucin para el coeficiente de regresin como b = A-1g =(XX)-1Xy De esta forma se puede obtener la ecuacin de prediccin o la ecuacin de regresin al resolver un conjunto de k + 1 ecuaciones con un nmero igual de incgnitas. Esto implica la inversin de la matriz X'X de k + 1 por k + 1. Las tcnicas para invertir esta matriz se explican en la mayora de los libros detexto sobre determinantes y matrices elementales. Por supuesto, se dispone de muchos paquetes de computadora de alta velocidad para problemas de regresin mltiple, paquetes que no slo imprimen estimaciones de los coeficientes de regresin, sino que tambin proporcionan otra informacinrelevante para hacer inferencias respecto a la ecuacin de regresin. Ejemplo 1 Se midi el porcentaje de sobrevivencia de cierto tipo de semen animal, despus del almacenamiento, en varias combinaciones de concentraciones de tres materiales que se utilizan para aumentar su oportunidad de sobrevivencia. Los datos son los siguientes:

y(% sobrevivencia) x1(peso %) x2(peso %) x3(peso %) 25,5 1,74 5,30 10,80

31,2 25,9 38,4 18,4 26,7 26,4 25,9 32 25,2 39,7 35,7 26,5

6,32 6,22 10,52 1,19 1,22 4,10 6,32 4,08 4,15 10,15 1,72 1,70

5,42 8,41 4,63 11,60 5,85 6,62 8,72 4,42 7,60 4,83 3,12 5,30

9,40 7,20 8,50 9,40 9,90 8 9,10 8,70 9,20 9,40 7,60 8,20

Estime el modelo de regresin lineal mltiple para los datos dados. SOLUCIN: Las ecuaciones de estimacin de mnimos cuadrados, (X'X)b = X'y, son

= De los resultados de una computadora obtenemos los elementos de la matriz inversa

y despus, con el uso de la relacin b = (XX)-1 Xy, los coeficientes estimados de regresin son b0= 39.1574, b1 = 1.0161, b2 = -1.8616, b3 = -0.3433. De aqu nuestra ecuacin de regresin estimada es

Para el caso de una sola variable independiente, el grado del polinomio de mejor ajuste a menudo se puede determinar al graficar un diagrama de dispersin de los datos que se obtienen de un experimento que da n pares de observaciones de la forma {(xi, yi); i = 1, 2, .... n}.

= Al resolver estas r + 1 ecuaciones, obtenemos las estimaciones b0, b1,....., br y por ello generamos la ecuacin de prediccin de regresin polinomial

El procedimiento para ajustar un modelo de regresin polinomial se puede generalizar al caso de ms de una variable independiente. De hecho, el estudiante de anlisis de regresin debe, en esta etapa, tener la facilidad para ajustar cualquier modelo lineal en, digamos, k variables independientes. Suponga, por ejemplo, que tenemos una respuesta Y con k = 2 variables independientes y se postula un modelo cuadrtico del tipo yi = b 0 + b 1x1i + b 2x2i +b 11x21i+ b 22x22i+b 12x1i x2i+e I

donde yi, i = 1, 2, ..., n, es la respuesta para la combinacin (x1i, x2i) de las variables independientes en el experimento. En esta situacin n debe ser al menos 6, pues hay seis parmetros a estimar mediante el procedimiento de mnimos cuadrados. Adems, como el modelo contiene trminos cuadrticos en ambas variables, se deben usar al menos tres niveles de cada variable. El lector debe verificar con facilidad que las ecuaciones normales de mnimos cuadrados (X'X)b = X'y estn dadas por:

Ejemplo 2 Los siguientes datos representan el porcentaje de impurezas que ocurren a varias temperaturas y tiempos de esterilizacin durante una reaccin asociada con la fabricacin de cierta bebida.

Tiempo de esterilizacin, x2 (min) Temperatura, x1 (C) 75 100 125

15

14.05 14.93

10.55 9.48

7.55 6.59

20

16.56 15.85

13.63 11.75

9.23 8.78

25

22.41 21.66

18.55 17.98

15.93 16.44

O escrita mediante

sea un mnimo.

Con las desviaciones escritas como:

AJUSTE DE MNIMOS CUADRDOS A UNA LINEA RECTA: consideremos a un Conjunto de observaciones lineal al cual se desea ajustar una relacin

Parbola mnimo cuadrtica


En este caso el ajuste de los puntos experimentales se har a una parbola, cuya ecuacin es de la forma:

Con ecuaciones normales:

Graficas y su uso: La representacion de datos de forma grafica ayuda a presentar datos de forma sencilla donde las conclusiones son fciles de entender. Mapas del tiempo, evolucin de la bolsa, el volumen de la televisin son ejemplos de datos representados con grficos que difcilmente los podemos imaginar en otro formato. Conceptos de una variable: Objeto, proceso o caracterstica que est

Presente, o supuestamente presente, en el fenmeno que un cientfico quiere estudiar. Los objetos, procesos o caractersticas reciben el nombre devariables en la medida en que su modificacin provoca una modificacin en otro objeto, proceso o caracterstica. Las variables principales a las que se suele referir la investigacin en psicologa pueden ser independientes, dependientes, intermedias, conductuales, observables, o inobservables. Variable independiente: En la verificacin experimental, el investigador intenta reproducir artificialmente los fenmenos que se dan de forma espontnea en la realidad y que desea comprender; cuando dispone de una hiptesis que establece un supuesto vnculo causal entre un objeto, proceso o caracterstica (supuesta causa) y el objeto proceso o caracterstica que exige una explicacin (el efecto), manipula experimentalmente la primera para ver si se produce el efecto que la hiptesis describa. La variable que manipula el experimentador recibe el nombre de variable independiente. Variable dependiente: El objeto, proceso o caracterstica a estudiar y que modifica su estado con la modificacin de la variable independiente (es decir que depende de ella y que

en esa medida es un efecto) se llama variable dependiente. Si queremos averiguar cmo se produce la modificacin en nuestras sensaciones visuales con la modificacin de la luz, la luz sera la variable que tiene que manipular el investigador (es decir, la variable independiente) y la sensacin luminosa del sujeto, la variable dependiente.

conceptos de una constante :En este sentido, el concepto constante es

Justamente el opuesto a variable, que corresponde a aquellos objetos-dato que pueden recibir nuevas asignaciones de valor a lo largo delprograma. Dicho en otras palabras: entidades cuyo valor solo es conocido en tiempo de ejecucin. Una constante es una expresin que tiene un valor fijo. Hay dos tipos de constantes: constantes predefinidas que seleccionamos por el nombre desde la ventana del Explorador y las constantes literales las cuales introducimos manualmente en los mtodos.

concepto de una constante de proporcionalidad: La constante de proporcionalidad es el cociente entre el antecedente y el consecuente de cualquier razn de una proporcin.

concepto de proporcionalidad (inversa y directa):La proporcionalidad es una relacin entre magnitudes medibles. Es uno de los escasos conceptos matemticos ampliamente difundido en la poblacin. Esto se debe a que es en buena medida intuitiva y de uso muy comn. La proporcionalidad directa es un caso particular de las variaciones lineales. El factor constante de proporcionalidad puede utilizarse para expresar la relacin entre cantidades.

Proporcionalidad Directa: Dos variables x e y son directamente proporcionales si su razn y/x es constante. En este caso se dice que las variables x e y son directamente proporcionales.Dicho de otra manera si una de las variables aumenta (x), la otra tambin aumenta (y); y si una de las variables disminuye (x), la otra tambin disminuye Proporcionalidad Indirecta:Dos magnitudes son inversamente proporcionales cuando al aumentar una, disminuye la otra en la misma proporcin.

relacin entre variables:

Transformacin de variables
LINEALIZACIN DE LAS RELACIONES MATEMTICAS LINEALIZACION DE CURVA

Procedimientos

You might also like