You are on page 1of 32

ESTADISTICA APLICADA

REGRESION LINEAL SIMPLE

MINIMOS CUADRADOS
INTRODUCCIN
El presente trabajo forma parte de los objetivos y contenidos de aprendizaje de
la ctedra ESTADSTICA, que pretende desarrollar las habilidades para la
utilizacin de los mtodos lineales y estimacin de mnimos cuadrados.
Para lograr este fin, se realizo la consulta de una bibliografa bsica la cual
permiti desarrollar los conceptos y ejemplos, como base.
En este trabajo bsicamente se habla de cmo desarrollar la aplicacin de los
mtodos lineales y estimacin por mnimos cuadrados, adems de inferencia,
prediccin y correlacin.
Se desarrollaron una serie de ejemplos mediante los cuales se trata de
presentar manera mas sencilla usar estos mtodos.

MTODOS DE MNIMOS CUADRADOS.


El procedimiento mas objetivo para ajustar una recta a un conjunto de datos
presentados en un diagrama de dispersin se conoce como "el mtodo de los
mnimos cuadrados". La recta resultante presenta dos caractersticas
importantes:

1. Es nula la suma de las desviaciones verticales de los puntos a partir de la


recta de ajuste
(Y - Y) = 0.

2. Es mnima la suma de los cuadrados de dichas desviaciones. Ninguna otra


recta dara
Una suma menor de las desviaciones elevadas al cuadrado (Y - Y) 0
(Mnima).
El procedimiento consiste entonces en minimizar los residuos al cuadrado Ci

ESTADISTICA APLICADA

Re emplazando

nos queda

La obtencin de los valores de a y b que minimizan esta funcin es un


problema que se puede resolver recurriendo a la derivacin parcial de la
funcin en trminos de a y b: llamemos G a la funcin que se va a minimizar:

Tomemos las derivadas parciales de G respecto de a y b que son las incgnitas


y las igualamos a cero; de esta forma se obtienen dos ecuaciones llamadas
ecuaciones normales del modelo que pueden ser resueltas por cualquier
mtodo ya sea igualacin o matrices para obtener los valores de a y b.

Derivamos parcialmente la ecuacin respecto de a

Primera ecuacin normal

Derivamos parcialmente la ecuacin respecto de b

ESTADISTICA APLICADA

Segunda ecuacin normal


Los valores de a y b se obtienen resolviendo el sistema de ecuaciones
resultante. Veamos el siguiente ejemplo:
EJEMPLO 1
Se toma una muestra aleatoria de 8 ciudades de una regin geogrfica de 13
departamentos y se determina por los datos del censo el porcentaje de
graduados en educacin superior y la mediana del ingreso de cada ciudad, los
resultados son los siguientes:
CIUDAD: 1 2 3 4 5 6 7 8
% de (X)
Graduados: 7.2 6.7 17.0 12.5 6.3 23.9 6.0 10.2
Ingreso (Y)
Mediana: 4.2 4.9 7.0 6.2 3.8 7.6 4.4 5.4 (0000)

Tenemos las ecuaciones normales

y = na + bx
xy = ax + bx

ESTADISTICA APLICADA

Debemos encontrar los trminos de las ecuaciones


y, x, xy, x Por tanto procedemos de la siguiente forma:

XY

4.2

7.2

30.24

51.84

4.9

6.7

32.83

44.89

7.0

17.0

119.00

289.00

6.2

12.5

77.50

156.25

3.8

6.3

23.94

39.69

7.6

23.9

181.64

571.21

4.4

6.0

26.40

36.00

5.4

10.2

55.08

104.04

43.5

89.8

546.63

1292.92

Sustituyendo en las ecuaciones los resultados obtenidos tenemos: 43.50 = 8a +


89.8b
546.63 = 89.8a + 1292.92b
multiplicamos la primera ecuacin por (-89.8) y la segunda por (8) as:
43.50 = 8a + 89.8b (-89.8) 546.63 = 89.8a + 1292.92b (8)
-3906.30 = -718.4a - 8064.04b 4373.04 = 718.4a + 10343.36b
466.74 = -0- 2279.32b

ESTADISTICA APLICADA

Este valor de b lo reemplazamos en cualquiera de las ecuaciones para obtener


a as:
Reemplazando b = 0.20477 en la primera ecuacin normal
43.5 = 8a + 89.8 (0.20477) 43.5 = 8a + 18.3880 43.5 - 18.3880 = 8a 25.1120 =
8a

Tenemos entonces que los coeficientes de regresin son: a = 3.139 y b =


0.20477. Por tanto la ecuacin de regresin nos queda:

Significa entonces que por cada incremento en una unidad en X el valor de


aumenta en 0.20477

se

Esta ecuacin permite estimar el valor de para cualquier valor de X, por


ejemplo: Una ciudad que tiene un porcentaje de graduados a nivel superior del
28% la mediana de ingreso para la ciudad ser:

Los valores a y b tambin se pueden obtener de la siguiente forma: partiendo


de las ecuaciones normales tenemos:

Si dividimos todos los trminos de la ecuacin (1) entre n nos queda:

ESTADISTICA APLICADA

Tenemos entonces que el primer termino es

el segundo termino es la

incgnita a y el tercer termino es la incgnita b multiplicada por


queda:

entonces

Reemplazando a en la ecuacin (2) tenemos

por tanto nos

ESTADISTICA APLICADA

a = 5.4375 0.20477 (11.2250) = 5.4375 2.2985 = 3.139


Se debe tener presente la diferencia entre el valor de

obtenido con la

ecuacin de regresin y el valor de Y observado. Mientras es una estimacin


y su bondad en la estimacin depende de lo estrecha que sea la relacin entre
las dos variables que se estudian; Y es el valor efectivo, verdadero obtenido
mediante la observacin del investigador. En el ejemplo Y es el valor mediano
del ingreso que obtuvo el investigador utilizando todos los ingresos observados
en cada ciudad y es el valor estimado con base en el modelo lineal utilizado
para obtener la ecuacin de regresin
Los valores estimados y observados pueden no ser iguales por ejemplo la
primera ciudad tiene un ingreso mediano observado de Y = 4.2 al reemplazar
en la ecuacin el porcentaje
de graduados obtenemos un

estimado de

Grficamente lo anterior se puede mostrar as:

ESTADISTICA APLICADA

Claramente se observa en la grfica que hay una diferencia entre el valor


efectivo de Y y el valor estimado; esta diferencia se conoce como error en la
estimacin, este error se puede medir.

Regresin lineal
Las tcnicas de regresin permiten hacer predicciones sobre los valores de cierta
variable Y (dependiente), a partir de los de otra X (independiente), entre las que
intuimos que existe una relacin. Para ilustrarlo retomemos los ejemplos mencionados
al principio del captulo. Si sobre un grupo de personas observamos los valores que
toman las variables

no es necesario hacer grandes esfuerzos para intuir que la relacin que hay entre ambas
es:

Obtener esta relacin es menos evidente cuando lo que medimos sobre el mismo grupo
de personas es

La razn es que no es cierto que conocida la altura xi de un individuo, podamos


determinar de modo exacto su peso yi (v.g. dos personas que miden 1,70 m pueden tener
pesos de 60 y 65 kilos). Sin embargo, alguna relacin entre ellas debe existir, pues
parece mucho ms probable que un individuo de 2 m pese ms que otro que mida 1,20
m. Es ms, nos puede parecer ms o menos aproximada una relacin entre ambas
variables como la siguiente

ESTADISTICA APLICADA

A la deduccin, a partir de una serie de datos, de este tipo de relaciones entre variables,
es lo que denominamos regresin.

Figura: Mediante las tcnicas de regresin de una variable Y sobre una variable
X, buscamos una funcin que sea una buena aproximacin de una nube de puntos
(xi,yi), mediante una curva del tipo
de que la diferencia entre los valores yi e

. Para ello hemos de asegurarnos


sea tan pequea como sea posible.

Mediante las tcnicas de regresin inventamos una variable


variable X (o viceversa),

como funcin de otra

Esto es lo que denominamos relacin funcional. El criterio para construir


citamos anteriormente, es que la diferencia entre Y e sea pequea.

, tal como

ESTADISTICA APLICADA

El trmino que hemos denominado error debe ser tan pequeo como sea posible (El
objetivo ser buscar la funcin (tambin denominada modelo de regresin) que lo
minimice.

Figura: Diferentes nubes de puntos y modelos de regresin para ellas.

Propiedades de la regresin lineal


Una vez que ya tenemos perfectamente definida , (o bien
) nos preguntamos las
relaciones que hay entre la media y la varianza de esta y la de Y (o la de X). La respuesta
nos la ofrece la siguiente proposicin:

Proposicin
En los ajustes lineales se conservan las medias, es decir

ESTADISTICA APLICADA

En cuanto a la varianza, no necesariamente son las mismas para los verdaderos valores
de las variables X e Y y sus aproximaciones y , pues slo se mantienen en un factor
de r2, es decir,

Demostracin
Basta probar nuestra afirmacin para la variable Y, ya que para X es totalmente anlogo:

donde se ha utilizado la magnitud que denominamos coeficiente de correlacin, r, y que


ya definimos anteriormente como

ESTADISTICA APLICADA

MODELO DE REGRESIN LINEAL CON EL USO DE


MATRICES.
Al ajustar un modelo de regresin lineal mltiple, en particular cuando el
nmero de variables pasa de dos, el conocimiento de la teora matricial puede
facilitar las manipulaciones matemticas de forma considerable. Suponga que
el experimentador tiene k variables independientes x 1, x2,....,xk, y n
observaciones y1, y2,...., yn, cada una de las cuales se pueden expresar por la
ecuacin
yi = 0 + 1x1i + 2x2i +.+ kxki + i
Este modelo en esencia representa n ecuaciones que describen cmo se
generan los valores de respuesta en el proceso cientfico. Con el uso de la
notacin matricial, podemos escribir la ecuacin

y=X +
donde

Entonces la solucin de mnimos cuadrados para la estimacin de que se


ilustra en la seccin Estimacin de coeficientes, "Regresin lineal mltiple"
implica encontrar b para la que
SSE = (y - Xb)'(y - Xb)

ESTADISTICA APLICADA

se minimiza. Este proceso de minimizacin implica resolver para b en la


ecuacin

No presentaremos los detalles relacionados con las soluciones de las


ecuaciones anteriores. El resultado se reduce a la solucin de b en

(X'X)b = X'y

Ntese la naturaleza de la matriz X. Aparte del elemento inicial, el i-simo


rengln representa los valores x que dan lugar a la respuesta y i. Al escribir

y
Las ecuacio<nes normales se pueden escribir en la forma matricial
AB=g
Si la matriz A es no singular, podemos escribir la solucin para el coeficiente de
regresin como
b = A-1g =(XX)-1Xy
De esta forma se puede obtener la ecuacin de prediccin o la ecuacin de
regresin al resolver un conjunto de k + 1 ecuaciones con un nmero igual de
incgnitas. Esto implica la inversin de la matriz X'X de k + 1 por k + 1. Las
tcnicas para invertir esta matriz se explican en la mayora de los libros de
texto sobre determinantes y matrices elementales. Por supuesto, se dispone de
muchos paquetes de computadora de alta velocidad para problemas de
regresin mltiple, paquetes que no slo imprimen estimaciones de los
coeficientes de regresin, sino que tambin proporcionan otra informacin
relevante para hacer inferencias respecto a la ecuacin de regresin.

ESTADISTICA APLICADA

Ejemplo 1
Se midi el porcentaje de sobrevivencia de cierto tipo de semen animal,
despus del almacenamiento, en varias combinaciones de concentraciones de
tres materiales que se utilizan para aumentar su oportunidad de sobrevivencia.
Los datos son los siguientes:

y(%
sobrevivencia)

x1(peso
%)

x2(peso
%)

x3(peso
%)

25,5

1,74

5,30

10,80

31,2

6,32

5,42

9,40

25,9

6,22

8,41

7,20

38,4

10,52

4,63

8,50

18,4

1,19

11,60

9,40

26,7

1,22

5,85

9,90

26,4

4,10

6,62

25,9

6,32

8,72

9,10

32

4,08

4,42

8,70

25,2

4,15

7,60

9,20

39,7

10,15

4,83

9,40

35,7

1,72

3,12

7,60

26,5

1,70

5,30

8,20

ESTADISTICA APLICADA

Estime el modelo de regresin lineal mltiple para los datos dados.


SOLUCIN:
Las ecuaciones de estimacin de mnimos cuadrados, (X'X)b = X'y, son

=
De los resultados de una computadora obtenemos los elementos de la matriz
inversa

y despus, con el uso de la relacin b = (XX)-1 Xy, los coeficientes estimados


de regresin son
b0= 39.1574, b1 = 1.0161, b2 = -1.8616, b3 = -0.3433.
De aqu nuestra ecuacin de regresin estimada es

Para el caso de una sola variable independiente, el grado del polinomio de


mejor ajuste a menudo se puede determinar al graficar un diagrama de
dispersin de los datos que se obtienen de un experimento que da n pares de
observaciones de la forma {(xi, yi); i = 1, 2, .... n}.

ESTADISTICA APLICADA

=
Al resolver estas r + 1 ecuaciones, obtenemos las estimaciones b 0, b1,....., br y
por ello generamos la ecuacin de prediccin de regresin polinomial

El procedimiento para ajustar un modelo de regresin polinomial se puede


generalizar al caso de ms de una variable independiente. De hecho, el
estudiante de anlisis de regresin debe, en esta etapa, tener la facilidad para
ajustar cualquier modelo lineal en, digamos, k variables independientes.
Suponga, por ejemplo, que tenemos una respuesta Y con k = 2 variables
independientes y se postula un modelo cuadrtico del tipo
yi = 0 + 1x1i + 2x2i + 11x21i+ 22x22i+ 12x1i x2i+ I
Donde yi, i = 1, 2, ..., n, es la respuesta para la combinacin (x 1i, x2i) de las
variables independientes en el experimento. En esta situacin n debe ser al
menos 6, pues hay seis parmetros a estimar mediante el procedimiento de
mnimos
cuadrados.
Adems, como el modelo contiene trminos cuadrticos en ambas variables, se
deben usar al menos tres niveles de cada variable. El lector debe verificar con
facilidad que las ecuaciones normales de mnimos cuadrados (X'X) b = X'y
estn dadas por:

ESTADISTICA APLICADA

Ejemplo 2
Los siguientes datos representan el porcentaje de impurezas que ocurren a
varias temperaturas y tiempos de esterilizacin durante una reaccin asociada
con la fabricacin de cierta bebida.

Tiempo de Temperatura, x1 (C)


esterilizacin,
x2 (min)
75
100
125
15

20

25

14.05 10.55

7.55

14.93

9.48

6.59

16.56 13.63

9.23

15.85 11.75

8.78

22.41 18.55 15.93

ESTADISTICA APLICADA

21.66 17.98 16.44

Estimar los coeficientes de regresin en el modelo


Y|x = 0 + 1 x1 + 2 x2+ 11 x12+ 22 x22+ ..+ 12 x1 x2
SOLUCIN:

b0 = 56,4668

b11 =0,00081

b1 = -0,36235

b22 = 0,08171

b2 = -2,75299

b12 = 0,00314

y nuestra ecuacin de regresin estimada es

Muchos de los principios y procedimientos asociados con la estimacin de


funciones de regresin polinomial caen en la categora de la metodologa de
respuesta superficial, un conjunto de tcnicas que los cientficos e ingenieros
han utilizado con bastante xito en muchos campos. Problemas como la
seleccin de un diseo experimental apropiado, en particular para casos donde
hay un nmero grande de variables en el modelo, y la eleccin de las
condiciones "ptimas" de operacin sobre x 1,x2,.....,xk a menudo se aproximan a
travs del uso de estos mtodos
ERROR ESTNDAR EN LA ESTIMACIN
El error estndar de la estimacin designado por s YX mide la disparidad
"promedio" entre los valores observados y los valores estimados de
utiliza la siguiente formula.

. Se

ESTADISTICA APLICADA

Debemos entonces calcular los valores de para cada ciudad sustituyendo en


la ecuacin los valores de los porcentajes de graduados de cada ciudad
estudiada.

4.2

7.2

4.6

-0.4

0.16

4.9

6.7

4.5

0.4

0.16

7.0

17.0

6.6

0.4

0.16

6.2

12.5

5.7

0.5

0.25

3.8

6.3

4.4

-0.6

0.36

7.6

23.9

8.0

-0.4

0.16

4.4

6.0

4.4

0.0

0.00

5.4

10.2

5.2

0.2

0.04
1.29

Syx = 0.46 (decenas de miles $)

Como esta medida trata de resumir la disparidad entre lo observado y lo


estimado, es decir, trata de medir la diferencia promedio entre lo observado y lo
estimado esperado de acuerdo al modelo, puede considerarse como un

ESTADISTICA APLICADA

indicador del grado de precisin con que la ecuacin de regresin, describe la


relacin entre las dos variables. Este error estndar se ve afectado por las
unidades y sus cambios ya que es una medida absoluta, pues, se da en la
misma unidad de medida que esta dada la variable Y; en el ejemplo 0.46 sern
decenas de miles de pesos, razn por la cual no es posible comparar con las
relaciones de variables dadas en distinta unidad de medida. Es necesario
entonces calcular una medida que interprete o mida mejor el grado de relacin
entre las variables.

COEFICIENTE DE DETERMINACIN.
El cambio de la variable Y generalmente depende de muchos factores, en
ocasiones, difciles de identificar; con el modelo lineal simple, slo tenemos
presente uno. Por ejemplo, en nuestro caso la mediana del ingreso depende no
slo del porcentaje de graduados en el nivel superior, que es, el factor que
tenemos presente, pueden entrar a jugar factores tales como, la distribucin de
la edad en la poblacin, la distribucin por sexo en la poblacin, la
industrializacin de la ciudad, el numero de universidades y muchos otros.
El coeficiente de determinacin mide o interpreta la cantidad relativa de la
variacin que ha sido explicada por la recta de regresin, es decir, la proporcin
de cambio en Y explicado por un cambio en la variable X ( X es el factor que se
utiliza para calcular la recta de ajuste o ecuacin de regresin, en el ejemplo es
el porcentaje de graduados en el nivel superior en cada ciudad).
Para el ejemplo el Coeficiente de determinacin va a medir la proporcin del
cambio en el ingreso mediano de cada ciudad, debido o explicado por un
cambio en el porcentaje de graduados en el nivel superior.
Veamos algunos componentes de la variabilidad en el anlisis de regresin:
La diferencia entre cada valor de Y observado y
variacin de Y.

media se denomina

La diferencia entre estimado y


media , es la variacin tenida en cuenta por
la ecuacin de regresin, razn por la cual se denomina variacin explicada de
Y.

ESTADISTICA APLICADA

La diferencia entre Y observado y estimado, son variaciones consideradas


debidas a factores diferentes al tenido presente por la ecuacin de regresin
por eso se llama: variacin no explicada de Y.

La diferencia entre Y observado y estimado, son variaciones consideradas


debidas a factores diferentes al tenido presente por la ecuacin de regresin
por eso se llama: variacin no explicada de Y.

La sumatoria de las diferencias en cada una de las formas de variacin la


podemos representar as:

Grficamente esta relacin se puede representar as:

ESTADISTICA APLICADA

Se dijo anteriormente, que el coeficiente de determinacin es la proporcin de


cambio explicado en Y, por cambio en X, es decir, la proporcin que representa
la variacin explicada de la variacin total. Recuerde una proporcin es la

Relacin de una parte con el total, por tanto, el coeficiente de determinacin


ser:

En otras palabras el coeficiente de determinacin es la relacin entre la


variacin explicada y la variacin total. Su valor siempre estar
Para su clculo se procede as:

4.2

5.44

-1.24

1.54

4.6

-0.84

0.71

-0.4

0.16

4.9

5.44

-1.24

0.29

4.5

-0.84

0.88

0.4

0.16

ESTADISTICA APLICADA

7.0

5.44

1.56

2.43

6.6

1.16

1.35

0.4

0.16

6.2

5.44

0.76

0.58

5.7

0.26

0.07

0.5

0.25

3.8

5.44

1.64

2.69

4.4

-1.04

1.08

-0.6

0.36

7.6

5.44

2.16

4.66

8.0

2.56

6.55

-0.4

0.16

4.4

5.44

1.04

1.08

4.4

-1.04

1.08

0.0

0.00

5.4

5.44

0.4

0.001

5.2

-0.24

0.06

0.2

0.04

43.5

13.271

11.78

Generalmente esta proporcin se expresa como porcentaje por tanto podemos


decir que: r = 88.76%
Como conclusin podemos decir que el 88.76% de la variacin en el ingreso
mediano de las ciudades de la muestra esta relacionada o explicada por la
variacin en el porcentaje de graduados en educacin Superior en cada ciudad.

COEFICIENTE DE CORRELACIN
Este Coeficiente como ya se dijo mide la fuerza de la relacin entre las
variables. El coeficiente tiene el signo que tiene b y su valor estar
El signo menos en el ndice significa una relacin negativa y un
signo ms una correlacin positiva. El coeficiente se obtiene sacando la raz
cuadrada al coeficiente de determinacin y se simboliza con "r".

1.29

ESTADISTICA APLICADA

En este caso el coeficiente r tiene signo positivo ya que toma el valor de b


obtenido con las ecuaciones normales toma valor positivo.
A continuacin se da, a modo de orientacin, como podran interpretarse los
valores de r (positivo o negativo)

0.0

0.2

Correlacin muy dbil, despreciable

0.2

0.4

Correlacin dbil. bajo

0.4

0.7

Correlacin moderada

0.7

0.9

Correlacin fuerte, alto, importante

0.9

1.0

Correlacin muy fuerte, muy alto

La correlacin entre los valores de dos variables es un hecho. El que lo


consideremos satisfactorio o no, depende de la interpretacin. Otro problema
que representa la correlacin es cuando se pregunta si una variable, de algn
modo causa o determina a la otra. La correlacin no implica causalidad. Si las
variables X e Y estn correlacionadas, esto puede ser por que X causa a Y, o
porque Y causa a X o porque alguna otra variable afecta tanto a X como Y, o
por una combinacin de todas estas razones; o puede ser que la relacin sea
una coincidencia.

CORRELACIN

LINEAL

RECTA

DE

REGRESIN

Cuando observamos una nube de puntos podemos apreciar si los puntos se


agrupan cerca de alguna curva. Aqu nos limitaremos a ver si los puntos se
distribuyen alrededor de una recta. Si as ocurre diremos que hay correlacin
lineal. La recta se denomina recta de regresin.

ESTADISTICA APLICADA

Hablaremos de correlacin lineal fuerte cuando la nube se parezca mucho a


una recta y ser cada vez ms dbil (o menos fuerte) cuando la nube vaya
desparramndose
con
respecto
a
la
recta.
En el grfico observamos que en nuestro ejemplo la correlacin es bastante
fuerte, ya que la recta que hemos dibujado est prxima a los puntos de la
nube.

Cuando la recta es creciente la correlacin es positiva o directa: al aumentar


una variable, la otra tiene tambin tendencia a aumentar, como en el ejemplo
anterior. Cuando la recta es decreciente la correlacin es negativa o inversa: al
aumentar una variable, la otra tiene tendencia a disminuir.

DIAGRAMA DE DISPERSIN
La primera forma de describir una distribucin bivariante es representar los
pares de valores en el plano cartesiano. El grfico obtenido recibe el nombre de
nube de puntos o diagrama de dispersin.

ESTADISTICA APLICADA

Un diagrama de dispersin es una representacin grfica de la relacin entre


dos variables, muy utilizada en las fases de Comprobacin de teoras e
identificacin de causas raz y en el Diseo de soluciones y mantenimiento de
los resultados obtenidos. Tres conceptos especialmente destacables son que el
descubrimiento de las verdaderas relaciones de causa-efecto es la clave de la
resolucin eficaz de un problema, que las relaciones de causa-efecto casi
siempre muestran variaciones, y que es ms fcil ver la relacin en un
diagrama de dispersin que en una simple tabla de nmeros

Lnea
De
Tendencia
La lnea de tendencia es la herramienta bsica ms importante con la que
cuenta
el
analista
tcnico.
Es una lnea o conjunto de lneas que se trazan en el grfico uniendo con una
misma pendiente series sucesivas de puntos mnimos (lnea de tendencia
alcista)
o
de
puntos
mximos
(lnea
de
tendencia
bajista).
Sirve para determinar en primer lugar la direccin del mercado y establecer sus
objetivos
de
proyeccin.
Marca los niveles de soporte o de resistencia que estn proyectando los
precios.
Permite analizar en cada momento el nivel de Beneficio/Riesgo que se puede
tomar al iniciar o cerrar una posicin, tomando como referencia el precio actual
respecto
a
lnea
de
tendencia
y
su
proyeccin.
La ruptura de una lnea de tendencia al alza o la baja es una de las seales
que confirma un cambio en la direccin de los precios.
Son la base para trazar los canales que encuadran el posible movimiento de
los
precios.
Segn sea la dispersin de los datos (nube de puntos) en el plano cartesiano,
pueden darse alguna de las siguientes relaciones, Lineal, Logartmica,
Exponencial, Cuadrtica, entre otras.

Mo
delo Matemtico
Llamado tambin ajuste de curvas es una ecuacin dada en un grafico,
dependiendo del grado de correlacin que mas se ajuste al conjunto de datos.
AJUSTE LINEAL: Y=BX+A
AJUSTE LOGARITMICO: Y=B Ln X+A
AJUSTE EXPONENCIAL: Y=AC BX
AJUSTE PARABOLICO, CUADRATICO O POLINOMIAL: Y= AX 2 + BX +

A.

ESTADISTICA APLICADA

EJERCICIOS PARA RESOLVER:

1.-Los siguientes datos observados en la tabla de Contingencia del anlisis de


la relacin que existe entre la Preferencia de la poblacin de vivir en casa o
apartamento en Dos principales ciudades:

VIVIR EN CASAS

VIVIR EN APART.

MEXICO

10

40

50

MONTERREY

30

20

50

ESTADISTICA APLICADA

50

50

100

2.-Relacin entre la densidad de poblacin (Xi) y la cantidad de divorcios(Yi)


por cada 100,000 personas.
n
1
2
3
4
5
6
7

Xi
5.5
4.8
5.7
5.8
3.2
2.2
4.9

Yi
3.1
2.3
4.7
2.9
5.0
3.5
5.9

Elabore el diagrama de dispersin


Calcule los coeficientes de la ecuacin de la regresin (B 0 y B1) y
construya la ecuacin lineal correspondiente
Construya intervalos de confianza al 90% para :
-Ordenada en el origen y explique su significado
-Para la pendiente y explique su significado
Estime la cantidad de divorcios para una densidad de poblacin de 5.2
Para el numero de divorcios que se espera que ocurran cuando la
densidad de poblacin sea de 5.2
Estime y explique el coeficiente de determinacin y de correlacin para
este ejemplo.

3.-Los datos observados de la relacin existente entre obesidad (x) y el peso


de 20 hombres

n
1
2
3
4
5

Xi
4.8
5.2
3.3
1.9
2.5

Yi
1.8
2.3
5.9
6.0
3.8

ESTADISTICA APLICADA

6
7

6.0
6.9

4.2
2.9

Elabore el diagrama de dispersin


Calcule los coeficientes de la ecuacin de la regresin (B 0 y B1) y
construya la ecuacin lineal correspondiente
Estime la obesidad correspondiente para hombres mayores de 65 aos
de edad
Construya intervalos de confianza al 95% para :
-Ordenada en el origen y explique su significado
-Para la pendiente y explique su significado
-para la obesidad promedio de hombres de 65 aos de edad
Estime y explique el coeficiente de determinacin y de correlacin para
este ejemplo.
4.-En un grupo de 8 pacientes se miden las cantidades de peso y edad,
obtenindose los siguientes resultados:
Resultado de las mediciones
edad 12 8

10 11 7

10 14

peso 58 42 51 54 40 39 49 56
Existe una relacin lineal importante entre ambas variables? Calcular la recta
de regresin de la edad en funcin del peso y la del peso en funcin de la
edad.En qu medida, por trmino medio, vara el peso cada ao? En cunto
aumenta la edad por cada kilo de peso?
5.- Se realiza un estudio para establecer una ecuacin mediante la cual se
pueda utilizar la concentracin de estrona en saliva(X) para predecir la
concentracin del esteroide en plasma libre (Y). Se extrajeron los siguientes
datos de 14 varones sanos:
X 1,4 7,5 8,5

11 13 14 14,5 16

Y 30 25 31,5 27,5 39,5 38 43 49 55

17 18

20 23

48,5 51 64,5 63 68

Estdiese la posible relacin lineal entre ambas variables.

Obtener la ecuacin que se menciona en el enunciado del


problema.

Determinar la variacin de la concentracin de estrona en plasma


por unidad de estrona en saliva.

6.- Los investigadores estn estudiando la correlacin entre obesidad y la


respuesta individual al dolor. La obesidad se mide como porcentaje sobre el
peso ideal (X). La respuesta al dolor se mide utilizando el umbral de reflejo de

ESTADISTICA APLICADA

flexin nociceptiva (Y), que es una medida de sensacin de punzada. Se


obtienen los siguientes datos:
X 89 90 75 30 51 75 62 45 90 20
Y 2

4,5 5,5 7

13 15 14

Qu porcentaje de la varianza del peso es explicada mediante


un modelo de regresin lineal por la variacin del umbral de
reflejo?
Estdiese la posible relacin lineal entre ambas variables,
obteniendo su grado de ajuste.
Qu porcentaje de sobrepeso podemos esperar para un umbral
de reflejo de 10?

7.. Se lleva a cabo un estudio, por medio de detectores radioactivos, de la


capacidad corporal para absorber hierro y plomo. Participan en el estudio 10
sujetos. A cada uno se le da una dosis oral idntica de hierro y plomo. Despus
de 12 das se mide la cantidad de cada componente retenida en el sistema
corporal y, a partir de sta, se determina el porcentaje absorbido por el cuerpo.
Se obtuvieron los siguientes datos:
Porcentaje de hierro

17 22 35 43 80 85 91 92 96 100

Porcentaje de plomo

17 18 25 58 59 41 30 43 58

Comprobar la idoneidad del modelo lineal de regresin.


Obtener la recta de regresin, si el modelo lineal es adecuado.
Predecir el porcentaje de hierro absorbido por un individuo cuyo
sistema corporal absorbe el 15% del plomo ingerido.

8. Para estudiar el efecto de las aguas residuales de las alcantarillas que


afluyen a un lago, se toman medidas de la concentracin de nitrato en el agua.
Para monitorizar la variable se ha utilizado un antiguo mtodo manual. Se idea
un nuevo mtodo automtico. Si se pone de manifiesto una alta correlacin
positiva entre las medidas tomadas empleando los dos mtodos, entonces se
har uso habitual del mtodo automtico. Los datos obtenidos son los
siguientes:
Manual

25 40 120 75 150 300 270 400 450 575

Automtico

30 80 150 80 200 350 240 320 470 583

Hallar el coeficiente de determinacin para ambas variables.

Comprobar la idoneidad del modelo lineal de regresin. Si el


modelo es apropiado, hallar la recta de regresin de Y sobre X y

ESTADISTICA APLICADA

utilizarla para predecir la lectura que se obtendra empleando la


tcnica automtica con una muestra de agua cuya lectura manual
es de 100.

Para cada una de las observaciones, halle las predicciones que


ofrece el modelo lineal de regresin para X en funcin de Y, e Y
en funcin de X, es decir, e .

Calcule los errores para cada una de dichas predicciones, es decir, las
variables
e
.
Que relacin hay entre las medias de X y
Calcule las medias de
obtenido?

Calcule las varianzas de X,

, Y,

Qu relacin existe entre

Que relacin encuentra entre


y

? Y entre las de Y e

. Era de esperar el valor

Y entre
y

.
y

? Tambin es vlida para

9.-Se ha medido el aclaramiento de creatinina en pacientes tratados con un


medicamento tras la suspensin del tratamiento con dilisis, resultando la
siguiente tabla:
Das tras la dilisis

10 15 20 25 35

Creatinina (mg/dl)

5,7 5,2 4,8 4,5 4,2 4

3,8

.
Hllese la expresin de la ecuacin lineal que mejor exprese la variacin
de la creatinina, en funcin de los das transcurridos tras la dilisis, as
como el grado de bondad de ajuste y la varianza residual.
En qu porcentaje la variacin de la creatinina es explicada por el
tiempo transcurrido desde la dilisis?
Si un individuo presenta 4.1 mg/dl de creatinina, cunto tiempo es de
esperar que haya transcurrido desde la suspensin de la dilisis?

10.- . En un ensayo clnico realizado tras el posible efecto hipotensor de un


frmaco, se evala la tensin arterial diastlica (tad) en condiciones basales

ESTADISTICA APLICADA

(x), y tras 4 semanas de tratamiento (y), en un total de 14 pacientes


hipertensos. se obtienen los siguiente valores de tad:
x 95 100 102 104 100 95 95 98 102 96 100 96 110 99
y 85 94

84

88

85

80 80 92 90

76 90

87 102 89

Existe relacin lineal entre la tad basal y la que se observa tras


el tratamiento?

Cul es el valor de tad esperado tras el tratamiento, en un


paciente que present una tad basal de 95 mm de hg?

11. Se han realizado 9 tomas de presin intracraneal en animales de


laboratorio, indirecta, obtenindose los resultados siguientes en mm de Hg:
Mtodo estndar

9 12 28 72 30 38 76 26 52

Mtodo experimental

6 10 27 67 25 35 75 27 53

Hallar la ecuacin lineal que exprese la relacin existente entre


las presiones intracraneales, determinadas por los dos mtodos.

Qu tanto por ciento de la variabilidad de Y es explicada por la


regresin? Hllese el grado de dependencia entre las dos
variables y la varianza residual del mismo.

You might also like