You are on page 1of 6

CONGREGACIN DE LOS HERMANOS DE LAS ESCUELAS CRISTIANAS DISTRITO LASALLISTA DE BOGOT

Pgina 1 de 6

LICEO HERMANO MIGUEL LA SALLE

Gua rea de matemticas Tercer periodo Grado dcimo


Nombre:___________________________________________Curso:___________Fecha:______________________
Propsito: Que el estudiante sea capaz de aplicar procesos complementarios a los usados en medicin de tendencias haciendo anlisis de regresin y comparar varias bases de datos entre s. Niveles de desempeo: Bsico, alto y superior. Temticas que se abordarn: Tipos de variables estadsticas conjuntas y medidas de de asociacin de dichas variables.

Clase 2 CONTEXTUALIZACIN

Para empezar, se dispone de una muestra de observaciones formadas por pares de variables: (x1, y1), (x2, y2), , (xn, yn)

A travs de esta muestra, se desea estudiar la relacin existente entre las dos variables X e Y. Es posible representar estas observaciones mediante un grfico de dispersin, como el siguiente Tambin se puede expresar el grado de asociacin mediante algunos indicadores, que se vern a continuacin. ESTRUCTURACIN DE CONTENIDOS MEDIDAS DE ASOCIACION DE VARIABLES Covarianza entre las variables X e Y. Es una medida de la variacin conjunta. Se define como

)(

CONGREGACIN DE LOS HERMANOS DE LAS ESCUELAS CRISTIANAS DISTRITO LASALLISTA DE BOGOT

Pgina 2 de 6

LICEO HERMANO MIGUEL LA SALLE

OJO!! Puede tomar valores positivos o negativos. Positivo, significa que ambas variables tienden a variar de la misma forma, hay una asociacin positiva. Negativo, significa que si una aumenta, la otra tiende a disminuir, y viceversa. Covarianza cercana a cero indica que no hay asociacin entre las variables. Ejemplo 1 DATOS DEL CLUB DE SALUD Datos correspondientes a 20 empleados del club de salud de una empresa. X pulsaciones por minuto en reposo Y tiempo en correr 1 milla ( reg)
obs 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 X 67 52 56 66 65 80 77 65 68 66 70 59 58 52 64 72 57 59 70 63 Y 481 292 357 396 345 469 425 393 346 401 267 368 295 391 487 481 374 367 469 252

Promedios:

64,3

382,8

Fuente: S, Chatterjee - A, Hadi: " Sentivity Analysis in Linear Regression" Calcularemos de la covarianza entre estas dos variables, Covarianza Valores centrados y productos: obs 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 X-64,3 Y-382,8 2,7 -12,3 -8,3 1,7 0,7 15,7 12,7 0,7 3,7 1,7 5,7 -5,3 -6,3 -12,3 -0,3 7,7 -7,3 -5,3 5,7 -1,3 98,2 -90,8 -25,8 13,2 -37,8 86,2 42,2 10,2 -36,8 18,2 -115,8 -14,8 -87,8 8,2 104,2 98,2 -8,8 -15,8 86,2 -130,8 prod 265,14 1116,84 214,14 22,44 -26,46 1353,34 535,94 7,14 -136,16 30,94 -660,06 78,44 553,14 -100,86 -31,26 756,14 64,24 83,74 491,34 170,04

CONGREGACIN DE LOS HERMANOS DE LAS ESCUELAS CRISTIANAS DISTRITO LASALLISTA DE BOGOT

Pgina 3 de 6

LICEO HERMANO MIGUEL LA SALLE

Promedio: 239,41 La covarianza entre las variables X e Y es igual a 239,41 Clase 4 La covarianza tiene el inconveniente de que su valor no es acotado, por lo que, a partir de l es difcil juzgar si es grande o pequea. Se define la correlacin, que es una medida de asociacin lineal independiente de las unidades de medida. Es igual a la covarianza dividida por las desviaciones estndar: ( ) ( ( ) ) ( ) ( ( )( ) ( ) )

El valor de la correlacin entre cualquier par de variables es un nmero entre -1 y 1, n valor alto de correlacin no indica que existe alguna relacin de causa-efecto entre las variables. Ejemplo (continuacin) Coeficiente de Correlacin Se deben calcular las desviaciones estndar. Para ello se deben elevar al cuadrado las observaciones centradas y promediar, obtenindose las varianzas, Las desviaciones estndar son las races cuadradas de stas. cuadrados de X-64,3 Y-382,8 7,3 9643,2 151,3 8244,6 68,9 665,6 2,9 174,2 0,5 1428,8 246,5 7430,4 161,3 1780,8 0,5 104,0 13,7 1354,2 2,9 331,2 32,5 13409,6 28,1 219,0 39,7 7708,8 151,3 67,2 0,1 10857,6 59,3 9643,2 53,3 77,4 28,1 249,6 32,5 7430,4 1,7 17108,6 54,11 4896,46

obs 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Promedios : El siguiente es un grfico de dispersin que muestra estos datos

CONGREGACIN DE LOS HERMANOS DE LAS ESCUELAS CRISTIANAS DISTRITO LASALLISTA DE BOGOT

Pgina 4 de 6

LICEO HERMANO MIGUEL LA SALLE

La interpretacin del coeficiente de correlacin puede ilustrarse mediante los siguientes grficos.

Clase 5 APLICACIN REGRESION LINEAL SIMPLE Ahora asumiremos que si hay una relacin de causalidad de la variable X (causa) hacia la variable Y (efecto), Adems, se sabe que esa relacin es de tipo lineal, dentro del rango de los datos. Estableceremos un modelo para explicar la causa (Y) en trminos del efecto (X), del tipo siguiente:

en que a y b son dos cantidades fijas (parmetros del modelo) y los ei son cantidades aleatorias que representan las diferencias entre lo que postula el modelo y lo que realmente se observa, que es y. Por esa razn a los e los llamaremos "errores" o "errores aleatorios". Se asume que tienen valor

CONGREGACIN DE LOS HERMANOS DE LAS ESCUELAS CRISTIANAS DISTRITO LASALLISTA DE BOGOT

Pgina 5 de 6

LICEO HERMANO MIGUEL LA SALLE

esperado 0 y desviacin estndar comn .

Ejemplo 2 Venta de automviles Se piensa que si aumentan el porcentaje de comisin pagada al vendedor de automviles, aumenta la venta. Estudio sobre 15 concesionarios similares. X Comisiones pagadas a vendedores de autos en un mes (%) Y Ganancias netas por ventas, en el mismo mes (Millones de $)

obs 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

X 3,6 5,2 5,3 7,3 5,0 5,2 3,0 3,1 3,2 7,5 8,3 6,1 4,9 5,8 7,1

Y 11,28 14,74 18,46 20,01 12,43 15,37 9,59 11,26 8,05 27,91 24,62 18,80 13,87 12,11 23,68

Representacin de los datos en un grfico de dispersin:

Clase 7 Para estimar a y b se utiliza el mtodo de Mnimos cuadrados, que consiste en encontrar aquellos valores de a y de b que hagan mnima la suma de los cuadrados de las desviaciones de las observaciones respecto de la recta que representa el modelo, en el sentido vertical. En realidad es un poco mas fcil, aqu va un algoritmo: La solucin est dada por las siguientes frmulas:

CONGREGACIN DE LOS HERMANOS DE LAS ESCUELAS CRISTIANAS DISTRITO LASALLISTA DE BOGOT

Pgina 6 de 6

LICEO HERMANO MIGUEL LA SALLE

( ) ( )

( )( ( )

Ejemplo 2 (continuacin) Calculamos los promedios de ambas variables y se las restamos a los valores. Promedio de la X : 5,4 Promedio de la Y : 16,1 Desviaciones respecto de las medias, sus cuadrados y productos (ojo con cmo se llena la tabla):

Entonces utilizando las frmulas de arriba, b = 3,18 a = -0,96 El modelo, para estos datos, es = 0,96 + 3,18 + para i=1,2,,, 15

Representa una recta, cuyo intercepto con el eje vertical es -0,96, y su pendiente es 3,18, o sea, si el porcentaje de comisin X aumenta en 1%, la ganancia neta Y aumenta en 3,18 Millones de pesos.

You might also like