You are on page 1of 28

REGRESION LINEAL MULTIPLE

23-5-2016

Instituto Politcnico Nacional


Unidad Profesional Interdisciplinaria de
Ingenieras campus Guanajuato.
Ing. Biotecnolgica
Aplicaciones Matemticas
Reporte del escenario: Regresin Lineal Mltiple
Presentado por:
Bernal Gudio Alejandra
Cuautli Orihuela Alejandro
Rodrguez Rivera Hctor Hilario
Tllez Girn Solis scar
3BM1
Profesor:
Julio Csar Lpez Jurez
Roxana Gngora
Av. Mineral de Valenciana No. 200 Col. Fracc. Industrial
Puerto Interior, C.P. 36275 Silao de la Victoria,
Guanajuato, Mxico., a 23 de Mayo de 2016

REGRESION LINEAL MULTIPLE

23-5-2016

NDICE CONCEPTUAL
1. SESIN 1.
INTRODUCCIN..p.4
i.
Conceptos clavep.4
ii.
Conceptos desconocidosp.4
- Ajustes de model..p.4
- Coeficientes de modelp.4
iii.
Pasos de solucin del problemap.5
- Establecer el problema a resolver
Establecer lo conocido y desconocido
- Definir preguntas
- Formular objetivos
- Realizar lista de requerimientos para resolver
iv.
Investigacin ....p.6

2. SESIN 2.
i.

SOLUCIN.p.9
- Caso 1p.9

ii.
iii.
iv.

Reflexiones.p.27
Conclusin..p. 28
Bibliografa..p.29

REGRESION LINEAL MULTIPLE

23-5-2016

NDICE DE TABLAS, FIGURAS Y ECUACIONES


i.
ii.
iii.
iv.

Fig 1. Pasos del proceso de solucin del escenario ...p.4


Tabla 1. Identificar lo conocido y desconocido..p.5
Tabla 2. Calendario de sesiones.p.25
Tabla 3. Distribucin de actividadesp.26

REGRESION LINEAL MULTIPLE

23-5-2016

Sesin 1. INTRODUCCIN
Fecha de realizacin: 12 de Mayo de 2016

CONCEPTOS CLAVE:

Predictores
Ajustes de modelo
Regresin

CONCEPTOS DESCONOCIDOS:

Ajustes de modelo
Coeficientes de modelo

Anlisis del problema

Establecer
problemticas

Conceptos
conocidos y
desconocidos

Establecer los
requerimientos

Formular
objjetivos de
aprendizaje

Definir
preguntas

Fig.1. Pasos del proceso de solucin.

REGRESION LINEAL MULTIPLE

23-5-2016

1.

Establecer el, o los problemas a resolver


Hacer un modelo (Grficas y modelo de regresin mltiple) entre las
relaciones ya descritas (salarios, sexo, aos de experiencia, ndice
de calidad de publicacin).
Probar las interacciones entre todos los predictores.

2.

Establecer lo conocido y desconocido.


Conocido

Caso

Salario
Sexo
Publicacin
Aos

Desconocido
Ajustes de modelo
Coeficientes de modelo
Supuestos de modelo

Tabla 1. Identificar lo Conocido y Desconocido

3.

Definir preguntas para resolver el problema.

Cul modelo deberamos de poner en accin?


Cul es la ecuacin de regresin ms adecuada?
Cmo seleccionar los predictores?
4. Formular los objetivos de aprendizaje
Aprender a trabajar con el programa de Minitab
Dar a conocer la correcta interpretacin de resultados
Aprender a saber hacer las regresiones lineales mltiples
5. Hacer una lista de lo que necesitas saber

Ecuacin de regresin para hombres y mujeres

Porcentajes de variabilidad

Supuestos de modelo

REGRESION LINEAL MULTIPLE

23-5-2016

INVESTIGACIN
Utilizamos regresin mltiple cuando estudiamos la posible relacin entre varias
variables independientes (predictoras o explicativas) y otra variable dependiente
(criterio, explicada, respuesta).
Por ejemplo, podemos estar interesados en estudiar la inteligencia humana (IQ como
variable respuesta), y es posible que consideremos que puede estar relacionado con otras
variables como el tamao del cerebro (explicativa). Es posible que el tamao de la
persona y su sexo tambin deban ser tenidos en cuenta. Podramos aadirlas al estudio
como variables independientes. Un modelo de regresin podra ofrecer una respuesta
como:
IQ = 80 + 0.02 Volumen cerebro + 0.15 Tamao -0.8 Sexo,
donde la variable sexo es una variable dicotmica o indicadora, codificada como 0 para
las mujeres y 1 para los hombres. Para interpretar un modelo as hay que ser muy
cautelosos. Las modelos de regresin nos informan de la presencia de relaciones, pero
no del mecanismo causal. Por ejemplo muchos conductores asocian que cuanta ms
polica local hay dirigiendo el trfico, mayores son los atascos y concluyen errneamente
que es la polica la causa de los atascos. Olvidan terceras variables que no han sido
tenidas en cuenta como las averas previas en los semforos o la ocurrencia de
accidentes.
Otra fuente de problemas de interpretacin es la relacin entre variables independientes
(colinealidad). Por ejemplo el sexo puede parecer influir en la inteligencia mirando
inocentemente la ecuacin, pero hay que considerar que las mujeres son habitualmente
ms pequeas que los hombres. Si observamos los signos, apreciamos que compensa el
efecto de una con la otra.
La tcnica de regresin mltiple se usa frecuentemente en investigacin. Se aplica al
caso en que la variable respuesta es de tipo numrico. Cuando la respuesta es de tipo
dicotmico (muere/vive, enferma/no enferma), usamos otra tcnica denominada
regresin logstica y que tratamos en un captulo posterior.

6.1 Aplicaciones de la regresin lineal mltiple


Es cierto que la regresin mltiple se utiliza para la prediccin de respuestas a partir de
variables explicativas. Pero no es sta realmente la aplicacin que se le suele dar en
investigacin. Los usos que con mayor frecuencia encontraremos en las publicaciones
son los siguientes:
Identificacin de variables explicativas. Nos ayuda a crear un modelo donde

REGRESION LINEAL MULTIPLE

23-5-2016

se seleccionen las variables que puedan influir en la respuesta, descartando


aquellas que no aporten informacin.
Deteccin de interacciones entre variables independientes que afectan a la
variable respuesta. Un ejemplo de interaccin clsico es el de estudiar la
respuesta de un paciente al alcohol y a un barbitrico, y observar que cuando
se ingieren ambos, el efecto es mucho mayor del esperado como suma de los
dos.
Identificacin de variables confusoras. Es un problema difcil el de su deteccin,
pero de inters en investigacin no experimental, ya que el investigador
frecuentemente no tiene control sobre las variables independientes.

6.2 Requisitos y limitaciones


Hay ciertos requerimientos necesarios para poder utilizar la tcnica de regresin mltiple:

Linealidad: Se supone que la variable respuesta depende linealmente de las


variables explicativas. Si la respuesta no aparenta ser lineal, debemos introducir en
el modelo componentes no lineales (como incluir transformaciones no lineales de
las variables independientes en el modelo). Otro tipo de respuesta no lineal es la
interaccin. Para ello se ha de incluir en el modelo trminos de interaccin, que
equivalen a introducir nuevas variables explicativas que en realidad son el producto
de dos o ms de las independientes.
Normalidad y equidistribucin de los residuos: Se llaman residuos las diferencias
entre los valores calculados por el modelo y los realmente observados en la variable
dependiente. Para tener un buen modelo de regresin no es suficiente con que los
residuos sean pequeos. La validez del modelo requiere que los mismos se
distribuyan de modo normal y con la misma dispersin para (sintese antes de leer
el resto de la frase) cada combinacin de valores de las variables independientes!
Por supuesto, esta condicin en la prctica es inverificable, puesto que para cada
combinacin de variables independientes tendremos normalmente ninguna o una
respuesta. Lo que se suele hacer es examinar una serie de grficos de residuos que nos
hagan sospechar. Por ejemplo si los residuos aumentan al aumentar la respuesta, o vemos
que aparecen tendencias, Es decir, hay una serie de reglas heursticas que nos ayudan a
decidir si aceptar o no el modelo de regresin, pero no estn basadas en contrastes de
hiptesis como hemos usado hasta ahora. Es la experiencia del investigador observando
residuos la que le decide a usarlo o no.

Nmero de variables independientes: Podemos estar tentados en incluir en el


modelo cualquier cosa que tengamos en una base de datos, con la esperanza de que
cuantas ms variables incluyamos, ms posibilidades hay de que suene la flauta.
Si nos aborda esta tentacin, hemos de recordar que corremos el riesgo de cometer
error de tipo I. Otra razn es que si esperamos ajustar unas pocas observaciones
usando muchas variables, muy probablemente consigamos una aproximacin muy
artificial, y adems muy sensible a los valores observados. La inclusin de una nueva

REGRESION LINEAL MULTIPLE

23-5-2016

observacin puede cambiar completamente el valor de los coeficientes del modelo.


Esto se traducir al realizar el contraste como justo todo lo contrario de lo que
desebamos: Todas las variables independientes del modelo sern consideradas no
significativas!
Una regla que se suele recomendar es la de incluir al menos 20 observaciones por cada
variable independiente que estimemos a priori interesantes en el modelo. Nmeros
inferiores nos llevarn posiblemente a no poder obtener conclusiones y errores de tipo II.

Colinealidad: Si dos variables independientes estn estrechamente relacionadas


(consumo de refrescos y temperatura ambiente por ejemplo) y ambas son incluidas
en un modelo, muy posiblemente ninguna de las dos sea considerada significativa,
aunque si hubisemos incluido slo una de ellas, s. Hay diferentes tcnicas para
detectar la colinealidad pero que requieren profundizar en documentos ms
sofisticados. Aqu vamos a indicar una tcnica muy simple: examinar los coeficientes del
modelo para ver si se vuelven inestables al introducir una nueva variable. Si es as
posiblemente hay colinealidad entre la nueva variable y las anteriores.

Observaciones anmalas: Est muy relacionada con la cuestin de los residuos, pero
merece destacarlo aparte. Debemos poner especial cuidado en identificarlas (y
descartarlas si procede), pues tienen gran influencia en el resultado. A veces, son
slo errores en la entrada de datos, pero de gran consecuencia en el anlisis. Hay
tcnicas de regresin robustas que permiten minimizar su efecto.
El modelo de regresin lineal mltiple es la extensin a k variables explicativas del modelo de
regresin simple.
La estructura del modelo de regresin mltiple es la siguiente:

Donde:

Y es la variable explicada, dependiente o respuesta


X1,,xk son las variables explicativas o variables independientes
Y= f (x1.xk) es la parte determinista del modelo
E representa el error aleatorio

EL modelo de regresin lineal mltiple tiene la forma:

REGRESION LINEAL MULTIPLE

23-5-2016

SESIN 2. Solucin
Fecha de realizacin: 19 de mayo de 2016
1. Una compaa farmacutica desea modelar la relacin entre los salarios de
cientficos de investigacin con su sexo, aos de experiencia y un ndice de calidad
de publicacin. La empresa desea probar las interacciones entre todos los
predictores. Los datos obtenidos para 35 investigadores son:
Salario
88
77.3
75.3
96.4
87.7
58.1
63.1
58.5
95.4
92
94.5
103
94
64
77.3
83.7
74.8
92.5
79.7
64
94.3
100.2
87.7
71.3
97
83.4
90.8
78.5
97.3

Sexo
F
M
M
M
M
F
F
M
F
F
M
M
F
M
M
M
F
F
M
F
M
M
M
F
M
F
M
F
M

Publicacin
4.5
7.8
4.3
8.8
5.1
2.1
2.4
2.6
8.2
8.8
6.6
8.4
5.8
3.2
3.7
5.3
6.4
5.6
5.9
2.5
6.8
7.9
4.3
3.3
4.7
7.9
5.5
5.8
4.7

Aos
11
6
7
20
8
3
4
2
16
14
12
18
14
5
10
8
7
17
8
5
14
19
13
6
21
8
12
5
19

REGRESION LINEAL MULTIPLE

23-5-2016

61.6
F
4.3
3
65.3
F
5.5
2
89.7
F
6.6
10
83.8
M
5.8
7
104.5
M
8.5
18
78.6
M
5.6
7
A) Ajuste un modelo de regresin lineal mltiple que ayude a predecir el
salario en funcin de los predictores medidas.
Descripcin de los datos
Una compaa farmacutica desea modelar la relacin entre los salarios de
cientficos de investigacin con su sexo, aos de experiencia y un ndice de calidad
de publicacin. La compaa desea probar las interacciones entre todos los
predictores.

INTERPRETACIN.
Para los datos sobre salario, la variable de respuesta es Salario y los predictores
son Publicacin, Aos, Sexo, Publicacin * Aos, Publicacin * Sexo, Aos * Sexo
y Publicacin * Aos * Sexo. Minitab muestra una ecuacin de regresin separada
que contiene slo los predictores continuos para cada nivel de la variable categrica
sexo. La ecuacin de regresin para las mujeres se calcula de la siguiente manera:
Salario = 39.97 + 4.17 Publicacin + 3.688 Aos - 0.293 Publicacin*Aos
La ecuacin de regresin para hombres se calcula de la siguiente manera:
Salario = 43.62 + 4.51 Publicacin + 2.605 Aos - 0.1855 Publicacin*Aos

10

REGRESION LINEAL MULTIPLE

23-5-2016

Se puede interpretar cada valor de la pendiente como el cambio en el salario cuando


el predictor aumenta en 1. Por ejemplo, para las mujeres, cuando aumenta la calidad
de la publicacin en una unidad, el salario aumenta en 4.17. Sin embargo, en este
caso, tambin se tiene que incluir el efecto de la interaccin. La interaccin indica
que el efecto que tiene cualquiera de estos dos predictores sobre el salario depende
del valor del otro predictor.
Se puede interpretar cada valor de interseccin como el valor pronosticado de
salario cuando cada predictor sea cero. Por ejemplo, para los hombres, cuando
cada predictor es cero, el salario es 43.62 (o $43,620.00).
B) Pruebe la falta de ajuste de la regresin. Utilice = . %.

INTERPRETACIN
Para los datos sobre salarios, se utilizan tres pasos para seleccionar los predictores:
En el primer paso, Aos tiene el valor p ms pequeo, menos de 0.05 (el valor
de alfa a entrar). Por lo tanto, Aos es el primer predictor que se agregar al modelo.
En el segundo paso, Publicacin tiene el valor p ms pequeo, menos de 0.05,
as que es el segundo predictor que se agregar al modelo.

11

REGRESION LINEAL MULTIPLE

23-5-2016

En el tercer paso, la interaccin de dos factores Publicacin*Aos entra al


modelo. En este modelo, el coeficiente de Publicacin*Aos es -0.1930, y el valor p
es 0.005.
Despus del tercer paso, ninguno de los predictores que estn fuera del modelo
tiene un valor p menor que 0.05 y ninguno de los predictores incluidos en el modelo
tiene un valor p mayor que 0.05. Por lo tanto, ningn predictor se puede agregar al
modelo o retirar de ste. El modelo final incluye tres trminos: Publicacin, Aos y
Publicacin*Aos.
S disminuye del paso 1 al paso 3, R-cuad. y R-cuad. (ajust) y R-cuad. (pred)
aumenta del paso 1 al paso 3, mientras que el Cp de Mallows se vuelve
prcticamente igual al nmero de predictores ms la constante en el modelo. Si se
toman en conjunto, estos estadsticos indican que el modelo del paso 3, que
contiene los predictores Publicacin, Aos y Publicacin*Aos, provee un mejor
ajuste para los datos.

Para los datos sobre salario, el


histograma no sigue una curva
normal

Para los datos sobre salario,


los residuos parecen seguir
una lnea recta. No existe
evidencia de no normalidad,
asimetra, valores atpicos o
variables no identificadas.

12

REGRESION LINEAL MULTIPLE

23-5-2016

Para los datos sobre salario,


los residuos parecen estar
dispersos aleatoriamente
alrededor de cero. No existe
evidencia de varianza no
constante, trminos faltantes
o valores atpicos o puntos
influyentes.

Para los datos sobre salario,


los residuos parecen estar
dispersos aleatoriamente
alrededor de cero. No existe
evidencia de que los trminos
de error estn correlacionados
entre s.

Para los datos sobre salario,


se represent grficamente el
predictor Aos versus los
residuos. La grfica muestra
cierta curvatura

13

REGRESION LINEAL MULTIPLE

23-5-2016

C) Realice las pruebas Individuales para cada uno de los coeficientes del
modelo.

INTERPRETACIN
Para los datos sobre salario, los resultados se pueden resumir de la siguiente
manera:
Sexo no es un coeficiente significativo (P = 0.671) ni tiene una interaccin
significativa con ningn otro predictor.

Publicacin es un coeficiente significativo (P = 0.002).

Aos es un coeficiente significativo (P = 0.000).

La interaccin entre Publicacin y Aos es significativa (P = 0.037). La


interaccin indica que el efecto que tiene cualquiera de estos dos predictores sobre
el salario depende del valor del otro predictor.
Los valores FIV no estn cerca de 1, lo que indica que los predictores estn
correlacionados y no se estimaron correctamente. En este caso, los valores FIV son
altos debido a los trminos de interaccin. Los trminos de interaccin estn

14

REGRESION LINEAL MULTIPLE

23-5-2016

correlacionados con los trminos de efecto principal porque incluyen los trminos
de los efectos principales. Para reducir los valores FIV, se puede ajustar el modelo
utilizando una de las opciones de estandarizacin de predictores que resta la media.

D) Qu porcentaje de la variabilidad del salario es explicada por el modelo


propuesto?

INTERPRETACIN
El modelo explica 92.95% de la variacin en los datos sobre Salario. El R ajustado
es 91.12%. El R (pred.) es 85.59%, lo que indica que el modelo explica 85.59% de
la variacin en Salario cuando se utiliza para prediccin. Si est comparando
diferentes modelos de salario, por lo general debe buscar modelos que minimicen
S y maximicen los valores R .

E) Interprete cada uno de los coeficientes del modelo propuesto.


Para los datos sobre salario, los resultados se pueden resumir de la siguiente
manera:
Sexo no es un coeficiente significativo (P = 0.671) ni tiene una interaccin
significativa con ningn otro predictor.
Publicacin es un coeficiente significativo (P = 0.002).
Aos es un coeficiente significativo (P = 0.000).
La interaccin entre Publicacin y Aos es significativa (P = 0.037). La
interaccin indica que el efecto que tiene cualquiera de estos dos predictores
sobre el salario depende del valor del otro predictor.
Los valores FIV no estn cerca de 1, lo que indica que los predictores
estn correlacionados y no se estimaron correctamente. En este caso, los
valores FIV son altos debido a los trminos de interaccin. Los trminos de
interaccin estn correlacionados con los trminos de efecto principal porque
incluyen los trminos de los efectos principales. Para reducir los valores FIV,

15

REGRESION LINEAL MULTIPLE

23-5-2016

se puede ajustar el modelo utilizando una de las opciones de estandarizacin


de predictores que resta la media.
F) Las interacciones entre los predictores son significativas?

INTERPRETACIN
El valor p para Regresin es 0.000, lo que indica que por lo menos uno de los
coeficientes de regresin es significativamente diferente de cero. El coeficiente para
la interaccin Publicacin * Aos es significativa (P = 0,037), al igual que los
coeficientes para Publicacin (P = 0,002) y Aos (0,000).

16

REGRESION LINEAL MULTIPLE

23-5-2016

Cuando la lnea no es horizontal (paralela al eje X), entonces est presente un


efecto principal. Los diferentes niveles de la variable categrica afectan la respuesta
de manera diferente. Mientras mayor sea la diferencia en la posicin vertical de los
puntos graficados (menos paralela al eje X est la lnea), mayor ser la magnitud
del efecto principal. Por lo que aos representa una variable ms significativa que
publicacin y aos no influye sobre el salario.

G) Compruebe los tres supuestos del modelo (Homocedasticidad,


Normalidad e independencia).
Homocedasticidad

INTERPRETACIN.
Para los datos sobre salario, el estadstico chi-cuadrado de Pearson es
32.958y el estadstico chi-cuadrado de verosimilitud es 45,031Por lo tanto, si
se selecciona un nivel de significancia (a) de 0.05, puede concluir que existe
una asociacin entre aos y publicacin.

17

REGRESION LINEAL MULTIPLE

23-5-2016

Normalidad
1) Anderson-Darling

La grfica de los datos de salario para muestra que los puntos no se ubican
razonablemente cerca de la lnea de referencia, lo que indica que los datos no
siguen una distribucin normal.
El valor de p de la pruebas de normalidad de Anderson-Darling (extremo inferior
derecho) de los datos del salario es 0.105. Este valor es mayor que el nivel a de
0.10 que ha elegido y, de esta manera, el dietista no rechazar H0. No hay suficiente
evidencia que sugiera que los datos no siguen una distribucin normal.

18

REGRESION LINEAL MULTIPLE

23-5-2016

2) Ryan-Joiner y Kolmogorov-Smirnov

19

REGRESION LINEAL MULTIPLE

23-5-2016

Las pruebas de Ryan-Joiner y Kolmogorov-Smirnov (no se muestran) generan


resultados similares. La pruebas de Ryan-Joiner genera un valor p aproximado >
0.10, y la prueba de Kolmogorov-Smirnov genera un valor p aproximado > 0.15.

20

REGRESION LINEAL MULTIPLE

23-5-2016

Independencia

Podemos saber la independencia, comparando con el grfico de residuos

Para obtener una conclusin a partir de la prueba, se deber comparar el estadstico


que se muestra con los lmites inferior y superior en una tabla. Si D > el lmite
superior, no existe correlacin; si D < lmite inferior, existe una correlacin positiva;
si D se encuentra entre ambos lmites, la prueba no es concluyente.
Debido a que el valor es inferior, existe una correlacin positiva.
La grfica, cmo se haba mencionado anteriormente, no representa una
distribucin normal, pueden violar el supuesto de que las variables predictoras no
estn relacionadas con los residuos.

21

REGRESION LINEAL MULTIPLE

23-5-2016

INTERPRETACIN.
Para los datos sobre eleccin,
La V-cuadrada de Cramer (0.941667) sugiere una fuerte asociacin entre salario
y ao con nmero de publicaciones
El lambda de Goodman y Kruskal (Salario=0.030303) sugiere que, dada los
aos y publicaciones, la proporcin de clasificacin incorrecta para predecir el
salario reduce en 3%.
El Tau de Goodman y Kruskal (0.030405) sugiere que, dado los aos y
publicaciones, la proporcin de clasificacin incorrecta para predecir el salario se
reduce en 0.304%.

H) Con todo lo obtenido, qu conclusiones de inters podra


proporcionarle a la compaa?
Debido a que el sexo no influye de manera significativa, quiere decir, que no
por el sexo se recibir ms o menos dinero, por eso se establecen dos
modelos de regresin
La ecuacin de regresin para las mujeres se calcula de la siguiente manera:

22

REGRESION LINEAL MULTIPLE

23-5-2016

Salario = 39.97 + 4.17 Publicacin + 3.688 Aos - 0.293 Publicacin*Aos


La ecuacin de regresin para hombres se calcula de la siguiente manera:
Salario = 43.62 + 4.51 Publicacin + 2.605 Aos - 0.1855 Publicacin*Aos

Analizando las grficas, denotamos que el salario no sigue una distribucin


normal.

Donde podemos apreciar que slo las variables que dependemos, son
publicacin y aos para predecir el salario.
Cmo se mencion anteriormente, sexo no nos ayuda a determinar el salario.
1) Sexo no es un coeficiente significativo (P = 0.671) ni tiene una interaccin
significativa con ningn otro predictor.
2) Publicacin es un coeficiente significativo (P = 0.002).
3) Aos es un coeficiente significativo (P = 0.000).

Para los datos sobre salario, el estadstico chi-cuadrado de Pearson es


32.958y el estadstico chi-cuadrado de verosimilitud es 45,031Por lo tanto, si
se selecciona un nivel de significancia (a) de 0.05, puede concluir que existe
una
asociacin
entre
aos
y
publicacin.

Con el estadstico de prueba de Durbin-Watson, demuestra que las variables


predictoras no estn relacionadas con los residuos.

23

REGRESION LINEAL MULTIPLE

23-5-2016

PRIMERA SESIN
2 de mayo de 2016

3 de mayo de 2016

16 de mayo de 2016

17 de mayo de 2016

19 de mayo de 2016

Presentacin del caso, primera lectura.


Comprensin del problema.
Investigacin de conceptos clave.

. Lluvia de ideas acerca de lo que


podemos hacer con la informacin que
se tiene, aclaramiento de dudas y
nuevos temas de investigacin
SEGUNDA SESIN
Investigacin a profundidad sobre el
tema y los posibles modelos
matemticos que puedan ser de ayuda.
Obtencin de ecuaciones de los
conceptos antes investigados
Investigacin de los nuevos temas
planteados acerca del modelo
matemtico y comienzo de uso del
programa computarizado para la
solucion.
Modelamos el primer problema de
forma matemtica y logramos entender
el porqu.
Conclusin y elaboracin del reporte.

Tabla 2. Calendario de sesiones

24

REGRESION LINEAL MULTIPLE

23-5-2016

ACTIVIDAD
Anlisis de la problemtica

FECHA
9 de mayo de 2016

RESPONSABLE
Todo el equipo

Investigacin

12 de mayo de 2016

Todo el equipo
a)
Alejandra Bernal
b)
Alejandro Cuautli
c) Hctor Rodrguez
d)
scar Tllez

Lluvia de ideas
Solucin del problema
Redaccin y transcripcin del
reporte

14 de Mayo de 2016
19 de mayo de 2016
20 de mayo de 2016

Todo el equipo
Todo el equipo
a) Portada, ndice e
introduccin:Oscar
Tllez y Alejandro
Cuautli
b) Conclusiones,
reflexiones y calendario
de sesiones: Hector
Hilario, Alejandra Bernal
c) Diseo: Todo el
equipo.

Tabla 3. Distribucin de actividades

25

REGRESION LINEAL MULTIPLE

23-5-2016

Reflexiones
Alejandra Bernal Gudio: me gusta la estadstica y, sobre todo, definitivamente
me gusta ponerla en prctica para poder solucionar los problemas que se nos
presentaron (tal como ste, y el caso anterior).
Me alegro tambin de que sea mi ltimo escenario, en s la materia no es difcil,
simplemente es pesada y se necesita dedicar tiempo, no s porque vale pocos
crditos.
Me dio gusto haber ido trabajando esto durante el semestre, para reforzar mis
conocimientos, y aprender cosas nuevas, a mi equipo, espero que algn da
aprendan a trabajar adecuadamente y tengan empata e inters, ya que obtendrn
mejores resultados.
Alejandro Cuautli Orihuela: Al utilizar estadstica y debido a lo aprendido durante
el semestre pudimos aprender cmo resolverlo aplicando tambin el uso del
programa el cual nos ayud de una forma increble, en el transcurso de esta clase
he logrado comprender muchas cosas en cuanto a la aplicacin de la misma.
Me alegro que se concluya este paso podamos seguir aplicando en un momento
futuro todo este conocimiento que hemos adquirido.
Hctor Hilario Rodrguez Rivera: en este escenario como en el anterior utilizamos
la estadstica para resolver la problemtica acompaada del programa Minitab. En
este caso aplicamos regresin, un tema que no alcanzamos a ver en nuestro curso
de estadstica y por ello se tuvo que realizar la investigacin correspondiente.
scar Tllez: En este ltimo escenario seguimos aplicando los conocimientos de
estadstica y el uso del programa de Minitab, se me hizo un poco complicado este
escenario ya que no saba utilizar minitab adems de que en el curso de estadstica
no alcanzamos a ver este tema.
Grupal: en este escenario continuamos aprendiendo acerca de las funciones de
Minitab y a analizar los datos arrojados por este programa. Tambin a comprender
las ecuaciones de regresin lineal as como sus componentes.

26

REGRESION LINEAL MULTIPLE

23-5-2016

Conclusin
En estadstica la regresin lineal o ajuste lineal es un modelo matemtico usado
para aproximar la relacin de dependencia entre una variable dependiente Y, las
variables independientes X y un trmino aleatorio. En este escenario ajustamos un
modelo de regresin lineal a la relacin entre los salarios de cientficos de
investigacin con su sexo, aos de experiencia y un ndice de calidad de
publicacin. En la elaboracin del modelo obtuvimos que el salario, adems de
depender de estos factores, tambin depende de la multiplicacin de estos dos.
Este modelo nos revela que las mujeres ganan inicialmente 39.97, ms 4.17 veces
el ndice de calidad de su publicacin, ms 3.688 veces sus aos de experiencia,
menos 0.293 veces la multiplicacin de los dos factores, y los hombres ganan
inicialmente 43.62, ms 4.51 veces el ndice de calidad de su publicacin, ms 2.605
veces sus aos de experiencia, menos 0.1855 veces la multiplicacin de los
factores. Por todo esto comparando el sueldo de un hombre y una mujer con los
mismos aos de experiencia y con el mismo ndice de calidad de sus publicaciones,
obtenemos que el hombre gana un poco ms que la mujer en esta compaa
farmacutica.

27

REGRESION LINEAL MULTIPLE

23-5-2016

REFERENCIAS

F.J. Barn Lpez. / F. Tllez Montiel. Apuntes de Bioestadstica. Cap. 6 pp. 35-37
http://www.bioestadistica.uma.es/baron/apuntes/ficheros/cap06.pdf Recuperado el 22 de mayo
de 2016

Kizis Renata, A, ngel Regresin lineal mltiple, universidad de Catalua


http://www.uoc.edu/in3/emath/docs/T01_Reg_Lineal_Multiple.pdf Recuperado el 22 de mayo de
2016

Palomo Snchez Jos, Regresin lineal mltiple, E.U.A.T


http://ocw.upm.es/estadistica-e-investigacion-operativa/introduccion-a-la-estadistica-basica-eldiseno-de-experimentos-y-la-regresion-lineal/contenidos/Material-de-clase/Regresion-linealmultiple.pdf Recuperado el 22 de mayo de 2016

28

You might also like