Professional Documents
Culture Documents
23-5-2016
23-5-2016
NDICE CONCEPTUAL
1. SESIN 1.
INTRODUCCIN..p.4
i.
Conceptos clavep.4
ii.
Conceptos desconocidosp.4
- Ajustes de model..p.4
- Coeficientes de modelp.4
iii.
Pasos de solucin del problemap.5
- Establecer el problema a resolver
Establecer lo conocido y desconocido
- Definir preguntas
- Formular objetivos
- Realizar lista de requerimientos para resolver
iv.
Investigacin ....p.6
2. SESIN 2.
i.
SOLUCIN.p.9
- Caso 1p.9
ii.
iii.
iv.
Reflexiones.p.27
Conclusin..p. 28
Bibliografa..p.29
23-5-2016
23-5-2016
Sesin 1. INTRODUCCIN
Fecha de realizacin: 12 de Mayo de 2016
CONCEPTOS CLAVE:
Predictores
Ajustes de modelo
Regresin
CONCEPTOS DESCONOCIDOS:
Ajustes de modelo
Coeficientes de modelo
Establecer
problemticas
Conceptos
conocidos y
desconocidos
Establecer los
requerimientos
Formular
objjetivos de
aprendizaje
Definir
preguntas
23-5-2016
1.
2.
Caso
Salario
Sexo
Publicacin
Aos
Desconocido
Ajustes de modelo
Coeficientes de modelo
Supuestos de modelo
3.
Porcentajes de variabilidad
Supuestos de modelo
23-5-2016
INVESTIGACIN
Utilizamos regresin mltiple cuando estudiamos la posible relacin entre varias
variables independientes (predictoras o explicativas) y otra variable dependiente
(criterio, explicada, respuesta).
Por ejemplo, podemos estar interesados en estudiar la inteligencia humana (IQ como
variable respuesta), y es posible que consideremos que puede estar relacionado con otras
variables como el tamao del cerebro (explicativa). Es posible que el tamao de la
persona y su sexo tambin deban ser tenidos en cuenta. Podramos aadirlas al estudio
como variables independientes. Un modelo de regresin podra ofrecer una respuesta
como:
IQ = 80 + 0.02 Volumen cerebro + 0.15 Tamao -0.8 Sexo,
donde la variable sexo es una variable dicotmica o indicadora, codificada como 0 para
las mujeres y 1 para los hombres. Para interpretar un modelo as hay que ser muy
cautelosos. Las modelos de regresin nos informan de la presencia de relaciones, pero
no del mecanismo causal. Por ejemplo muchos conductores asocian que cuanta ms
polica local hay dirigiendo el trfico, mayores son los atascos y concluyen errneamente
que es la polica la causa de los atascos. Olvidan terceras variables que no han sido
tenidas en cuenta como las averas previas en los semforos o la ocurrencia de
accidentes.
Otra fuente de problemas de interpretacin es la relacin entre variables independientes
(colinealidad). Por ejemplo el sexo puede parecer influir en la inteligencia mirando
inocentemente la ecuacin, pero hay que considerar que las mujeres son habitualmente
ms pequeas que los hombres. Si observamos los signos, apreciamos que compensa el
efecto de una con la otra.
La tcnica de regresin mltiple se usa frecuentemente en investigacin. Se aplica al
caso en que la variable respuesta es de tipo numrico. Cuando la respuesta es de tipo
dicotmico (muere/vive, enferma/no enferma), usamos otra tcnica denominada
regresin logstica y que tratamos en un captulo posterior.
23-5-2016
23-5-2016
Observaciones anmalas: Est muy relacionada con la cuestin de los residuos, pero
merece destacarlo aparte. Debemos poner especial cuidado en identificarlas (y
descartarlas si procede), pues tienen gran influencia en el resultado. A veces, son
slo errores en la entrada de datos, pero de gran consecuencia en el anlisis. Hay
tcnicas de regresin robustas que permiten minimizar su efecto.
El modelo de regresin lineal mltiple es la extensin a k variables explicativas del modelo de
regresin simple.
La estructura del modelo de regresin mltiple es la siguiente:
Donde:
23-5-2016
SESIN 2. Solucin
Fecha de realizacin: 19 de mayo de 2016
1. Una compaa farmacutica desea modelar la relacin entre los salarios de
cientficos de investigacin con su sexo, aos de experiencia y un ndice de calidad
de publicacin. La empresa desea probar las interacciones entre todos los
predictores. Los datos obtenidos para 35 investigadores son:
Salario
88
77.3
75.3
96.4
87.7
58.1
63.1
58.5
95.4
92
94.5
103
94
64
77.3
83.7
74.8
92.5
79.7
64
94.3
100.2
87.7
71.3
97
83.4
90.8
78.5
97.3
Sexo
F
M
M
M
M
F
F
M
F
F
M
M
F
M
M
M
F
F
M
F
M
M
M
F
M
F
M
F
M
Publicacin
4.5
7.8
4.3
8.8
5.1
2.1
2.4
2.6
8.2
8.8
6.6
8.4
5.8
3.2
3.7
5.3
6.4
5.6
5.9
2.5
6.8
7.9
4.3
3.3
4.7
7.9
5.5
5.8
4.7
Aos
11
6
7
20
8
3
4
2
16
14
12
18
14
5
10
8
7
17
8
5
14
19
13
6
21
8
12
5
19
23-5-2016
61.6
F
4.3
3
65.3
F
5.5
2
89.7
F
6.6
10
83.8
M
5.8
7
104.5
M
8.5
18
78.6
M
5.6
7
A) Ajuste un modelo de regresin lineal mltiple que ayude a predecir el
salario en funcin de los predictores medidas.
Descripcin de los datos
Una compaa farmacutica desea modelar la relacin entre los salarios de
cientficos de investigacin con su sexo, aos de experiencia y un ndice de calidad
de publicacin. La compaa desea probar las interacciones entre todos los
predictores.
INTERPRETACIN.
Para los datos sobre salario, la variable de respuesta es Salario y los predictores
son Publicacin, Aos, Sexo, Publicacin * Aos, Publicacin * Sexo, Aos * Sexo
y Publicacin * Aos * Sexo. Minitab muestra una ecuacin de regresin separada
que contiene slo los predictores continuos para cada nivel de la variable categrica
sexo. La ecuacin de regresin para las mujeres se calcula de la siguiente manera:
Salario = 39.97 + 4.17 Publicacin + 3.688 Aos - 0.293 Publicacin*Aos
La ecuacin de regresin para hombres se calcula de la siguiente manera:
Salario = 43.62 + 4.51 Publicacin + 2.605 Aos - 0.1855 Publicacin*Aos
10
23-5-2016
INTERPRETACIN
Para los datos sobre salarios, se utilizan tres pasos para seleccionar los predictores:
En el primer paso, Aos tiene el valor p ms pequeo, menos de 0.05 (el valor
de alfa a entrar). Por lo tanto, Aos es el primer predictor que se agregar al modelo.
En el segundo paso, Publicacin tiene el valor p ms pequeo, menos de 0.05,
as que es el segundo predictor que se agregar al modelo.
11
23-5-2016
12
23-5-2016
13
23-5-2016
C) Realice las pruebas Individuales para cada uno de los coeficientes del
modelo.
INTERPRETACIN
Para los datos sobre salario, los resultados se pueden resumir de la siguiente
manera:
Sexo no es un coeficiente significativo (P = 0.671) ni tiene una interaccin
significativa con ningn otro predictor.
14
23-5-2016
correlacionados con los trminos de efecto principal porque incluyen los trminos
de los efectos principales. Para reducir los valores FIV, se puede ajustar el modelo
utilizando una de las opciones de estandarizacin de predictores que resta la media.
INTERPRETACIN
El modelo explica 92.95% de la variacin en los datos sobre Salario. El R ajustado
es 91.12%. El R (pred.) es 85.59%, lo que indica que el modelo explica 85.59% de
la variacin en Salario cuando se utiliza para prediccin. Si est comparando
diferentes modelos de salario, por lo general debe buscar modelos que minimicen
S y maximicen los valores R .
15
23-5-2016
INTERPRETACIN
El valor p para Regresin es 0.000, lo que indica que por lo menos uno de los
coeficientes de regresin es significativamente diferente de cero. El coeficiente para
la interaccin Publicacin * Aos es significativa (P = 0,037), al igual que los
coeficientes para Publicacin (P = 0,002) y Aos (0,000).
16
23-5-2016
INTERPRETACIN.
Para los datos sobre salario, el estadstico chi-cuadrado de Pearson es
32.958y el estadstico chi-cuadrado de verosimilitud es 45,031Por lo tanto, si
se selecciona un nivel de significancia (a) de 0.05, puede concluir que existe
una asociacin entre aos y publicacin.
17
23-5-2016
Normalidad
1) Anderson-Darling
La grfica de los datos de salario para muestra que los puntos no se ubican
razonablemente cerca de la lnea de referencia, lo que indica que los datos no
siguen una distribucin normal.
El valor de p de la pruebas de normalidad de Anderson-Darling (extremo inferior
derecho) de los datos del salario es 0.105. Este valor es mayor que el nivel a de
0.10 que ha elegido y, de esta manera, el dietista no rechazar H0. No hay suficiente
evidencia que sugiera que los datos no siguen una distribucin normal.
18
23-5-2016
2) Ryan-Joiner y Kolmogorov-Smirnov
19
23-5-2016
20
23-5-2016
Independencia
21
23-5-2016
INTERPRETACIN.
Para los datos sobre eleccin,
La V-cuadrada de Cramer (0.941667) sugiere una fuerte asociacin entre salario
y ao con nmero de publicaciones
El lambda de Goodman y Kruskal (Salario=0.030303) sugiere que, dada los
aos y publicaciones, la proporcin de clasificacin incorrecta para predecir el
salario reduce en 3%.
El Tau de Goodman y Kruskal (0.030405) sugiere que, dado los aos y
publicaciones, la proporcin de clasificacin incorrecta para predecir el salario se
reduce en 0.304%.
22
23-5-2016
Donde podemos apreciar que slo las variables que dependemos, son
publicacin y aos para predecir el salario.
Cmo se mencion anteriormente, sexo no nos ayuda a determinar el salario.
1) Sexo no es un coeficiente significativo (P = 0.671) ni tiene una interaccin
significativa con ningn otro predictor.
2) Publicacin es un coeficiente significativo (P = 0.002).
3) Aos es un coeficiente significativo (P = 0.000).
23
23-5-2016
PRIMERA SESIN
2 de mayo de 2016
3 de mayo de 2016
16 de mayo de 2016
17 de mayo de 2016
19 de mayo de 2016
24
23-5-2016
ACTIVIDAD
Anlisis de la problemtica
FECHA
9 de mayo de 2016
RESPONSABLE
Todo el equipo
Investigacin
12 de mayo de 2016
Todo el equipo
a)
Alejandra Bernal
b)
Alejandro Cuautli
c) Hctor Rodrguez
d)
scar Tllez
Lluvia de ideas
Solucin del problema
Redaccin y transcripcin del
reporte
14 de Mayo de 2016
19 de mayo de 2016
20 de mayo de 2016
Todo el equipo
Todo el equipo
a) Portada, ndice e
introduccin:Oscar
Tllez y Alejandro
Cuautli
b) Conclusiones,
reflexiones y calendario
de sesiones: Hector
Hilario, Alejandra Bernal
c) Diseo: Todo el
equipo.
25
23-5-2016
Reflexiones
Alejandra Bernal Gudio: me gusta la estadstica y, sobre todo, definitivamente
me gusta ponerla en prctica para poder solucionar los problemas que se nos
presentaron (tal como ste, y el caso anterior).
Me alegro tambin de que sea mi ltimo escenario, en s la materia no es difcil,
simplemente es pesada y se necesita dedicar tiempo, no s porque vale pocos
crditos.
Me dio gusto haber ido trabajando esto durante el semestre, para reforzar mis
conocimientos, y aprender cosas nuevas, a mi equipo, espero que algn da
aprendan a trabajar adecuadamente y tengan empata e inters, ya que obtendrn
mejores resultados.
Alejandro Cuautli Orihuela: Al utilizar estadstica y debido a lo aprendido durante
el semestre pudimos aprender cmo resolverlo aplicando tambin el uso del
programa el cual nos ayud de una forma increble, en el transcurso de esta clase
he logrado comprender muchas cosas en cuanto a la aplicacin de la misma.
Me alegro que se concluya este paso podamos seguir aplicando en un momento
futuro todo este conocimiento que hemos adquirido.
Hctor Hilario Rodrguez Rivera: en este escenario como en el anterior utilizamos
la estadstica para resolver la problemtica acompaada del programa Minitab. En
este caso aplicamos regresin, un tema que no alcanzamos a ver en nuestro curso
de estadstica y por ello se tuvo que realizar la investigacin correspondiente.
scar Tllez: En este ltimo escenario seguimos aplicando los conocimientos de
estadstica y el uso del programa de Minitab, se me hizo un poco complicado este
escenario ya que no saba utilizar minitab adems de que en el curso de estadstica
no alcanzamos a ver este tema.
Grupal: en este escenario continuamos aprendiendo acerca de las funciones de
Minitab y a analizar los datos arrojados por este programa. Tambin a comprender
las ecuaciones de regresin lineal as como sus componentes.
26
23-5-2016
Conclusin
En estadstica la regresin lineal o ajuste lineal es un modelo matemtico usado
para aproximar la relacin de dependencia entre una variable dependiente Y, las
variables independientes X y un trmino aleatorio. En este escenario ajustamos un
modelo de regresin lineal a la relacin entre los salarios de cientficos de
investigacin con su sexo, aos de experiencia y un ndice de calidad de
publicacin. En la elaboracin del modelo obtuvimos que el salario, adems de
depender de estos factores, tambin depende de la multiplicacin de estos dos.
Este modelo nos revela que las mujeres ganan inicialmente 39.97, ms 4.17 veces
el ndice de calidad de su publicacin, ms 3.688 veces sus aos de experiencia,
menos 0.293 veces la multiplicacin de los dos factores, y los hombres ganan
inicialmente 43.62, ms 4.51 veces el ndice de calidad de su publicacin, ms 2.605
veces sus aos de experiencia, menos 0.1855 veces la multiplicacin de los
factores. Por todo esto comparando el sueldo de un hombre y una mujer con los
mismos aos de experiencia y con el mismo ndice de calidad de sus publicaciones,
obtenemos que el hombre gana un poco ms que la mujer en esta compaa
farmacutica.
27
23-5-2016
REFERENCIAS
F.J. Barn Lpez. / F. Tllez Montiel. Apuntes de Bioestadstica. Cap. 6 pp. 35-37
http://www.bioestadistica.uma.es/baron/apuntes/ficheros/cap06.pdf Recuperado el 22 de mayo
de 2016
28