You are on page 1of 17

1

Trabajo Colaborativo: Momento 3

Estudiantes:
Ximena Camacho
Leidy Delgado
Ricardo Jose Rodriguez
Eduar Dizzieth Caldern
Eduyer Rojas

Tutor
Alejandro Mndez Gonzales
Ingeniero Forestal

Universidad Nacional Abierta y a Distancia


Estadstica Descriptiva
Grupo 204040_106
Florencia
2015

Introduccin

Se ha realizado con anterioridad una encuesta en distintas instituciones educativas, los cuales han
dado como resultado una gran cantidad de datos o valores de tipo cualitativo y cuantitativo. La
investigacin estadstica es una actividad que apela a diversas tcnicas con el propsito de llegar
a la esencia de la realidad. La regresin lineal simple y la regresin lineal mltiple son tcnicas
de anlisis de las variables de una investigacin estadstica, en este caso desde la encuesta
realizada. Si bien es cierto estas tcnicas mencionadas se pueden utilizar para solucionar
problemas comunes en los negocios o para evaluar el comportamiento de su economa y en
general se utiliza con mayor frecuencia en las ciencias econmicas, tambin es cierto que en
muchos casos se requiere conocer ms que el comportamiento de una sola variable para entender
una investigacin cualquiera sea su especia. Entonces, sin importar la situacin presentada se
hace necesario que practiquemos estas tcnicas de regresin por medio de ejercicios salientes de
la cotidianidad, a continuacin veremos pues los resultados de dicha prctica.

Justificacin

Partiendo de una base de datos de distintas instituciones educativas y unos datos primarios
(encuestas) nos proponemos encontrar datos secundarios (estadsticos) con la intencin de
conocer las relaciones de las variables de estos datos. Para ello, en primer lugar aplicaremos el
proceso de regresin lineal simple para determinar tanto la naturaleza como la fuerza de una
relacin entre dos variables y segundo lugar la regresin lineal mltiple con la cual describiremos
la relacin entre dos o ms variables independientes y una variable dependiente utilizando la
ecuacin de regresin mltiple; estas ecuaciones de estimaciones nos permitir realizar una
interpretacin de correlacin de la investigacin realizada en estas instituciones educativas. El
trabajo de laboratorio constituye una de las mejores metodologas para la aplicacin de modelos
estadsticos a las variables de los hechos, es por eso que se trabaja en este sentido y no otro para
la prctica de la unidad 3 de regresin y determinacin.

Objetivos

Objetivos generales

Potencializar en el estudiante habilidades y destrezas para caracterizar un situacin mediante el


anlisis de las medidas estadsticas bivariantes.
Calcular e interpretar adecuadamente las medidas estadsticas bivariantes, asociadas a una
situacin especfica.
Determinar la relacin entre dos o ms variables inscritas en una situacin especfica a partir del
anlisis de regresin lineal simple y mltiple.

Objetivos especficos

Interpretar correctamente los datos de cada tabla propuestos en cada uno de los ejercicios.
Realizar diagramas de dispersin en los ejercicios de laboratorio y actividades colaborativas que
permitan determinar el tipo de asociacin entre las variables escogidas en cada ejercicio.
En los ejercicios propuestos de laboratorio y de regresin y correlacin lineal simple crear
modelos matemticos que permita predecir el efecto de una variable sobre la otra para determinar
su fiabilidad.
Determinar porcentajes que permitan una explicacin de modelo y grado de relacin de dos
variables de los ejercicios de laboratorio y de regresin y correlacin lineal simple.
En la prctica de regresin y correlacin lineal mltiple identificar una variable cuantitativa
dependiente y varias variables independientes del estudio de investigacin, diagramarlas y
calcular la recta de regresin y el coeficiente de correlacin para probar estadsticamente su
relacin.
Relacionar o analizar la informacin obtenida en cada problema planteado en los ejercicios de
laboratorio y colaborativo.

Laboratorio de regresin y correlacin lineal

1. El rendimiento del producto de un proceso qumico est relacionado con la temperatura de


operacin del proceso. Se desea establecer la relacin que existe entre la pureza (y) del
oxgeno producido y el porcentaje de hidrocarburo (x) que est presente en el
condensador principal en un proceso de destilacin, de acuerdo con los siguientes datos:

X
(% de Hidro
carburos)

Y
(Pureza)

0,99
1,02
1,15
1,29
1,46
1,36
0,87
1,23
1,55
1,4
1,19
1,15
0,98
1,01
1,11
1,2
1,26
1,32
1,43
0,95

90,01
89,05
91,43
93,74
96,73
94,45
87,59
91,77
99,42
93,65
93,54
92,52
90,56
89,54
89,85
90,39
93,25
93,41
94,98
87,33

a. Realice el diagrama de dispersin y determine el tipo de asociacin entre las variables.

diagrama de dispersion
105
y = 14,947x + 74,283

100

R = 0,8774

95
90
85
0

0,5

1,5

Anlisis:
La lnea de tendencia central, se encuentra muy ligada a los diferentes puntos de dispersin.

b. Encuentre el modelo matemtico que permite predecir el efecto de una variable sobre la
otra. Es confiable?
El modelo matemtico; el cual nos permite predecir una variable sobre la otra es la ecuacin de la
tendencia de la lnea, la cual corresponde a: y = 14,947x + 74,283. Segn su coeficiente de
determinacin; R2 = 0,8774, es confiable ya que se aproxima a 1. RTA: Por ende es confiable.

c. Determine el porcentaje de explicacin del modelo y el grado de relacin de las dos variables.
El porcentaje de explicacin del modelo: Est dado por la representacin porcentual del
coeficiente de determinacin, as: R2 x 100% = 0,8774 x 100% = 87,74 %.
El grado de relacin de las dos variables: Est dado por la raz cuadrada del coeficiente de
determinacin, as: R2 = 0,8774=0,9366, cuya representacin porcentual seria: 0,9366 x
100%= 93,66%, lo cual seala que las dos variables de porcentaje, estn relacionadas entre s,
con un 93.66%. Tambin se puede afirmar que como el coeficiente de correlacin tiene un valor
que se encuentra entre 0.90 y 1 entonces su correlacin es buena.
d. Cul es el porcentaje de hidrocarburo cuando la pureza del oxgeno es igual a 91,3?
De acuerdo a lo arrojado en el diagrama de dispersin indica que
y = 14,947x + 74,283, se despeja x. y a y se le da el valor de 91.3

y = 14,947x + 74,283
91,3 = 14,947x + 74,283

1,13 = x

Conclusin: cuando la pureza del oxgeno es de 91.3 el porcentaje de hidrocarburo es


de 1.13.

2. El nmero de libras de vapor (y) consumidas mensualmente por una planta qumica, se
relaciona con la temperatura ambiental promedio (en o F). Para el ao 2014, se registraron
los siguientes valores de temperatura y consumo anual.
2014 Registros de temperatura y consumos de
vapor.

Mes

Temperatura
(oF)

Consumo de
vapor (Lb)

Ene.
Feb.
Mar.
Abr.
May.
Jun.
Jul.
Ago.
Sep.
Oct.
Nov.
Dic.

21
24
32
47
50
59
68
74
62
50
41
30

185,79
214,47
288,03
424,84
455
539
621,55
675,06
562,03
452,93
369,95
273,98

a. Realice el diagrama de dispersin y determine el tipo de asociacin entre las variables.

Diagrama de dispersion
800
y = 9,2087x - 6,3184
R = 0,9999

600
400
200
0
0

20

40

60

80

Anlisis: los puntos de dispersin siguen la lnea de tendencia central

b. Ajuste un modelo matemtico que permita predecir el efecto de una variable sobre la
otra. Es confiable?
El modelo matemtico; el cual nos permite predecir una variable sobre la otra es la
ecuacin de la tendencia de la lnea, la cual corresponde a: y = 92,2087 x 6,3184. Segn
su coeficiente de determinacin; R2 = 0, 9999 se analiza que por ser cercano a 1, se
afirma que el modelo matemtico obtenido el cual relaciona las variables de porcentaje de
RTA: Temperatura y consumo a vapor es confiable.
c. Determine el porcentaje de explicacin del modelo y el grado de relacin de las dos
variables.
R2 x 100% = 0,9999 x 100% = 99,99 %.
El grado de relacin de las dos variables: Est dado por la raz cuadrada del coeficiente de
determinacin, as: R2 = 0,9999 =0,9999499987, cuya representacin porcentual seria:
0,9999 x 100%= 99,99%, lo cual seala que las dos variables de porcentaje de porcentaje
de temperatura y consumo a vapor, estn relacionadas entre s, con un 99,99%. Su
relacin es muy buena.

d. Cul es el de consumo de vapor cuando la temperatura es de 70 oF?

y = 9,2087 x - 6, 3184, la formula queda as:


y= 9,2087 x - 6, 3184
9,2087(70) 6,3184
644,609 6,3184
638,2906 = y
Conclusin: el consumo de vapor cuando la temperatura es de 70 oF es de 638,2906

3. Los investigadores estn estudiando la correlacin entre la obesidad y la respuesta


individual al dolor. La obesidad se mide como porcentaje sobre el peso ideal (x). La
respuesta al dolor se mide utilizando el umbral de reflejo de reflexin nociceptiva (y) que
es una medida de sensacin de punzada. Obsrvese que ambas, X e Y, son variables
aleatorias
x
(porcentaje y (umbral de
reflejo de
de
flexin
sobrepeso)
nociceptiva)
89
90
75
30
51
75
62
45
90
20

2
3
4
4,5
5,5
7
9
13
15
14

10

a. Realice el diagrama de dispersin y determine el tipo de asociacin entre las variables.

Diagrama de dispersion
y = -0,0629x + 11,642
R = 0,1115

16
14
12
10
8
6
4
2
0
0

20

40

60

80

100

Conclusin: el diagrama sigue la lnea de tendencia central

b. Ajuste un modelo matemtico que permita predecir el efecto de una variable sobre la
otra. Es confiable?
y= - 0,062x + 11,642 y como el coeficiente de correlacin es; R2 = 0,1115. RTA: Con
esto se puede concluir que el modelo no es confiable.
c. Determine el porcentaje de explicacin del modelo y el grado de relacin de las dos
variables.
El porcentaje de explicacin del modelo: as: R2 x 100% = 0,1115 x 100% = 11.15 %.
El grado de relacin de las dos variables: Est dado por la raz cuadrada del coeficiente de
determinacin, as: R2 = 0,1115= 0,3339161571 cuya representacin porcentual seria:
0,3339 x 100%= 33,39%, lo cual seala que las dos variables de porcentaje de sobrepeso
y umbral de reflejo de flexin nociceptiva, estn relacionadas entre s, con un 33,39%. Su
correlacin no buena.
d. Cul es el umbral de reflejo de flexin nociceptiva, cuando hay un porcentaje de
sobrepeso, de 40?
y = -0,0629x + 11, 642, donde x es 40
y= -2.516 + 11,642

11

9,126= y
Conclusin: el reflejo de flexin nociceptiva es de 9.126 cuando el porcentaje de
sobrepeso es de 40.

Regresin y Correlacin lineal Simple

- Identificar dos variables cuantitativas de la situacin estudiada que puedan estar relacionadas.
Variable: Edad
Variable: Peso

- Realizar el diagrama de dispersin de dichas variables y determinar el tipo de asociacin entre


las variables.

Diagrama de Dispersin
60,0
y = 4,4757x - 9,6849
R = 0,7869

50,0

Peso

40,0
30,0
20,0
10,0
0,0
0

10

12

Edad

Con los resultados obtenidos se puede asegurar segn la grfica del diagrama de dispersin que el
tipo de asociacin entre las variables sigue una tendencia lineal y Creciente.

12

- Encuentre el modelo matemtico que permite predecir el efecto de una variable sobre la
otra. Es confiable?
El modelo matemtico; el cual nos permite predecir una variable sobre la otra es la ecuacin de
la tendencia de la lnea, la cual corresponde a: y = 4,4757 x 9,6849. Segn su coeficiente de
determinacin; R2 = 0,7869 se analiza que por ser cercano a 1, se afirma que el modelo
matemtico obtenido el cual relaciona las variables de porcentaje de edad y peso es confiable.

- Determine el porcentaje de explicacin del modelo y el grado de relacin de las dos


variables.
El porcentaje de explicacin del modelo: Est dado por la representacin porcentual del
coeficiente de determinacin, as: R2 x 100% = 0,7869 x 100% = 78,69%
El grado de relacin de las dos variables: Est dado por la raz cuadrada del coeficiente
de determinacin, as: R2 = 0,7869 =0,8870, cuya representacin porcentual seria:
0,8870 x 100%= 88,70%, lo cual seala que las dos variables de porcentaje de edad y
peso, estn relacionadas entre s, con un 88,70%. Tambin se puede afirmar que como el
coeficiente de correlacin tiene un valor que se encuentra entre 0.80 y 1 entonces su
correlacin es aceptable.

- Relacionar la informacin obtenida con el problema.


Anlisis:
Con los resultados obtenidos se puede asegurar que existe una correlacin con las
variables edad y peso de los estudiantes de las instituciones pblicas y privadas del
municipio de san Sebastin de Mariquita, con un porcentaje de 78,69%. Segn el
coeficiente de correlacin lineal se analiza que su correlacin es aceptable.

13

Regresin y Correlacin Lineal Mltiple

- Identificar una variable cuantitativa dependiente y varias variables independientes del estudio
de investigacin.

Variable dependiente: Peso

Variables independientes: Edad y Estatura

- Realizar el diagrama de dispersin de dichas variables.

Diagrama de Dispersin
60,0
y = 4,4757x - 9,6849
R = 0,7869

50,0
Peso

40,0
30,0
20,0
10,0
0,0
0

6
Edad

10

12

14

Diagrama de Dispersin
60,0
y = 79,022x - 73,543
R = 0,9346

50,0

Peso

40,0
30,0
20,0
10,0
0,0
0,0

0,2

0,4

0,6

0,8

1,0

1,2

1,4

1,6

Estatura

- Calcular la recta de regresin y el coeficiente de correlacin para probar estadsticamente su


relacin.

Resumen
Estadsticas de la regresin
Coeficiente de correlacin mltiple
Coeficiente de determinacin R^2
R^2 ajustado
Error tpico
Observaciones

0,967400646
0,93586401
0,934665207
1,511415576
110

Coeficientes
Intercepcin
Variable x1
Variable x2

-78,937361
-0,496865439
86,5177139

15

- Relacionar la informacin obtenida con el problema.

Anlisis:
El coeficiente de correlacin mltiple entre los variables peso, edad y estatura de los estudiantes
de las instituciones pblicas y privadas del municipio de san Sebastin de mariquita es excelentes
porque da 0,96740065

El coeficiente de determinacin es 0,93586401 por lo tanto se analiza que por ser cercano a 1, se
afirma que el modelo matemtico obtenido el cual relaciona las variables de porcentaje peso,
edad y estatura de los estudiantes de las instituciones pblicas y privadas del municipio de san
Sebastin de mariquita es confiable.

16

Conclusiones

La investigacin es un proceso de indagacin en el cual la estadstica descriptiva corresponde a


metodologas de gran utilidad para la eficiencia en el que hacer investigativo, de ah la
importancia de que como estudiantes y futuros investigadores aprendamos estas metodologas
que muy probablemente sern muy tiles en nuestro que hacer, en los procesos de investigacin
que realicemos sobre situaciones especficas de realidad y en general en todo nuestro actuar.
La estadstica se convierte en un rea de estudio muy til y por ello se realiz este proceso de
aprendizaje el cual ha generado diferentes aprendizajes y desarrollo de habilidades entorno a la
estadstica descriptiva y su aplicacin sobre realidades a las cuales nos enfrentamos.
El primer paso para determinar si existe o no una relacin entre dos variables es observar la
grfica llamada diagrama de dispersin.
El error estndar nos permite deducir la confiabilidad de la ecuacin de regresin que hemos
desarrollado.
El anlisis de correlacin es la herramienta estadstica que podemos usar para describir el grado
hasta el cual una variable esta linealmente relacionada con la otra.
La regresin simple se presenta cuando una variable independiente ejerce influencia sobre otra
variable dependiente. Ejemplo: Y = f(x)
La regresin Mltiple se presenta cuando dos o ms variables independientes influyen sobre una
variable dependiente. Ejemplo: Y = f(x, w, z).

17

Referencias

Referencias electrnicas:

BLOG CURSO ESTADSTICA DESCRIPTIVA. Recuperado de:


http://estadisticadescriptivaunad100105.blogspot.com.co/

REGRESION MULTIPLE. Recuperado de:


http://www.monografias.com/trabajos30/regresion-multiple/regresion-multiple.shtml

REGRESIN LINEAL SIMPLE. Recuperado de:


http://html.rincondelvago.com/regresion-lineal-simple.html

You might also like