You are on page 1of 15

ESTADISTICA 100105_97

LABORATORIO REGRESIÓN Y CORRELACIÓN LINEAL

Por
Liceth Marlovick Salazar Rodriguez

Presentado a
MARIA JOSE CHARFUELAN
Tutor

Universidad Nacional Abierta y a Distancia UNAD


CEAD SOGAMOSO
ECBTI
2017
INTRODUCCION

. La investigación estadística es una actividad que apela a diversas técnicas con el propósito

de llegar a la esencia de la realidad. La regresión lineal simple y la regresión lineal múltiple

son técnicas de análisis de las variables de una investigación estadística, en este caso desde

la encuesta realizada. Si bien es cierto estas técnicas mencionadas se pueden utilizar para

solucionar problemas comunes en los negocios o para evaluar el comportamiento de su

economía y en general se utiliza con mayor frecuencia en las ciencias económicas, también

es cierto que en muchos casos se requiere conocer más que el comportamiento de una sola

variable para entender una investigación cualquiera sea su especia. Entonces, sin importar la

situación presentada se hace necesario que practiquemos estas técnicas de regresión por

medio de ejercicios salientes de la cotidianidad, a continuación, veremos pues los resultados

de dicha práctica.

La realización de este trabajo es dar a conocer y poner en práctica la regresión y correlación

y medias de dispersión y estadísticas bivariantes sobre la unidad 2 de este curso, además de

los comportamientos que se dan en el plano cartesiano tanto en las variables, como los grados

y resultados que se manejan para los ejemplos que se plantean en el laboratorio propuesto,

que es de vital importancia reconocer y manejar las fórmulas que se obtienen de la

herramienta de Excel.
JUSTIFICACIÓN

Partiendo de una base de datos sobre la problemática, se presenta las soluciones de las
actividades planteadas dentro del periodo histórico comprendido entre los años 2006 a 2012.
Para ello, en primer lugar aplicaremos el proceso de regresión lineal simple para determinar
tanto la naturaleza como la fuerza de una relación entre dos variables y segundo lugar la
regresión lineal múltiple con la cual describiremos la relación entre dos o más variables
independientes y una variable dependiente utilizando la ecuación de regresión múltiple; estas
ecuaciones de estimaciones nos permitirá realizar una interpretación de correlación de la
investigación realizada en estas instituciones educativas. El trabajo de laboratorio constituye
una de las mejores metodologías para la aplicación de modelos estadísticos a las variables de
los hechos, es por eso que se trabaja en este sentido y no otro para la práctica de la unidad 3
de regresión y determinación
OBJETIVOS

Objetivos Generales
1. Potencializar en el estudiante habilidades y destrezas para caracterizar una situación
mediante el análisis de las medidas estadísticas bivariantes.
2. Calcular e interpretar adecuadamente las medidas estadísticas bivariantes, asociadas
a una situación específica.
3. Determinar la relación entre dos o más variables inscritas en una situación específica
a partir del análisis de regresión lineal simple y múltiple.

Objetivos Específicos
1. Interpretar correctamente los datos de cada tabla propuestos en cada uno de los
ejercicios.
2. Realizar diagramas de dispersión en los ejercicios de laboratorio y actividades
colaborativas que permitan determinar el tipo de asociación entre las variables
escogidas en cada ejercicio.
3. En los ejercicios propuestos de laboratorio y de regresión y correlación lineal simple
crear modelos matemáticos que permita predecir el efecto de una variable sobre la
otra para determinar su fiabilidad.
4. Determinar porcentajes que permitan una explicación de modelo y grado de relación
de dos variables de los ejercicios de laboratorio y de regresión y correlación lineal
simple.
5. En la práctica de regresión y correlación lineal múltiple identificar una variable
cuantitativa dependiente y varias variables independientes del estudio de
investigación, diagramarlas y calcular la recta de regresión y el coeficiente de
correlación para probar estadísticamente su relación.
6. Relacionar o analizar la información obtenida en cada problema planteado en los
ejercicios de laboratorio y colaborativo.
ESTADISTICA DESCRIPTIVA 100105_97
LABORATORIO Y TRABAJO COLABORATIVO
PASO 4- DESCRIPCIÓN DE LA INFORMACIÓN: DETALLAR Y
RELACIONAR VARIABLES DE LA PROBLEMÁTICA UTILIZANDO
MEDIDAS BIVARIANTES.
LABORATORIO REGRESIÓN Y CORRELACIÓN LINEAL
Actividad individual

Mapa Mental
Diagrama de Dispersión

Si bien es cierto, el diagrama de dispersión, también conocido como gráfico de


dispersión o gráfico de correlación consiste en la representación gráfica de dos variables
para un conjunto de datos. En otras palabras, analizamos la relación entre dos variables,
conociendo qué tanto se afectan entre sí o qué tan independientes son una de la otra.

Coeficiente de correlación lineal.


La correlación, también conocida como coeficiente de correlación lineal (de Pearson), es
una medida de regresión que pretende cuantificar el grado de variación conjunta entre dos
variables.
Coeficiente de determinación R2
En estadística, el coeficiente de determinación, denominado R² y pronunciado R cuadrado,
es un estadístico usado en el contexto de un modelo estadístico cuyo principal propósito es
predecir futuros resultados o probar una hipótesis. El coeficiente determina la calidad del
modelo para replicar los resultados, y la proporción de variación de los resultados que puede
explicarse por el modelo

Correlación positiva

Se habla de una correlación positiva cuando una relación entre una variable y otra
es lineal y directa, de manera que un cambio en una variable predice el cambio en
la otra variable. En ese caso, se dice que la correlación es positiva perfecta, es
decir, ambas variables varían al mismo tiempo. Este tipo de correlación es
directamente proporcional.
Correlación Negativa
Se habla de una correlación negativa cuando la relación entre una variable y otra
es opuesta o inversa, es decir, cuando una variable cambia, la otra se modifica
hacia lo contrario. Entonces, cuando una posee variable valores altos, la otra posee
valores bajos y mientras este valor esté más cerca de -1, más evidente será esta
covariación.
Ejercicios

1. SE QUIERE ESTUDIAR LA ASOCIACIÓN ENTRE CONSUMO DE SAL Y


TENSIÓN ARTERIAL. A UNA SERIE DE VOLUNTARIOS SE LES ADMINISTRA
DISTINTAS DOSIS DE SAL EN SU DIETA Y SE MIDE SU TENSIÓN ARTERIAL
UN TIEMPO DESPUÉS.

X (sal) Y (Tensión)
1,6 98
2,3 102
3,3 109
4,2 113
4,6 115
5,0 120
Realice el diagrama de dispersión y determine el tipo de asociación entre las variables
140
y = 4.3714x + 94.2
120 R² = 0.9793

100
Tension

80

60 Y (Tensión)
Linear (Y (Tensión) )
40

20

0
0 2 4 6 8
Sal

Figura 1. Diagrama de distribución entre las variables TENSION Y SAL

El tipo de asociación del diagrama de dispersión es LINEAL.

Encuentre el modelo matemático que permite predecir el efecto de una variable sobre
la otra. ¿Es confiable?

El modelo matemático que permite predecir el efecto de una variable sobre la otra es:

y=4.371x + 94.2
R² = 0.979
Se puede asegurar que la ecuación de la recta es confiable porque el R² está cercano a 1 y
tiene un grado alto de confiabilidad.

Determine el grado de relación de las dos variables.

El R² afirma además que el modelo explica el 97.9% de la información y el valor de r


coeficiente de correlación lineal es excelente porque el 0.979 está muy cercano al extremo
1 positivo que es la correlación perfecta positiva.

Si a un paciente se le administra una dosis de sal de 5,6. ¿Cuál es la tensión arterial


esperada?

Para hallar el valor de la tensión arterial esperada para una dosis de sal de 6.5 debemos
reemplazar este valor en la formula hallada.
𝒀 = (4.371*6.5)+94.2=122.61
Según lo anterior para dicha dosis de sal la tensión arterial esperada es de 126.6
2. en un nuevo proceso artesanal de fabricación de cierto artículo que está implantado,
se ha considerado que era importante ir anotando periódicamente el tiempo medio
(medido en minutos) que se utiliza para realizar una pieza y el número de días desde
que empezó dicho proceso de fabricación. Con ello, se pretende analizar como los
operarios van adaptándose al nuevo proceso mejorando paulatinamente su proceso de
producción.

Los siguientes datos representan dicha situación:

X 12 23 35 42 53 65 70
Y 45 30 27 25 23 21 20

Identifique la variable dependiente (y) y la variable independiente (x), realice el


diagrama de dispersión y determine el tipo de asociación entre las variables.
50
45 y = -0.3566x + 42.569
40 R² = 0.7963
35
30
25
X
Y
20
15 Linear (Y)
10
5
0
0 20 40 60 80
Y

Figura 2. Diagrama de distribución entre las variables X y Y

El tipo de asociación del diagrama de dispersión es LINEAL. Son variables inversamente


proporcionales.

Encuentre el modelo matemático que permite predecir el efecto de una variable sobre
la otra. ¿Es confiable?

y = -0.356x + 42.56
R² = 0.796

Se puede asegurar que la ecuación de la recta tiene un grado de confianza mediana porque el
R² está un poco alejado a 1, teniendo entonces un grado medio alto de confiabilidad.

Determine el grado de correlación de las dos variables.


El R² afirma además que el modelo explica el 79.6% de la información y el valor de r
coeficiente de correlación lineal es sobresaliente porque el 0.796 está un poco alejado al
extremo 1 positivo que es la correlación perfecta positiva.

¿Qué tiempo deberá tardarse un empleado cuando lleven 90 días?


Para hallar el valor del tiempo de 100 días debemos reemplazar este valor en la formula
hallada.
𝒀 = (−𝟎. 𝟑𝟓𝟔 ∗ 𝟏𝟎𝟎) + 𝟒𝟐. 𝟓𝟔= 6.96 minutos
Según lo anterior para dicho número de días se espera realizar para una pieza el obrero se
demore 6.96 minutos.
3. Una Nutricionista de un hogar infantil desea encontrar un modelo matemático que
permita determinar la relación entre el peso y la estatura de sus estudiantes. Para ello
selecciona 10 niños y realiza las mediciones respectivas.
A continuación, se presentan los resultados:

Estatura (cm) 120 124 107 118 112 110 115 104 110 116
Peso (kg) 24 23 19 24 21 19 22 16 20 23

Identifique la variable dependiente (y) y la variable independiente (x), realice el


diagrama de dispersión y determine el tipo de asociación entre las variables.

30
y = 0.386x - 22.751
25 R² = 0.8329

20
Peso()kg)

15
Peso ( kg)
10 Linear (Peso ( kg))

0
100 105 110 115 120 125
Estatura(cm)

Figura 3. Diagrama de distribución entre las variables PESO Y ESTATURA

El tipo de asociación del diagrama de dispersión es LINEAL.


Encuentre el modelo matemático que permite predecir el efecto de una variable sobre
la otra. ¿Es confiable?
y = 0.386x - 22.75
R² = 0.832
Se puede asegurar que la ecuación de la recta es aceptable porque el R² se aleja un poco de
1 y tiene un grado de confiabilidad aceptable.
c. Determine el grado de correlación de las dos variables.
La correlación lineal es aceptable porque el 0.832 está un poco retirado del 1 positivo.
d. Cuál es el peso que debería tener un estudiante que mida 128 cm?
y = 0.386(128) - 22.75=24.354
16. Tablas de Resultado de la Regresión y Correlación Lineal Simple
. Tablas de Resultado de la Regresión y Correlación Lineal múltiple.
Análisis de una variable cuantitativa dependiente y varias variables independientes del
estudio de investigación.

Resumen
Estadísticas de la regresión
Coeficiente de correlación
múltiple 0.93349474
Coeficiente de determinación
R^2 0.87141243
R^2 ajustado 0.86777316
Error típico 0.42617095
Observaciones 110
1. Análisis

El Coeficiente de correlación lineal confirma que el grado de relación es del (16,70%)


siendo un resultado muy bajo de la correlación entre las variables Edad y materias
aprobadas.

El Coeficiente de correlación lineal confirma que el grado de relación entre las variables
materias aprobadas y número de textos escolares en casa, es del (18,63%) siendo un resultado
muy bajo de la correlación.

El Coeficiente de correlación lineal confirma que el grado de relación es del (93,12%)


siendo un resultado muy bueno y alto de la correlación entre las variables Edad y estatura,
sin embargo por si solas no tienen inferencia directa con el problema análisis.

El coeficiente de relación lineal múltiple entre la variable dependiente y las otras variables
es alto con un 93.34%. Lo que indica que en conjunto los niños según la edad y la estatura
tienen más libros en casa y les permite aprobar un número mayor de materias.

Las variables de mayor guardan relación, son Estatura, peso y Edad y al relacionarlas con
las Materias aprobadas y a su vez de acuerdo al número total de materias aprobadas se van
a obtener menos materias con desempeño cero.
conclucion

Se pudo evidenciar que para manejar cualquier tipo de variables se necesita realizar un
diagrama de dispersión y aplicar conceptos, fórmulas de relación y correlación que
permita el despeje de las ecuaciones y datos para obtener un resultado.

Los ejemplos nos muestran que son acordes a un tipo de forma lineal y la correlación es
confiable para los tipos de datos.

Hallamos los comportamientos que tienen tendencia lineal y determinamos el grado de


correlación entre las variables.
REFERENCIAS BIBLIOGRAFICAS

Pava, M. (2017). ESTADÍSTICA DESCRIPTIVA. [online]

Estadisticadescriptivaunad100105.blogspot.com.co. Available at:

http://estadisticadescriptivaunad100105.blogspot.com.co/ [Accessed 22 jun. 2017].

Robles Fabián, D. (2017). Regresión múltiple - Monografias.com. [online]

Monografias.com. Available at: http://www.monografias.com/trabajos30/regresion-

multiple/regresion-multiple.shtml [Accessed 22 jun. 2017].

https://es.wikipedia.org/wiki/Coeficiente_de_determinaci%C3%B3n

https://diferencias.eu/entre-correlacion-positiva-y-correlacion-negativa/

You might also like