You are on page 1of 31

RECORDAR. . . .!

¿Se acuerdan de la
distribución de Ji-
cuadrada de la clase
anterior?

¿Qué variables
existían?

¿Qué indicaban ellas?,


¿Cómo se asociaban?
1. Conocer cuántas decisiones comerciales dependen del conocimiento
de la relación específica entre dos o más variables.
2. Utilizar diagramas de dispersión para visualizar la relación entre dos
variables.
3. Emplear el análisis de regresión para estimar la relación entre dos
variables.
4. Utilizar la ecuación de estimación de mínimos cuadrados para predecir
valores futuros de la variable dependiente.

5. Aprender cómo el análisis de correlación describe el grado en el cual dos


variables están relacionadas linealmente entre sí.
6. Comprender el coeficiente de determinación como una medida de la
fuerza de la relación entre dos variables.
• Utilizamos pruebas de ji-cuadrada de independencia para
determinar si existía una relación estadística entre dos
variables

• La prueba ji-cuadrada nos dice si existe tal relación, pero


no nos dice cuál es esa relación.

Los análisis de regresión y correlación nos mostrarán cómo determinar tanto la


naturaleza como la fuerza de una relación entre dos variables.

De esta forma, aprenderemos a pronosticar, con cierta precisión, el valor de


una variable desconocida basándonos en observaciones anteriores de ésa y
otras variables.
Apuntes tomados de ESTADÍSTICA PARA ADMINISTRACIÓN Y ECONOMÍA. Richard I. Levin.
The University of North Carolina at Chapel Hill. Septima Edición.

1. REGRESIÓN LINEAL SIMPLE

“Una técnica estadística que establece una ecuación para


estimar el valor desconocido de una variable, a partir del
valor conocido de otra variable, (en vez de valores de muchas
otras variables) se denomina análisis de regresión simple.”

Por lo tanto el análisis de regresión lineal simple, es el


proceso general de predecir una variable (Y) a partir de otra
(X).
Relación directa: la pendiente de
esta línea es positiva, por que la
variable Y crece a medida que la
variable X también lo hace.

Las relaciones
entre las
variables pueden
ser directas o
también
inversas.

Relación inversa: La pendiente


de esta línea es negativa, por
que a medida que aumenta el
valor de la variable Y, el valor de
la variable X disminuye.
VARIABLE INDEPENDIENTE (X)
En el análisis de regresión una variable cuyo valor se suponga
conocido y que se utilice para explicar o predecir el valor de otra
variable de interés se llama variable independiente; se simboliza con
la letra X.
Otros nombres alternativos para la variable independiente (X), son
variable explicatoria, variable predictora y en ocasiones variable
regresora.

VARIABLE DEPENDIENTE (Y)


En el análisis de regresión una variable cuyo valor se suponga
desconocido y que se explique o prediga con ayuda de otra se llama
variable dependiente y se simboliza con la letra Y.

La variable dependiente, al igual que la variable independiente es


llamada de diferentes maneras algunas de ellas son: variable
explicada o variable pronosticada.
DIAGRAMAS DE DISPERSIÓN
Un diagrama de dispersión es una ilustración gráfica que se usa en
el análisis de regresión.
El diagrama de dispersión, también llamado nube de puntos, brinda dos
tipos de información, visualmente se pueden determinar los patrones que
indican como las variables están relacionadas (lineal o mediante una curva) y
por otro lado si existe una relación entre ellas visualizando la clase de línea o
ecuación de estimación que describe a dicha relación
ALGUNAS RELACIONES EN LOS DIAGRAMAS DE DISPERSIÓN:
METODO DE MINIMOS CUADRADOS
El método de mínimos cuadrados sirve para determinar la
recta que mejor se ajuste a los datos muestrales

Una línea de regresión calculada a partir de los datos


muestrales, por el método de mínimos cuadrados se llama
línea de regresión estimada o línea de regresión muestral.

Dicha línea recta es la que mejor se ajusta al conjunto de


datos (X, Y) y es aquella en que la distancia que hay entre los
datos y la supuesta recta es la menor posible, y se calcula
mediante la siguiente formula:
Para calcular el valor de b (pendiente), que representa el grado de
inclinación que tiene la recta, se emplea la siguiente formula:

Para calcular el valor de a (ordenada al origen), que representa el


punto en que la recta corta al eje de las Y, se emplea la siguiente
formula:

Las variables a y b son constantes numéricas que son las que se calculan mediante el método
de mínimos cuadrados.
PROCEDIMIENTO PARA REALIZAR UN ANÁLISIS DE REGRESIÓN LINEAL SIMPLE
1. Obtención de los datos muestrales.

2. Los datos obtenidos se tabulan. (tener cuidado en determinar correctamente quien


es la variable independiente y dependiente)
3. La información se gráfica en un diagrama de dispersión, estableciéndose la posible relación
entre las dos variables

4. Se calcula la pendiente. 4. Se calcula la ordenada al origen.


5. Se obtiene la ecuación que mejor se ajusta a la información obtenida.

6. Se traza la línea estimada en el diagrama de dispersión.

7. Se calcula el error estándar de estimación.


8. Luego del análisis determine la Correlación de Pearson (r), mediante la siguiente ecuación.
Coeficiente de correlación
El coeficiente de correlación es un número que sirve para medir en forma
relativa el grado de asociación lineal entre dos variables (X y Y).

El valor del coeficiente de correlación puede variar entre -1 y 1.

Cuando el valor del coeficiente de correlación es negativo, esto indica una


asociación lineal inversa entre X y Y, esto es, cuando X sube Y baja.

Los valores de correlación cercanos a -1 o a 1, indican una fuerte asociación


lineal entre X y Y.

Los valores de correlación cercanos a 0 indican falta de asociación lineal entre X y Y.

18
8. Coeficiente de Determinación (r2) mediante la siguiente ecuación.

Existen dos medidas para describir la correlación entre dos variables: el coeficiente de
determinación y el coeficiente de correlación.

El coeficiente de determinación muestral se representa como r2, y mide exclusivamente


la fuerza de una relación lineal entre dos variables.
Un gerente de ventas reunió los datos siguientes relacionados con las ventas
anuales en miles de pesos y los años de experiencia de diez vendedores. Estime las
ventas anuales para un vendedor con 7 años de experiencia. Determine:

a) Elabora el diagrama de dispersión.


b) Calcula la pendiente y ordenada al origen.
c) Obtener la ecuación que mejor se ajusta a los datos.
d) Traza la línea estimada en el diagrama de dispersión.
e) Calcula el error estándar de estimación.
f) Calcula el coeficiente de determinación.
g) Determina el coeficiente de correlación.
4. Ecuación que mejor se ajusta.

Para un vendedor con 7 años de experiencia, sus ventas estimadas serían:

5. Trazo de la línea estimada en el diagrama de dispersión


6. Calcular el error estándar de estimación.

7. Calcular el Coeficiente de Determinación.

El 93% de las ventas anuales se deben a la experiencia de los vendedores y el 7%


restante de debe a otros factores.

8. Calcular el Coeficiente de Correlación

ESTE NÚMERO NOS INDICA QUE LAS VARIABLES X e Y TIENEN UNA CORRELACIÓN
POSITIVA INTENSA.
Los equipos de investigación de la asignatura de métodos estadísticos para la
investigación desean averiguar si tiempo de vuelo de un helicóptero tiene relación
con el numero de intentos. Determine:

Procedimiento:
- De una altura de 4 m, deje caer el helicóptero y
tome el tiempo de inicio y el final de aterrizaje.
Datos recolectados de los lanzamientos de un
helicóptero

a) Elabora el diagrama de dispersión.


b) Calcula la pendiente y ordenada al origen.
c) Obtener la ecuación que mejor se ajusta a los datos.
d) Traza la línea estimada en el diagrama de dispersión.
e) Calcula el error estándar de estimación.
f) Calcula el coeficiente de determinación.
g) Determina el coeficiente de correlación.

Nota: puede realizar el calculo manual o mediante a app


AnalyStat, regresión, otros de su smarphone.
PROCEDIMIENTO PARA REALIZAR UN ANÁLISIS DE CORRELACIÓN
LINEAL SIMPLE

1. Obtención y tabulación de los datos muestrales.

2. La información se gráfica en un diagrama de dispersión.

3. Calcular la pendiente y ordenada al origen.

4. Se obtiene la ecuación que mejor se ajusta a la información obtenida.

5. Se traza la línea estimada en el diagrama de dispersión.

6. Calcular el error estándar de estimación.

7. Calcular el coeficiente de determinación.

8. Determinar el coeficiente de correlación.


1. Una ecuación de estimación es válida sólo para el mismo rango
dentro del cual se tomó la muestra inicialmente.

2. los análisis de regresión y correlación no pueden, de ninguna


manera, determinar la causa y el efecto

3. Las condiciones cambian e invalidan la ecuación de regresión

4. Los valores de las variables cambian con el tiempo

5. Mala interpretación de r y r2

6. Relaciones que no tienen un vínculo común


3. Sociabilizan la importancia de los datos
experimentales y como se utilizarán para encontrar
la fuente de variación de los procesos de
manufactura.
¿ Que ocurre si tenemos más de una variable independiente, se puede estimar Y?.

Podemos utilizar más de una variable independiente para estimar la


variable dependiente e intentar, de esta manera, aumentar la precisión de la
estimación. Este proceso se conoce como análisis de regresión múltiple y
correlación

You might also like