You are on page 1of 42

UNIVERSIDAD DE LA GUAJIRA

EXTENSION VILLANUEVA

FACULTAD DE CIENCIAS ECONOMICAS Y ADMINISTRATIVAS

PROGRAMA DE ADMINISTRACION DE EMPRESAS

ASIGNATURA ESTADISTICA II

GUIA DE ESTUDIO

Mag.: ALEXI MONTERO SANTIAGO

amsantiago@uniguajira.edu.co
monterocivil@gmail.com
1. PRESENTACIÓN

En nuestra última década del siglo XXI, hemos observado, que nuestro país y demás países
del mundo, la vida diaria de todo ser humano está rodeada de diversos grados de
incertidumbre, que inciden en los problemas económicos, social, político, cultural, dejando
como consecuencias, estados de violencia, desempleo, miseria, desarrollo no adecuado de
las empresas, resultados no satisfactorio de la información, mal manejo de la información
en algunos casos para la toma de decisiones. Es preciso decir que para la solución de los
problemas anteriores contamos con una herramienta importante, que es la estadística II,
Inferencial las cual utiliza las técnicas en casi todos los aspectos de la vida y mediante ella
podemos utilizar métodos y modelos, estimaciones, hipótesis para predecir el resultado de
futuras repeticiones en las empresas. Se diseñan encuestas para obtener información previa
por ejemplo el día de las elecciones y predecir el resultado de las mismas. Se seleccionan al
azar consumidores para obtener información, con el fin de predecir, la frecuencia con
respecto a cierto producto, el medico investiga para obtener el efecto de ciertos
medicamentos a través de expertos y condiciones ambientales controladas en los humanos y
así determinan el método apropiado para curar la enfermedad. El ingeniero muestra las
características de calidad de un producto junto con otras variables controlables del proceso,
para facilitar la identificación de variables que están más relacionadas con nuestra calidad.
En algunos casos se toman muestras de productos recientemente fabricados, antes de su
envío al mercado, para decidir si se retira o se entrega ciertos lotes, dichos productos. El
economista y el contador público consideran varios índices de la situación económica
durante cierto periodo y utiliza la información para predecir la situación contable,
económica y futura. Las técnicas estadísticas desempeñan una función importante en el
logro de los objetivos de cada uno de los problemas de nuestra región o país. El requisito
para la explicación de la teoría es la estadística y la formulación de sus objetivos. Por eso
podemos decir que la estadística es la rama del método científico que trata de los datos
recopilados al contar o medir, propiedades de alguna población y a partir de los métodos y
conclusiones de expertos y procesos. Entramos en la toma de decisiones.
CONTENDIO PROGRAMATICO

I. UNIDAD
1-TEORÍA DE LA COMBINATORIA
1.1 Permutaciones y combinaciones
1.2 Formulas y ejemplos prácticos
1.3 Teoría de la probabilidad

II.UNIDAD
2 DISTRIBUCIONES MUESTRALES
2.1 Muestras aleatorias con y sin reemplazo
2.2 Media muestral
2.3 Varianza muestral
2.4 Propiedades de Media muestral y Varianza muestral

III. UNIDAD
3. ESTIMACIÓN DE PARÁMETROS
3.1 Estimación Puntual
3.1.1 Generalidades
3.1.2 Definición de estimación puntual
3.1.3 Propiedades de los estimadores: insesgado, eficiente, consistente y suficiente.
3.1.4 Método de máxima verosimilitud.
3.2 Estimación por Intervalos
3.2.1 Definición de estimación por intervalos.
3.2.2 Intervalo de confianza para estimar la media poblacional.
3.2.3 Intervalo de confianza para estimar la diferencia de medias Poblacionales.
3.2.4 Intervalo de confianza para estimar la proporción Poblacional
3.2.5 Intervalo de confianza para estimar la diferencia de proporciones poblacionales.
Intervalo de confianza para estimar la varianza poblacional

IV. UNIDAD
4. PRUEBAS DE HIPÓTESIS
4.1 Definición de pruebas de hipótesis.
4.2 Prueba de hipótesis para la media poblacional.
4.3 Prueba de hipótesis para la diferencia de medias poblacionales.
4.4 Prueba de hipótesis para la proporción poblacional
4.5 Prueba de hipótesis para la diferencia de proporciones poblacionales.
4.6 Prueba de hipótesis para la varianza poblacional.

V. UNIDAD
5REGRESIÓN Y CORRELACIÓN
5.1 Generalidades
5.2 El método de mínimos cuadrados
5.3 Inferencias basadas en estimadores de mínimos cuadrados
5.4 Regresión simple y regresión múltiple
5.5 Correlación
1-TEORIA DE COMBINATORIA.

1.1 PROBABILIDAD: La probabilidad es una rama de la matemática. Actualmente se


extiende, junto con la estadística, a campo de la investigación científica, los negocios, la
predicción del clima y la política.

Experimento aleatorio: es un ensayo en el cual no se conoce el resultado final hasta


ejecutarlo. Sin embargo, es factible encontrar el conjunto de los posibles resultados que
pueden presentarse antes de ejecutar el ensayo.

Espacio Muestral: El espacio muestral de un experimento aleatorio es el conjunto de todos


los posibles resultados del experimento aleatorio.

Evento: es un conjunto formado por los elementos del espacio muestral con alguna
característica similar.

Como los eventos son conjuntos de le puede aplicar las operaciones y propiedades de la
teoría de conjunto.

Evento simple:
Evento compuesto:
Evento imposible:
Evento seguro:
Unión de Eventos:
Intersección de Eventos:
Eventos mutuamente excluyentes:

EJEMPLO 0: En un campeonato de futbol se clasifican 4 equipos a las finales: Nacional,


Junior, Millonarios, Cali. Se desea definir los tres primeros lugares.

a) Determine el espacio Muestral.


b) Determine dos eventos y clasifíquelos.

1.2 TÉCNICAS DE CONTEO:

En muchos experimentos aleatorios, el definir el espacio muestral resulta algo dispendioso


y su proceso puede generar errores a la hora de identificar los eventos. Por esta razón, es
necesario establecer ciertas técnicas que permitan establecer el número de elementos del
espacio muestral y de los eventos relacionados, a partir del as características de la muestra
en el experimento.

1.2.1 PRINCIPIO DE MULTIPLICACIÓN:

Es una técnica de conteo que se aplica en experimentos aleatorios en los cuales:

 Importa el orden en que se escriben los elementos y/o estos se pueden repetir.
 Existen varias fases para realizar algún experimento y en cada fase hay diferentes
maneras de hacerlo.

#S= N1 x N2 x N3 x…xNn Poblaciones distintas

EJEMPLO 1: Si hay 3 candidatos para la alcaldía y 5 para la gobernación, los dos


cargos se pueden ocupar de 3x5=15 formas

Si en un experimento aleatorio se tiene una población de N y se debe tomar una muestra de


tamaño n y además, la muestra tiene orden y repetición entonces: #S=Nn

EJEMPLO 2: una persona quiere hacer una rifa de tres cifras ¿cuantas boletas debe
imprimir?: N=10 n=3 #S=103= 1000 boletas

En este ejemplo también se puede aplicar el modelo #S= N1 x N2 x N3 x…xNn

#S= 10x10x10=1000 donde N1= son las opciones que tiene el primer número de la boleta.
Al igual ocurre con N2 y N3.

Ejercicios:

1-En Colombia las placas de los automóviles, tienen tres letras (de un alfabeto de 26)
seguida de tres dígitos. La cantidad de placas sin letras ni números repetidos que comienzan
por vocal y son impares es:

2-Un examen consta de 4 preguntas, hay que dar respuesta a solo 3 de las 4 preguntas,
¿cuantos exámenes de diferente contenido habrá que corregir como máximo?
1.2.2 PERMUTACION

Una permutación es una técnica de conteo en la cual es importante el orden en el que se


escriben los elementos de cada punto muestral, pero no hay repetición.

𝑁!
NPn= Cuando N=n entonces NPn =N!
(𝑁−𝑛)!

Además también se establece el siguiente modelo matemático cuando de n objetos, de los


que n1 son iguales, n2 son iguales,….es

𝑛!
NPn=
𝑛1!𝑥𝑛2𝑥𝑛3𝑥…

EJEMPLO 3:

Hallar la cantidad de maneras en que pueden obtener las medallas de oro, plata y bronce 10
ciclista que participan en un campeonato.

𝑁! 𝑁! 10!
NPn=
(𝑁−𝑛)!
: N=10 n=3 NPn=
(𝑁−𝑛)!
= (10−3 )!
= 10!
7!
= 720

EJEMPLO 4:

El número de permutaciones que se pueden dar de las letras “statistics” es:

𝑛! 10!
Tenemos que s=3 t=3 i=2 a=1 y c=1 NPn= = = 50.400
𝑛1!𝑥𝑛2𝑥𝑛3𝑥… 3!∗3!∗2!∗1!∗1!

Ejercicios:

1- Con los dígitos primos se quiere formar números de 3 cifras.


2- De cuantas maneras se puede sentar 10 personas en un banco si hay cuatro sitios
disponibles.
3- Hay que colocar a 5 hombres y a 4 mujeres en una fila de modo que las mujeres ocupen
los lugares pares ¿de cuantas maneras pueden hacerse?
1.2.3 Combinatoria.

Una combinación es una técnica de conteo en la cual no importa el orden y no hay


repetición en los elementos de un punto muestral.

𝑁!
NCn=
(𝑁−𝑛)!∗𝑛!

La diferencia entre una permutación y una combinatoria es que en la primera el interés


recae en contar las posibles selecciones y todos los arreglos de estas, mientras que en la
segunda el interés se centra en contar el número de selecciones diferentes.

EJEMPLO 5:

Se va elegir una comisión de 5 estudiantes de administración de un grupo de 11 ¿de


cuantas formas se les puede seleccionar?.
𝑁! 11!
NCn=
(𝑁−𝑛)!∗𝑛!
= (11−5)!∗5! = 462

EJEMPLO 6:

De entre 5 estudiantes de administración y 7 de contaduría hay que construir una comisión


de dos estudiantes de administración y 3 de contaduría. ¿ de cuantas formas podrá hacerse
si: a) todos son elegibles, b) un estudiantes de contaduría en particular ha de estar en esa
comisión y c) dos estudiantes de administración tienen prohibido pertenecer a la comisión.

𝑁! 5! 𝑁! 7!
a) NCn=
(𝑁−𝑛)!∗𝑛!
= (5−2)!∗2! = 10 NCn=
(𝑁−𝑛)!∗𝑛!
= (7−3)!∗3! = 35
# De comisión =10*35=350

𝑁! 5! 𝑁! 6!
b) NCn=
(𝑁−𝑛)!∗𝑛!
= (5−2)!∗2! = 10 NCn=
(𝑁−𝑛)!∗𝑛!
= (6−2)!∗2! = 15

# De comisión =10*15=150
𝑁! 3! 𝑁! 7!
c) NCn=
(𝑁−𝑛)!∗𝑛!
= (3−2)!∗2! = 3 NCn=
(𝑁−𝑛)!∗𝑛!
= (7−3)!∗3! = 35
# De comisión =3*35=105
Ejercicios:
1-Con 7 consonantes y 5 vocales, ¿cuantas palabras se pueden formar que tengan 4
consonantes distintas y 3 vocales distintas? Se admiten palabras sin significado.

2-cinco senadores de la republica serán enviados a una cumbre latinoamericana. El


presidente del senado envía al presidente de la republica una lista que contiene los nombres
de 10 hombres y 4 mujeres. Si el presidente de la republica decide que va a enviar 3
hombres y 2 mujeres. ¿De cuantas maneras puede seleccionar el grupo de senadores que
asistirá a la cumbre?

1.3 PROBABILIDAD Y ANALISIS COMBINATORIO.

Enfoque clásico: En un experimento aleatorio la probabilidad de que un evento ocurra es:

P (E)= #E/#S Donde #E es la cantidad de puntos muéstrales del evento E y #S es la


cantidad de puntos en el espacio muestral S.

Propiedades de la probabilidad de Eventos:

A partir de la definición de probabilidad se establece que:

 La probabilidad de un evento está en el intervalo cerrado [0,1].


 La probabilidad de un evento seguro es 1
 La probabilidad de un evento imposible es 0.
 Si los eventos A y b son mutuamente excluyentes, entonces, P(AUB)= P(A)+P(B).
 Si los eventos de A y B no son mutuamente excluyentes, entonces, P(AUB)=
P(A)+P(B)- P(A ∩ B).
 La probabilidad de que no suceda A es: P’(A)=1-P(A).

EJEMPLO 7:
En una bolsa hay 5 balotas numeradas del 5 al 9. Se extraen dos balotas, una detrás de otra
sin devolverlas a la bolsa. Se anotan los resultados formando números de dos cifras. ¿Cuál
es la probabilidad de formar un número múltiplo de 4 o formar un número mayor que 87?.
El espacio muestral está dado por #S=5*4=20 (utilizando el principio de multiplicación)
#S=56,57,58,59,65,67,68,69,75,76,78,79,85,86,87,89,95,96,97,98
Eventos: E=[x/x es múltiplo de 4] = [56, 68 ,76 96]
F= [x/x mayor que 87] = [89,95, 96, 97, 98]

No son mutuamente excluyentes puesto que (E ∩F)= 96


 P (EUF)= P (E)+P (F)- P (E ∩ F). = 4/20 +5/20- 1/20= 8/20=2/5=0.4=40%

EJEMPLO 8:
Una bolsa contiene 4 bolas blancas y 2 bolas negras; otra contiene 3 bolas blancas y 5
bolas negras. Si se saca una bola de cada bolsa hallar la probabilidad de que:
a) Ambas sean blancas b) ambas sean negras y c) una sea blanca y la otra negra.

a) (4/6)*(3/8)=1/4 =25%
b) (2/6)*(5/8)=5/24 =21%
c) (4/6)*(3/8)+(2/6)*(5/8)=13/24=54%
Este último valor también se puede determinar aplicando “La probabilidad de que no
suceda A es: P’(A)=1-P(A). = 1-1/4-5/24=13/14

Ejercicios:

1-se escogen al azar dos números de teléfono y se tiene en cuenta la última cifra de cada
uno, determinar las siguientes probabilidades:
a-que las dos cifras sean iguales
b-que su suma sea 11
c-que su suma sea mayor que 4 menor que 8

2-En una universidad, el 30% de los alumnos hablan inglés, el 10%, francés y el 8% los dos
idiomas. ¿Cuál es la probabilidad de encontrar alumnos que hablen alguna lengua
extranjera?
3-hallar la probabilidad de obtener un total de 7 puntos al lanzar dos dados:
a-un solo lanzamiento
b-en dos lanzamientos.

1.3.1Probabilidad condicional
La probabilidad de un evento A, cuando se sabe que ha ocurrido un evento B, se denomina
Probabilidad condicional. Se simboliza P(A/B) y se lee la probabilidad de A dado B.
Para calcular la probabilidad de un evento dado que ha ocurrido otro, se tiene una
restricción en el espacio muestral. El nuevo espacio muestral será formado por el número
de elementos del evento que sucedió primero:
𝑃(𝐴∩𝐵)
P(A/B)=
𝑃(𝐵)
II. DISTRIBUCIONES MUESTRALES

Uno de los propósitos de la estadística inferencial es estimar las características


poblacionales desconocidas, examinando la información obtenida de una muestra, de una
población. El punto de interés es la muestra, la cual debe ser representativa de la población
objeto de estudio. Se seguirán ciertos procedimientos de selección para asegurar de que las
muestras reflejen observaciones a la población de la que proceden, ya que solo se pueden
hacer observaciones probabilísticas sobre una población cuando se usan muestras
representativas de la misma.

Distribuciones Muéstrales
DISTRIBUCIONES MUESTRALES
Medidas Población Muestra
M aritmética µ 𝑥̅
Varianza 𝜎2 𝑠2
Desviación típica 𝜎 s
Tamaño N n

2.1 Muestras aleatorias con y sin reemplazo

µx= media de todos las medias muéstrales

𝜎𝑥 = Desviación típica de todas las medias muéstrales

M= Número posible de muestras.

𝑁! 𝑁!
NCn= sin reposición NPn= NPn =N! con reposición.
(𝑁−𝑛)!∗𝑛! (𝑁−𝑛)!

∑ 𝑋̅𝑖 ∑(𝑥𝑖 −𝜇)2 𝜎


µx= µ= 𝜎𝑥 = √ = con reemplazo
𝑀 𝑀 √𝑛

𝜎 𝑁−𝑛
𝜎𝑥 = ∗√ Sin reemplazo
√𝑛 𝑁−1
EJEMPLO 9:
Se eligen muestras ordenadas de tamaño 2, con reemplazo, de la población de valores 7,3 y
5. Encuentre:
a) µ, la media poblacional.
b) 𝜎, la desviación estándar poblacional.
c) µx, la media de la distribución muestral de medias
d) 𝜎𝑥 =, la desviación estándar de la distribución muestral de medias.

a) µ= (7+3+5)/3= 5 media poblacional

(7−5)2 +(3−5)2 +(5−5)2 8


b) 𝜎=√ = √ = 1.63
3 3

c) A continuación se listan los elementos de la distribución muestral de la media y la


correspondiente distribución de frecuencias.

(3,3) (3,5) (3,7) (5,3) (5, 5) (5, 7) (7, 3) (7, 5) (7, 7)


3 4 5 4 5 6 5 6 7
3→1 4→2 5→3 6→2 7→1

µx=( 3*1+4*2+5*3+6*2+7*1)/9= 45/9=5

1∗(3−5)2 +2∗(4−5)2 +3∗(5−5)2 +2∗(6−5)2 +1∗(7−5)2 12


d) 𝜎𝑥 = √ = √ =1.15
9 9

𝜎 1.63
𝜎𝑥 = = = 1.15
√𝑛 √2

EJEMPLO 10:
Se eligen muestras ordenadas de tamaño 2, sin reemplazo, de la población de valores 7,3 y
5. Encuentre:
a) µ, la media poblacional.
b) 𝜎, la desviación estándar poblacional.
c) µx, la media de la distribución muestral de medias
d) 𝜎𝑥 =, la desviación estándar de la distribución muestral de medias.

“Hoy, la estadística está considerada como la teoría de la información, no sólo como


función descriptiva, sino con el objeto básico de hacer estimaciones acerca de los valores
estadísticos de la población o en la comprobación de hipótesis de aquellas características
que han sido investigadas”.1

1 Ciro Martínez Bercandino


EJEMPLO 10:

Tartus Industries cuenta con siete empleados de producción (a quienes se les considera la
población). En la tabla 8-2 se incluyen los ingresos por hora de cada uno de ellos.

Empleado Ingreso por hora Empleado Ingreso por hora


Joe $7 Jan $7
Sam 7 Art 8
Sue 8 ted 9
Bob 8

1. ¿Cuál es la media de la población?


2. ¿Cuál es la distribución muestral de la media de muestras de tamaño 2?
3. ¿Cuál es la media de la distribución muestral de la media?
4. ¿Qué observaciones es posible hacer sobre la población y la distribución muestral de la
media?.

1- µ=($7+7+8+8+7+8+9)/7 =$7.71
𝑁!
2- NCn=
(𝑁−𝑛)!∗𝑛!
=21.
Las 21 medias muestrales que se pueden tomar de la población:

Por lo tanto la distribución muestral de la media con n=2 es:


3- ¿Cuál es la media de la distribución muestral de la media?

(𝑠𝑢𝑚𝑎 𝑑𝑒 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 𝑚𝑒𝑑𝑖𝑎𝑠) 7∗3+7.5∗9+8∗6+8.50∗3


µx= = = 7.71
(𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑎) 21

4. ¿Qué observaciones es posible hacer sobre la población y la distribución muestral de la


media?

a-La media de las medias de las muestras es exactamente igual a la media de la población.

b-La dispersión de la distribución muestral de la media es más estrecha que la distribución


poblacional.

c-La distribución muestral de la media suele tener forma de campana y se aproxima a la


distribución de probabilidad normal.

EJEMPLO 11:

Las alturas de 3000 estudiantes de la universidad de la Guajira están normalmente


distribuidas con media de 1.72 mts y desviación típica de 0.076 mts. Si se toman 80
muestras de 25 estudiantes cada una. ¿Cuáles serán la media y la desviación típica
esperadas de la resultante distribución de muestreo de medias, si el muestreo se hizo (a) con
b) sin reposición.

µ= µx =1.72mts 𝜎 = 0.076𝑚𝑡𝑠

∑(𝑥𝑖 −𝜇)2 𝜎 𝜎 0.076


𝜎𝑥 = √ = Con reemplazo = = 0.0152𝑚𝑡𝑠
𝑀 √𝑛 √𝑛 √25

𝜎 𝑁−𝑛 𝜎 𝑁−𝑛 0.076 3000−25


𝜎𝑥 = ∗√ Sin reemplazo𝜎𝑥 = ∗√ = ∗√
√𝑛 𝑁−1 √𝑛 𝑁−1 √25 3000−1
Teoría del límite central.

Se cumple, cuando independientemente de la población origen, la distribución de las


medias aleatorias se aproximan a una distribución normal a medida que el tamaño de la
muestra crece. Se podrá decir también, que si las muestras provienen de una población que
no es normal, es de importancia tener en cuenta el tamaño de la muestra, si el tamaño
muestral es pequeño, la distribución obtenida con sus medias muéstrales tendrán un
comportamiento similar al de la población de donde se extrajeron. Por el contrario, si el
tamaño muestral es grande, el comportamiento de estas medias muéstrales será igual al de
una distribución normal, independientemente de la población de donde fueron extraídas.

En su forma más simple, el teorema indica que si n variables aleatorias independientes


tienen varianza infinitas, su suma, cuando, se le expresa en medida estándar, tiende a estar
normalmente distribuida cuando n tiende a infinito. Se debe observar que ninguna de las
varianzas sea mayor comparada con el total.

2.2 Distribución Muestral de Medias.

De acuerdo con el teorema anterior, la variante estadística Z para distribuciones de medias


muestrales será:
𝑥̅ − 𝜇
𝑧=𝜎
⁄ 𝑛

En aquellos casos de poblaciones finitas, es decir, cuando se da información sobre el


tamaño poblacional, y cuando el tamaño de la muestra es mayor del 5% de la población, se
puede aplicar el factor de corrección, representado de diferentes maneras. (con reemplazo)

𝑥̅ − 𝜇
𝑧=
𝜎 𝑁−𝑛
( ) ∗ √𝑁 − 1
√𝑛
EJEMPLO 11:

La altura media de 400 alumnos de un plantel de secundaria es de 1,50 mts, y su desviación


típica es de 0,25 mts. Determinar la probabilidad de que en una muestra de 36 alumnos, la
media sea superior a 1,60 mts.
𝑥̅ − 𝜇 1.60 − 1.50 0.10
𝑍=𝜎 = = = 2.40
⁄ 𝑛 0.25⁄ 0.25/6
√ √36
Z(2.40) 0.4918 p =0.50-0.4918 =0.0082= 0.82%

EJEMPLO 13.

Un fabricante de cierto champú para el cabello, distribuye el tamaño profesional de su


producto en 100 salones de belleza de Valledupar, se ha determinado que el consumo
promedio de su producto es de 2.800 cojines mensuales, con desviación estándar de
280cojines. Si se toma una muestra probabilística de 36 salones. ¿Cuál es la probabilidad de
que el consumo promedio en un mes sea inferior a 2.700?

µ=2.800 𝜎=280 n=36 𝑥̅ =2.700 p(x<2.700) =?

𝑥̅ − 𝜇 2.700 − 2.800 −100


𝑍=𝜎 = = = −2.14
⁄ 𝑛 280⁄ 280/6
√ √36
Z(-2.14) 0.4838 p =0.50-0.4838 =0.0162= 1.62%%

EJEMPLO 14.

Una siderúrgica está produciendo actualmente cables para suspensión de puentes. La


característica más importante de este producto es su resistencia, el peso que puede soportar
antes de que se reviente. Por experiencias pasadas se sabe que el promedio de la resistencia
es de 6 toneladas con desviación típica de 3/4 de toneladas. Para efectos de control, se
selecciona una muestra de 9 cables y se adopta la siguiente regla de decisión.

Si la resistencia promedio está por encima de 6.5 toneladas o por debajo de 5.5, se suspende
el proceso. Si esta entre entre 5.5 y 6.5 se deja tal y como está.

a) ¿Cuál es la probabilidad de tener el proceso, si la media de la producción es aun 6


toneladas?
b) ¿Cuál es la probabilidad de tener el proceso, si la media de la producción no es 6
tonelada sino 6.18 toneladas?
c) ¿Cuál es la probabilidad de continuar el proceso, si el promedio es en realidad de 6.4
toneladas
d) ¿si es de 5.8 toneladas?

Solución:

6   3  0,75 n9


4

Si 6,5  x  5,5 Se suspende el proceso

Si 5,5  x  6,5 Se deja tal y como está

a) Siendo =6 ¿Cuál es la probabilidad de detener el proceso?

6,5  6 0,5 3 1,5


Z    2
0,75 0,75 0,75
3
5,5  6  0,5 3  1,5
Z     2
0,75 0,75 0,75
3

Z  2  A 0,4772  ; Z   2  A 0,4772 

0,4772  0,4772  0,9544; ó A 0,4773  P6,5  x  5,5  4,56%

P  1  0,9544  0,0456  4,56%

b) Siendo   6,18 ¿Cuál es la probabilidad de detener el proceso?

6,5  6,18 0,32 3 0,96 5,5  6,18  0,68 3  2,04
Z     1,28 Z      2,72
0,75 0,75 0,75 0,75 0,75 0,75
3 3
Z  1,28  A 0,3997  ; Z   2,72  A 0,4967 

P  0,3997  0,4967  0,8964

P  1  0,8964  0,1036  10,36% P6,5  x  5,5  10,36%

c) Siendo   6,4 ¿Cuál es la probabilidad de continuar el proceso?

6,5  6,4 0,13 0,3


Z     0,40
0,75 0,75 0,75
3

5,5  6,4  0,9 3  2,7


Z      3,60
0,75 0,75 0,75
3

Z  0,40  A 0,1554  ; Z   3,60  A 0,4998  P5,5  x  6,5  65,52%

P  0,1554  0,4998  0,6552  65,52%

d) Siendo   5,8 ¿Cuál es la probabilidad de continuar el proceso?

6,5  5,8 0,7 3 2,1


Z     2,80
0,75 0,75 0,75
3

5,5  5,8  0,3 3  0,9


Z      1,20
0,75 0,75 0,75
3

Z  2,80  A 0,4974  ; Z   1,20  A 0,3849  P5,5  x  6,5  88,23%

P  0,4974  0,3849  0,8823  88,23%

EJERCICIOS:

1-En una prueba de aptitud la puntuación media de los estudiantes es de 72 puntos y la


desviación estándar es de 8 puntos. ¿Cuál es la probabilidad de que dos grupos de
estudiantes, formados de 28 y 36 estudiantes, respectivamente, difieran en su puntuación
media en:
a) 3 o más puntos
b) 6 o más puntos
c) Entre 2 y 5 puntos
2-Ciertos tubos fabricados por una compañía tienen una duración media de 900 horas
y una desviación típica de 70 horas. Hallar la probabilidad, al seleccionar al azar 36
tubos, que tengan una duración media entre 870 y 925 horas.

3-Se sabe que en cierta ciudad, los clientes de los restaurantes gastan en promedio $32.900
en comida, con una desviación estándar de $1.500. Si se pide cada uno de los 50
restaurantes que seleccionen al azar las cuentas de 100 personas y que informen sobre el
consumo medio de esas 100 personas. ¿De cuántos restaurantes debe esperarse que
informen sobre cuentas promedios, superiores $33.259,30?

2.3 Distribución muestral de proporciones p.

En el análisis de una característica cualitativa o atributo, se emplea la proporción de éxitos


y no el número de éxitos como en la distribución binomial.

Una población binomial está estrechamente relacionada con la distribución muestral de


proporciones; una población binomial es una colección de éxitos y fracasos, mientras que
una distribución muestral de proporciones contiene las posibilidades o proporciones de
todos los números posibles de éxitos en un experimento binomial, y como consecuencia de
esta relación, las afirmaciones probabilísticas referentes a la proporción muestral pueden
evaluarse usando la aproximación normal a la binomial, siempre que np >5 y n(1-p) >5.
Cualquier evento se puede convertir en una proporción si se divide el número obtenido
entre el número de intentos.

𝑝−𝑃 𝑃𝑄 𝑃𝑄 𝑁−𝑛
Simbología: 𝑧= 𝜎𝑝 = √
𝑛
𝜎𝑝 = √
𝑛
∗√
𝑁−1
𝑃𝑄

𝑛
Sin reemplazo
P=P-0.5/n factor de corrección
Q=P-1

EJEMPLO 15:
Se ha determinado que 60% de los estudiantes de una universidad grande fuman cigarrillos.
Se toma una muestra aleatoria de 800 estudiantes. Calcule la probabilidad de que la
proporción de la muestra de la gente que fuma cigarrillos sea menor que 55%.

Datos:
0.55−0.60
n=800 P=0.60 p=0.55 𝑧 = =2.89 Z=0.4981 P=0.5-0.4981=0.0019=0.19%
0.60∗0.40

800

La interpretación en esta solución, estaría enfocada a la proporción de la muestra, por lo


que diríamos que la probabilidad de que al extraer una muestra de 800 estudiantes de esa
universidad, la proporción de estudiantes que fuman cigarrillos sea menor al 55% es del
0.19%.

EJEMPLO 16:
Se tiene que el 4% de las piezas producidas por ciertas maquinas es defectuosa, ¿cuál es la
probabilidad de que en un grupo de 200 piezas, el 3% más sea defectuosa.

0.03−0.04
𝑧= =-0.71
√0.40∗0,60
200
Z ( 0,2611) p=0,2611+0,5=0,7611 =76,11%

EJEMPLO 17.
Por cada 50 sindicatos del país 23 no están de acuerdo con el comercio con la china
continental; ¿cuál es la probabilidad de que en una encuesta a 100 sindicatos muestre que
más del 52% tenga la misma posición?

0,52−0,46
𝑧= =1.20
0.46∗0,54

100
Z (0.3849) p=0,50-0,3849=0,1151 =11,51%

EJERCICIOS:

1) se ha determinado que el 65% de los estudiantes universitarios de Bucaramanga


prefieren los cuadernos marca profesional. ¿ cuál es la probabilidad de que en una muestra
de 100 universitarios de dicha ciudad, encontremos que:

a) como máximo el 68% sea usuarios de este tipo de cuadernos


b) exactamente 66% sean usuarios

2) se sabe que el 25% de los estudiantes de un colegio usan anteojos. ¿cuál es la


probabilidad de que 8 o menos usen anteojos en una muestra de 36 estudiantes?

3) Un nuevo tratamiento con rayo láser asegura su eficacia en el 90% de los casos. Si se
selecciona una muestra de 40 enfermos, ¿qué probabilidad hay que se presente una
diferencia mayor del 8% en cuanto a su eficacia?
2.4 Distribución de diferencia entre dos medias Muestrales.

Suponga que se tienen dos poblaciones distintas, la primera con media µ1 y desviación
estándar σ1, y la segunda con media µ2 y desviación estándar σ2. Más aún, se elige una
muestra aleatoria de tamaño n1 de la primera población y una muestra independiente
aleatoria de tamaño n2 de la segunda población; se calcula la media muestral para cada
muestra y la diferencia entre dichas medias. La colección de todas esas diferencias se llama
distribución muestral de las diferencias entre medias o la distribución muestral del
estadístico 𝑥̅ 1 − 𝑥̅ 2.

Se puede demostrar que la media de las diferencias de todos los pares de medias muestrales
posibles, es igual a la diferencia entre las medias poblacionales. 𝜇𝑥̅ −𝑦̅ = 𝜇𝑥̅ − 𝜇𝑦̅ .

La desviación típica de las diferencias entre los pares de medias muestrales se simboliza
2
∑[(𝑥𝑖
̅ −𝑦𝑖
̅̅̅)+(𝜇
̅ 𝑥 −𝜇
̅ 𝑦 )] 𝜎 2 𝜎𝑦 2
por: 𝜎𝑥̅ −𝑦̅ =√ 𝜎𝑥̅ −𝑦̅ =√ 𝑥 +
𝑀 𝑛1 𝑛2

(𝑥̅1 − 𝑥̅2 ) − (𝜇̅1 − 𝜇̅2 )


𝑧=
2 𝜎 2
√𝜎𝑥 + 𝑦
𝑛1 𝑛2

EJEMPLO 18

En un restaurante, el consumo medio por desayuno es de $4.980, con una desviación


estándar de $950. En un segundo restaurante las correspondientes cifras son $4.238 y $820.
Si se eligen al azar 80 boletas de pago del primer restaurante y una muestra aleatoria de 60
del segundo, ¿Cuál es la probabilidad de que la diferencia entre los consumos medios de
ambas muestras sea mayor que $1.000 en valor absoluto?

µ1=4.980 µ2=4.238 σ1=950 σ2=820 n1=80 n2=60


(1000)−(742)
𝑧= 2 2
= 1.72 → 0.4572
√950 +820
80 60

(−1000) − (742)
𝑧= = −11.62 → 0.50
9502 820 2

80 + 60
A=0.4572+0.500=0.9572

P=1-0.9272=0.0428=4.28%

EJEMPLO 18
Se prueba el rendimiento en km/L de 2 tipos de gasolina, encontrándose una desviación
estándar de 1.23km/L para la primera gasolina y una desviación estándar de 1.37km/L para
la segunda gasolina; se prueba la primera gasolina en 35 autos y la segunda en 42 autos.
a) ¿Cuál es la probabilidad de que la primera gasolina de un rendimiento promedio mayor
de 0.45km/L que la segunda gasolina?
b) ¿Cuál es la probabilidad de que la diferencia en rendimientos promedio se encuentre
entre 0.65 y 0.83km/L a favor de la gasolina 1?.

En este ejercicio no se cuenta con los parámetros de las medias en ninguna de las dos
poblaciones, por lo que se supondrán que son iguales

1 = 1.23 Km/L 2 = 1.37 Km/L n1 = 35 autos n2 = 42 autos

(0.45)−(0)
a) 𝑧= 2 2
=1.52→0.4357
√1.23 +1.37
35 42

P=0.5-0.4357=0.0643=6.43%

b) 0.65 x1x20.83

(0.65) − (0)
𝑧= = 2.19 → 0.4857
2 2
√1.23 + 1.37
35 42
(0.83) − (0)
𝑧= = 2.80 → 0.4974
2 2
√1.23 + 1.37
35 42

P=0.4974-0.4857=0.0117=1.17%
EJERCICIOS:

1- Dos marcas, A y B de tabletas antiácidas efervescentes registran el mismo promedio de


disolución en agua, con desviación estándar de 12 segundos para la marca A y 24 segundos para B.
Suponiendo que el tiempo de disolución esté normalmente distribuido, ¿cuál es la probabilidad de
que, con una muestra de 36 tabletas de cada marca, las tabletas B registren un promedio de tiempo
de disolución, cuando menos 5 segundos más rápido que A?

2- Un especialista en genética ha detectado que el 26% de los hombres y el 24% de las


mujeres de cierta región del país tiene un leve desorden sanguíneo; si se toman muestras de
150 hombres y 150 mujeres, determine la probabilidad de que la diferencia muestral de
proporciones que tienen ese leve desorden sanguíneo sea de:

a) Menos de 0.035 a favor de los hombres.


b) Entre 0.01 y 0.04 a favor de los hombres.

3- El sueldo mensual de los licenciados en educación en Bogotá es de $920.000 como promedio,


con una desviación estándar de $31.500. En la misma ciudad, el salario mensual de los economistas
en la administración pública es de $925.000, con una desviación estándar de $52.500. Se toma una
muestra aleatoria de 100 de cada población. ¿Cuál es la probabilidad de que la diferencia en las
asignaciones B sea superior a las de A en $12.510?

2.5 Distribución de diferencia entre dos proporciones Muestrales P1-P2.

Muchas aplicaciones involucran poblaciones de datos cualitativos que deben compararse


utilizando proporciones o porcentajes.

La media de las diferencia entre dos medias proporcionales, se simboliza; indistintamente


por: µp1-µp2=P1-P2.

La variante estadística, estará dad en la misma forma que fue presentada para diferencias entre
medias muestrales:
(𝑝1 − 𝑝2 ) − (𝑃1 − 𝑃2 )
𝑧=
𝑃1∗ 𝑄1 𝑃2 ∗ 𝑄2
√ +
𝑛1 𝑛2
EJEMPLO 19:
Los hombres y mujeres adultos radicados en la ciudad de Bogotá difieren en sus opiniones
sobre la promulgación de la pena de muerte para personas culpables de asesinato de niños.
Se cree que el 12% de los hombres adultos están a favor de la pena de muerte, mientras que
sólo 10% de las mujeres adultas lo están. Si se pregunta a dos muestras aleatorias de 100
hombres y 100 mujeres su opinión sobre la promulgación de la pena de muerte para
asesinos de niños, determine la probabilidad de que el porcentaje de hombres a favor sea al
menos 3% mayor que el de las mujeres.
Datos: P1 = 0.12 P2 = 0.10 n1 = 100 n2 = 100 p1-p2=0.03

(𝑝1 − 𝑝2 ) − (𝑃1 − 𝑃2 ) (0.03) − (0.12 − 0.10)


𝑧= = = 0.23 → 0.0910
𝑃 𝑄 𝑃 ∗ 𝑄2
√ 1∗ 1 + 2 √0.12 ∗ 0.88 + 0.10 ∗ 0.90
𝑛1 𝑛2 100 100

P=0.5-0.0910=0.409=40.9%

EJEMPLO 20:
Consideremos dos máquinas que producen un determinado artículo; la primera produce por
término medio un 14% de artículos defectuosos, en tanto que otra, produce el 20% de
artículos defectuoso; si se obtienen muestras de 200 unidades en la primera y 100 unidades
en la segunda, ¿cuál es la probabilidad de que difiera A de B en 8% o más?

Datos: P1 = 0.14 P2 = 0.20 n1 = 200 n2 = 100 p1-p2=0.08

(0.08) − (0.14 − 0.20) 0.14


𝑍= = = 2.98 → 0.4986
√2.202−03
√0.14 ∗ 0.86 + 0.2 ∗ 0.8
200 100

P=0.5-0.4986=0.0014=0.14%

EJEMPLO 21:

Ciertas encuestas a televidentes, revelan que el 25% de los hombres y 33% de las mujeres
de clase media ven la telenovela de las 11 y ½ de la mañana. ¿Cuál es la probabilidad de
que en dos muestras aleatorias de 150 hombres y 100 mujeres respectivamente,
pertenecientes a dicho estrato social, se encuentre que la proporción de hombres que han
visto el programa sea igual o mayor que la proporción de mujeres?

P1 = 0.25 P2 = 0.33 n1 = 150 n2 = 100 p1-p2=0


(0) − (0.25 − 0.33) 0.08
𝑍= = = 1.36 → 0.4131
0.05883
√0.25 ∗ 0.75 + 0.33 ∗ 0.67
150 100

P=0.50-0.4131=0.0869=8.69%

EJERCICIOS:

1) Un especialista en genética ha detectado que el 26% de los hombres y el 24% de las


mujeres de cierta región del país tiene un leve desorden sanguíneo; si se toman muestras de
150 hombres y 150 mujeres, determine la probabilidad de que la diferencia muestral de
proporciones que tienen ese leve desorden sanguíneo sea de:
a) Menos de 0.035 a favor de los hombres.
b) Entre 0.01 y 0.04 a favor de los hombres.

2) Es sabido que los porcentajes de familias con ingreso superior a $570.000 en las
ciudades A y B es de 25% y 20%, respectivamente. Se seleccionan al azar dos muestras de
100 familias en cada una de las dos ciudades y se comparan las proporciones muestrales de
las familias con ingreso superior a $570.000. ¿Cuál es la probabilidad de que la proporción
muestral correspondiente a la ciudad B sea:

a) Mayor que la de A en 3% o más?


b) Menor que la de A en 3% o más?

3) En una agencia de empleo se sabe que por cada 100 personas que lo solicitan, 50,
además de ser bachilleres, tienen alguna experiencia sobre el trabajo a desarrollar. Se
extraen 2 muestras de la misma población, en forma independiente de tamaño 36 cada una.
¿Cuál es la probabilidad de que las dos muestras difieran en 8 o más personas que tengan
alguna experiencia sobre el trabajo?
III ESTIMACION DE PARAMETROS.

El objetivo principal de la estadística inferencial es la estimación, esto es que mediante el


estudio de una muestra de una población se quiere generalizar las conclusiones al total de la
misma. Como vimos en la sección anterior, los estadísticos varían mucho dentro de sus
distribuciones muestrales, y mientras menor sea el error estándar de un estadístico, más
cercanos serán unos de otros sus valores.

Existen dos tipos de estimaciones para parámetros; puntuales y por intervalo. Una
estimación puntual es un único valor estadístico y se usa para estimar un parámetro. El
estadístico usado se denomina estimador. Una estimación por intervalo es un rango,
generalmente de ancho finito, que se espera que contenga el parámetro.

Una estimación puntual de un parámetro q es un sólo número que se puede considerar


como el valor más razonable de q. La estimación puntual se obtiene al seleccionar una
estadística apropiada y calcular su valor a partir de datos de la muestra dada. La estadística
seleccionada se llama estimador puntual de q.

Estimación por Intervalos


Un estimado puntual, por ser un sólo número, no proporciona por sí mismo información
alguna sobre la precisión y confiabilidad de la estimación. Por ejemplo, imagine que se usa
el estadístico x para calcular un estimado puntual de la resistencia real a la ruptura de
toallas de papel de cierta marca, y suponga que x = 9322.7. Debido a la variabilidad de la
muestra, nunca se tendrá el caso de que x = u. El estimado puntual nada dice sobre lo
cercano que esta de u. Una alternativa para reportar un solo valor del parámetro que se esté
estimando es calcular e informar todo un intervalo de valores factibles, un estimado de
intervalo o intervalo de confianza (IC).

3.1 Encontrar z a partir de un nivel de confianza

Existen varias tablas en las cuales podemos encontrar el valor de z, según sea el área
proporcionada por la misma

Ejemplo 1:
Encuentre el valor de z para un nivel de confianza del 95%.→0.95→0.475→1.96 (valor
encontrado en la tabla)

Para los valores de 96%, 97%... se utilizara el proceso de interpolación la cual consiste en
fijar tres puntos en la tabla con los valores correspondientes. Así.

x1 x x2
0.4798 0.48 0.4803
fx1 fx fx2
2.05 ¿? 2.06
𝑓𝑥2 − 𝑓𝑥1 2.06 − 2.05
𝑓(𝑥) = 𝑓𝑥1 + ∗ (𝑥 − 𝑥1 ) = 2.05 + ∗ (0.48 − 0.4798)
(𝑥2 − 𝑥1 ) 0.48.03 − 0.4798

𝑓(𝑥) = 2,054 →Nivel de confianza del 96%

Estos valores se consiguen fácilmente pero es importante conocer la herramienta de cómo


llegar a ellos.

N.S 90% 91% 92% 93% 94% 95% 96% 97% 98% 99%
Z 1.645 1.96 2.054

3.2 Estimación para la media.

𝑥̅ −𝑢
Sabemos que la distribución muestral de media 𝑧=𝜎 , ahora desconocemos el
⁄ 𝑛

parámetro y se quiere estimar por medio de la media muestral, por lo tanto al despejar a
𝒛𝝈
̅±
"𝑢" del modelo anterior nos queda: 𝒖 = 𝒙
√𝒏

Ejemplo 2 : La cooperativa Asotranba (con recorrido Villanueva –Riohacha- Villanueva) planea


comprar una flota de nuevos vehículos para sus operaciones. La decisión depende de si el
rendimiento del auto es en consideración es por lo menos 27.5 millas por galón de gasolina. Los 36
carros que prueba la cooperativa reportan una media de 25.6 millas por galón. Con una desviación
estándar de 3.5 MPG. A un nivel de confianza de 99%, ¿qué aconsejaría a la cooperativa que
hiciera?
n=36; 𝑥̅ = 25.6𝑀𝑖𝑙𝑙𝑎𝑠 𝑧 = 2.575 𝜎 = 3.5𝑀𝑃𝐺 𝑢 = 27.5𝑀𝑖𝑙𝑙𝑎𝑠

𝟐.𝟓𝟕𝟓∗𝟑.𝟓
𝑢 = 25.6 ± = 25.6 ± 1.50 → 𝟐𝟒. 𝟏 ≤ 𝒖 ≤ 𝟐𝟕. 𝟏
√𝟑𝟔

Respuesta: la cooperativa no debe comprar esa flota ya que el valor de la media no oscila
entre el margen que la cooperativa espera: 𝑢 = 27.5𝑀𝑖𝑙𝑙𝑎𝑠

Ejemplo 3: Se encuentra que la concentración promedio de zinc que se saca del gua a
partir de una muestra de mediciones de zinc en 36 sitios diferentes es de 2.6 gramos por
mililitro. Encuentre los intervalos de confianza de 95% y 99% para la concentración media
de zinc en el río. Suponga que la desviación estándar de la población es 0.3.
𝑥̅ = 2.6 𝑔
3.3 Estimación de Proporciones:
𝑝−𝑃 𝑷𝑄
Sabemos que 𝑧 = al despejar p nos queda 𝑷 = 𝑝 ± 𝑧√ 𝑛
𝑃𝑄

𝑛
En este despeje podemos observar que se necesita el valor del parámetro P y es
precisamente lo que queremos estimar, por lo que lo sustituiremos por la proporción de la
muestra p siempre y cuando el tamaño de muestra no sea pequeño.
𝑝𝑄
𝑷 = 𝑝 ± 𝑧√
𝑛
Cuando n es pequeña y la proporción desconocida P se considera cercana a 0 ó a 1, el
procedimiento del intervalo de confianza que se establece aquí no es confiable, por tanto,
no se debe utilizar. Para estar seguro, se debe requerir que np ó nq sea mayor o igual a 5.
Ejemplo 4: En un estudio de 300 accidentes de automóvil en una ciudad específica, 60
tuvieron consecuencias fatales. Con base en esta muestra, construya un intervalo del 90%
de confianza para aproximar la proporción de todos los accidentes automovilísticos que en
esa ciudad tienen consecuencias fatales
𝑝 = 60⁄300 = 0,2 𝑄 = 0,8 𝑧 = 1.645 𝑛 = 300.

0.2 ∗ 0.8
𝑷 = 0.20 ± 1.645√ = 0.20 ± 0,038 → 𝟎. 𝟏𝟔𝟐 ≤ 𝑷 ≤ 𝟎. 𝟐𝟑𝟖
300

Como se puede observar en este problema solo se solicitó un intervalo, pero es posible que
la pregunta sea más que eso, donde ustedes deban tomar una decisión miremos el siguiente
ejemplo.

Ejemplo 5: las empresas de búsqueda de ejecutivos se especializan en ayudar a las


empresas a ubicar y asegurar talento para las altas gerencias. Tales firmas denominadas
“cazadoras de Genios” son responsables de la ubicación de muchos de los mejores
directores ejecutivos del país. La revista dinero reporto recientemente que “uno de cada
cuatro directores es una persona de fuera. Si en una muestra de 350 compañías de los
Estados Unidos, 77 tienen directivos ejecutivos de afuera,¿ un intervalo de 99% de
confianza apoyaría la afirmación?
𝑝 = 77⁄350 = 0.22 𝑄 = 0.78 Z=2.575

0.22 ∗ 0.78
𝑃 = 0.22 ± 2.575√ = 0.22 ± 0,057 → 𝟎. 𝟏𝟔𝟑 ≤ 𝑃 ≤ 𝟎, 𝟐𝟖
350

Respuesta: se apoya la afirmación ya que la revista dinero está hablando que un 25% de los
directores son personas de afuera. (Uno de cada cuatro-….1/4=0,25=25%) y este valor está
dentro del rango calculado.
3.4 Estimación de diferencia de medias:
Recordemos que:

(𝑥̅1 − 𝑥̅2 ) − (𝜇̅1 − 𝜇̅2 )


𝑧= 𝑎𝑙 𝑑𝑒𝑠𝑝𝑒𝑗𝑎𝑟 𝜇̅1 − 𝜇̅2 𝑠𝑒 𝑡𝑖𝑒𝑛𝑒:
2 𝜎 2
√𝜎𝑥 + 𝑦
𝑛1 𝑛2

𝜎𝑥 2 𝜎𝑦 2
𝜇̅1 − 𝜇̅2 = (𝑥̅1 − 𝑥̅2 ) ± 𝑧√ +
𝑛1 𝑛2
En el caso en que se desconozcan las varianzas de la población y los tamaños de muestra
sean mayores a 30 se podrá utilizar la varianza de la muestra como una estimación puntual.

Es deseable que la diferencia de medias sea positiva por lo que se recomienda restar la
media mayor menos la media menor

Ejemplo 6: Se lleva a cabo un experimento en que se comparan dos tipos de motores, A y


B. Se mide el rendimiento en millas por galón de gasolina. Se realizan 50 experimentos con
el motor tipo A y 75 con el motor tipo B. La gasolina que se utiliza y las demás condiciones
se mantienen constantes. El rendimiento promedio de gasolina para el motor A es de 36
millas por galón y el promedio para el motor B es 24 millas por galón. Encuentre un
intervalo de confianza de 96% sobre la diferencia promedio real para los motores A y B.
Suponga que las desviaciones estándar poblacionales son 6 y 8 para los motores A y B
respectivamente. ¿Qué motor recomienda?

𝑥𝐴 = 36; 𝑥𝐵 = 42 ;𝑧 = 2,05 ;𝜎𝐴 = 36 ;𝜎𝐵 = 64; 𝑛𝐴 = 50 ;𝑛𝐵 = 75

362 642
𝜇̅𝐵 − 𝜇̅𝐴 = (42 − 36) ± 2.05√ 50 + 3,43 < (𝜇̅𝐵 − 𝜇̅𝐴 ) < 8,57
75

La interpretación de este ejemplo sería que con un nivel de confianza del 96% la diferencia
del rendimiento promedio esta entre 3.43 y 8.57 millas por galón a favor del motor B. Esto
quiere decir que el motor B da más rendimiento promedio que el motor A, ya que los dos
valores del intervalo son positivos.

Ejemplo 7: Una compañía de taxis trata de decidir si comprar neumáticos de la marca A o


de la B para su flotilla de taxis. Para estimar la diferencia de las dos marcas, se lleva a cabo
un experimento utilizando 12 de cada marca. Los neumáticos se utilizan hasta que se
desgastan, dando como resultado promedio para la marca A 36,300 kilómetros y para la
marca B 38,100 kilómetros. Calcule un intervalo de confianza de 95% para la diferencia
promedio de las dos marcas, si se sabe que las poblaciones se distribuyen
de forma aproximadamente normal con desviación estándar de 5000 kilómetros para la
marca A y 6100 kilómetros para la marca B. ¿Qué marca recomienda?

𝑥𝐴 = 36300; 𝑥𝐵 = 38100 ;𝑧 = 1,96 ;𝜎𝐴 = 5000 ;𝜎𝐵 = 6100; 𝑛𝐴 = 𝑛𝐵 = 12


50002 61002
𝜇̅ 𝐵 − 𝜇̅ 𝐴 = (38100 − 36300) ± 1,96√ 12
+ 12
→ -2662,68< (𝜇̅𝐵 − 𝜇̅𝐴 ) < 6262,67
Como el intervalo contiene el valor “cero”, no hay razón para creer que el promedio de
duración del neumático de la marca B es mayor al de la marca A, pues el cero nos está
indicando que pueden tener la misma duración promedio.

3.5 Estimación de diferencia de proporciones:


Recordemos que:

(𝑝1 − 𝑝2 ) − (𝑃1 − 𝑃2 )
𝑧= , 𝑎𝑙 𝑑𝑒𝑠𝑝𝑒𝑗𝑎𝑟𝑃1 − 𝑃2 𝑠𝑒 𝑡𝑖𝑒𝑛𝑒:
𝑃 𝑄 𝑃 ∗ 𝑄2
√ 1∗ 1 + 2
𝑛1 𝑛2
𝑝1∗ 𝑄1 𝑝2∗ 𝑄2
𝑃1 − 𝑃2 = (𝑝1 − 𝑝2 ) ± 𝑧√ +
𝑛1 𝑛2
Ejemplo 8: La empresa MOSTER S.A utiliza dos máquinas diferentes para cortar los
disfraces para la temporada que se avecina “31 de octubre”. Se han presentado problemas
en cuanto al ajuste apropiado, debido al funcionamiento de las maquinas. Como director de
control de calidad su trabajo es estimar la diferencia en la proporción de defectos
producidos por cada máquina. Se tomaron muestras de tamaño n1= 170 y n2=150: la
primera máquina produjo 38% de defectos y la segunda, 53% de defectos. Fijar un nivel de
significancia de 96%. Si la evidencia sugiere que la diferencia en la proporción de defectos
excede del 5%, todos los disfraces se producirán en la máquina que parezca tener una tasa
de defectos menor. ¿Qué decisión tomará usted?

𝑝1 = 38% ; 𝑝2 = 53% ; 𝑧 = 2.054 ;𝑄1 = 0,62 ;𝑄2 = 0,47; 𝑛1 = 170; 𝑛2 = 150

0,53 ∗ 0,47 0,38 ∗ 0,62


𝑃2 − 𝑃1 = (0.53 − 0.38) ± 2,054√ +
150 170

0,037 ≤ 𝑃2 − 𝑃1 ≤ 0,263

Se puede estar 96% seguro que la proporción de defectos producidos por las máquinas
esta entre 3.7% y 26.3% a favor de la maquina 2 además el valor de 5% está dentro del
rango determinado, el coordinador de calidad debe inclinarse por la maquina 2.

Ejemplo 9: Se considera cierto cambio en un proceso de fabricación de partes


componentes. Se toman muestras del procedimiento existente y del nuevo para determinar
si éste tiene como resultado una mejoría. Si se encuentra que 75 de 1500 artículos del
procedimiento actual son defectuosos y 80 de 2000 artículos del procedimiento nuevo
también lo son, encuentre un intervalo de confianza de 90% para la diferencia real en la
fracción de defectuosos entre el proceso actual y el nuevo.

𝑝1 = 0,05 ; 𝑝2 = 0,04 ; 𝑧 = 1,645 ;𝑄1 = 0,95 ;𝑄2 = 0.96; 𝑛1 = 1500; 𝑛2 = 2000


0,05 ∗ 0,95 0,04 ∗ 0,96
𝑃1 − 𝑃2 = (0,05 − 0,04) ± 1,645√ +
1500 2000
−0,0017 ≤ 𝑃1 − 𝑃2 ≤ 0,0217

Como el intervalo contiene el valor de cero, no hay razón para creer que el nuevo
procedimiento producirá una disminución significativa en la proporción de artículos
defectuosos comparado con el método existente.

EJERCICIOS:

1- Se probó una muestra aleatoria de 400 cinescopios de televisor y se encontraron 40


defectuosos. Estime el intervalo que contiene, con un coeficiente de confianza de 0.90, a la
verdadera fracción de elementos defectuosos.

2- El decano registró debidamente el porcentaje de calificaciones I (insuficiente) y A


(aceptable) otorgadas a los estudiantes por dos profesores universitarios de matemáticas. El
profesor I alcanzó un 32%, contra un 21% para el profesor II, con 200 y 180 estudiantes,
respectivamente. Estime la diferencia entre los porcentajes de calificaciones D y F
otorgadas por los dos profesores. Utilice un nivel de confianza del 95% e interprete los
resultados.

3- Suponga que se quiere estimar la producción media por hora, en un proceso que produce
antibiótico. Se observa el proceso durante 100 períodos de una hora, seleccionados al azar y
se obtiene una media de 34 onzas por hora con una desviación estándar de 3 onzas por hora.
Estime la producción media por hora para el proceso, utilizando un nivel de confianza del
95%.

4-Se seleccionaron dos muestras de 400 tubos electrónicos, de cada una de dos líneas de
producción, A y B. De la línea A se obtuvieron 40 tubos defectuosos y de la B 80. Estime
la diferencia real en las fracciones de defectuosos para las dos líneas, con un coeficiente de
confianza de 0.90 e interprete los resultados.
IV ESTIMACION DE TAMAÑO DE LA MUESTRA.

Al iniciar cualquier investigación, la primera pregunta que surge es: ¿de qué tamaño debe
ser la o las muestras?. La respuesta a esta pregunta la veremos en esta sección, con
conceptos que ya se han visto a través de este material.

 La varianza 𝜎𝑥2 corresponde al grado de variabilidad que presentan las unidades de la


población, mientras más grande sea 𝜎 2 mayor será el tamaño de la muestra. El valor de
𝜎𝑥2 supuestamente conocido, de lo contrario se debe estimar a través de una investigación
preliminar, en el caso de la proporción sucede algo similar pero se tiene la costumbre de
tomar P=0,5con lo cual se tiene el máximo valor de n.
 Nivel de confianza. Tiene relación directa con el tamaño de la muestra, por lo tanto se
dirá que a mayor nivel de confianza más grande debe ser el tamaño de la muestra.

Los recursos financieros y tiempo, no entran dentro de la determinación técnica del tamaño
de la muestra.

4.1 Cálculo del Tamaño de la Muestra para Estimar una Media.

Sin reemplazo

4.2 Cálculo del Tamaño de la Muestra para Estimar una Proporción.

Sin reemplazo

4.3 Cálculo del Tamaño de la Muestra para Estimar la Diferencia de Medias.

→n1=kn2

Tamaños de muestras iguales los tamaños de muestras son diferentes.

4.4 Cálculo del Tamaño de la Muestra para Estimar la Diferencia de Proporciones.

→n1=kn2

Tamaños de muestras iguales los tamaños de muestras son diferentes


Como n debe de ser un número entero, redondeamos hacia arriba todos los resultados
fraccionarios.

Ejemplos1: Una empresa eléctrica fabrica focos que tienen una duración aproximadamente
normal con una desviación estándar de 40 horas. ¿De qué tamaño se necesita una muestra si
se desea tener 96% de confianza que la media real esté dentro de 10 horas de la media real?
𝑧∗𝜎 2 2,053 ∗ 40 2
𝑛=( ) =( ) = 67.43 = 68
𝜀 10

Ejemplo 2: En una muestra aleatoria de 500 familias que tienen televisores en la ciudad de
Hamilton, Canadá, se encuentra que 340 están suscritas a HBO. ¿Qué tan grande se
requiere que sea una muestra si se quiere tener 95% de confianza de que la estimación de P
esté dentro de 0.02?

𝑍 2 ∗ 𝑝 ∗ 𝑄 1,962 ∗ 0,68 ∗ 0,32


𝑛= = = 2090
𝜀2 0,022

Ejemplo3: Un director de personal quiere comparar la efectividad de dos métodos de


entrenamiento para trabajadores industriales a fin de efectuar cierta operación de montaje.
Se divide un número de operarios en dos grupos iguales: el primero recibe el método de
entrenamiento 1, y el segundo, el método 2. Cada uno realizará la operación de montaje y
se registrará el tiempo de trabajo. Se espera que las mediciones para ambos grupos tengan
una desviación estándar aproximadamente de 2 minutos. Si se desea que la estimación de la
diferencia en tiempo medio de montaje sea correcta hasta por un minuto, con una
probabilidad igual a 0.95, ¿cuántos trabajadores se tienen que incluir en cada grupo de
entrenamiento?

𝑧 2 (𝜎1 2 +𝜎2 2 ) 1,962 ∗(22 +22 )


Como n1=n2 entonces 𝑛 = = = 31
𝜀2 12

Cada grupo debe contener mínimo 31 empleados

Ejemplo4: Una compañía de productos alimenticios contrató a una empresa de


investigación de mercadotecnia, para muestrear dos mercados, I y II, a fin de comparar las
proporciones de consumidores que prefieren la comida congelada de la compañía con los
productos de sus competidores. No hay información previa acerca de la magnitud de las
proporciones P1 y P2. Si la empresa de productos alimenticios quiere estimar la diferencia
dentro de 0.04, con una probabilidad de 0.95, ¿cuántos consumidores habrá que muestrear
en cada mercado?

𝑧 2 (𝑝1 𝑞1 + 𝑝2 𝑞2 ) 1,962 ∗ (0,5 ∗ 0,5 + 0,5 ∗ ,05)


𝑛= = = 1201
𝜀2 0,042
Se tendrá que realizar encuestas a 1201 consumidores de cada mercado para tener una
estimación con una confianza del 95% y un error máximo de 0.04.
V - TEORIA DE HIPOTESIS

Una hipótesis estadística es una proposición o supuesto sobre los parámetros de una o más
poblaciones.

Suponga que se tiene interés en la rapidez de combustión de un agente propulsor sólido


utilizado en los sistemas de salida de emergencia para la tripulación de aeronaves. El
interés se centra sobre la rapidez de combustión promedio. De manera específica, el interés
recae en decir si la rapidez de combustión promedio es o no 50 cm/s. Esto puede expresarse
de manera formal como:

Ho; m = 50 cm/s

H1; m ¹ 50 cm/s

La proposición Ho; m = 50 cm/s, se conoce como hipótesis nula, mientras que la


proposición H1; m ¹ 50 cm/s, recibe el nombre de hipótesis alternativa.

Puesto que la hipótesis alternativa especifica valores de m que pueden ser mayores o
menores que 50 cm/s, también se conoce como hipótesis alternativa bilateral. En algunas
situaciones, lo que se desea es formular una hipótesis alternativa unilateral, como en

Ho; m = 50 cm/s Ho; m = 50 cm/s ó H1; m < 50 cm/s H1; m > 50 cm/s

Es importante recordar que las hipótesis siempre son proposiciones sobre la población o
distribución bajo estudio, no proposiciones sobre la muestra. Por lo general, el valor del
parámetro de la población especificado en la hipótesis nula se determina en una de tres
maneras diferentes:

1- Puede ser resultado de la experiencia pasada o del conocimiento del proceso, entonces el
objetivo de la prueba de hipótesis usualmente es determinar si ha cambiado el valor del
parámetro.

2-Puede obtenerse a partir de alguna teoría o modelo que se relaciona con el proceso bajo
estudio. En este caso, el objetivo de la prueba de hipótesis es verificar la teoría o modelo.

3-Cuando el valor del parámetro proviene de consideraciones externas, tales como las
especificaciones de diseño o ingeniería, o de obligaciones contractuales. En esta situación,
el objetivo usual de la prueba de hipótesis es probar el cumplimiento de las
especificaciones.

Los procedimientos de prueba de hipótesis dependen del empleo de la información


contenida en la muestra aleatoria de la población de interés. Si esta información es
consistente con la hipótesis, se concluye que ésta es verdadera; sin embargo, si esta
información es inconsistente con la hipótesis, se concluye que esta es falsa. Debe hacerse
hincapié en que la verdad o falsedad de una hipótesis en particular nunca puede conocerse
con certidumbre, a menos que pueda examinarse a toda la población.

La hipótesis nula, representada por Ho, es la afirmación sobre una o más características de
poblaciones que al inicio se supone cierta (es decir, la “creencia a priori”).
La hipótesis alternativa, representada por H1, es la afirmación contradictoria a Ho, y ésta
es la hipótesis del investigador.

La hipótesis nula se rechaza en favor de la hipótesis alternativa, sólo si la evidencia


muestral sugiere que Ho es falsa. Si la muestra no contradice decididamente a Ho, se
continúa creyendo en la validez de la hipótesis nula.

Entonces, las dos conclusiones posibles de un análisis por prueba de hipótesis son rechazar
Ho o no rechazar Ho.

PASOS PARA ESTABLECER UN ENSAYO DE HIPOTESIS


INDEPENDIENTEMENTE DE LA DISTRIBUCION QUE SE ESTE TRATANDO

1. Interpretar correctamente hacia qué distribución muestral se ajustan los datos del
enunciado.

2. Interpretar correctamente los datos del enunciado diferenciando los parámetros de los
estadísticos. Así mismo se debe determinar en este punto información implícita como el
tipo de muestreo y si la población es finita o infinita.

3. Establecer simultáneamente el ensayo de hipótesis y el planteamiento gráfico del


problema. El ensayo de hipótesis está en función de parámetros ya que se quiere evaluar el
universo de donde proviene la muestra. En este punto se determina el tipo de ensayo
(unilateral o bilateral).

4. Establecer la regla de decisión. Esta se puede establecer en función del valor crítico, el
cual se obtiene dependiendo del valor de a (Error tipo I o nivel de significancia) o en
función del estadístico límite de la distribución muestral. Cada una de las hipótesis deberá
ser argumentada correctamente para tomar la decisión, la cual estará en función de la
hipótesis nula o Ho.

5. Calcular el estadístico real, y situarlo para tomar la decisión.

6. Justificar la toma de decisión y concluir.


Tipos de Ensayo

Se pueden presentar tres tipos de ensayo de hipótesis que son:

 Unilateral Derecho
 Unilateral Izquierdo
 Bilateral

 Unilateral Derecho. El investigador desea comprobar la hipótesis de un aumento en el


parámetro, en este caso el nivel de significancia se carga todo hacia el lado derecho,
para definir las regiones de aceptación y de rechazo.

Ensayo de hipótesis:

Ho; Parámetro ≤x

H1; Parámetro >x

 Unilateral Izquierdo: El investigador desea


comprobar la hipótesis de una disminución en el parámetro, en este caso el nivel de
significancia se carga todo hacia el lado izquierdo, para definir las regiones de aceptación y
de rechazo.

Ensayo de hipótesis:

Ho; Parámetro ≥x

H1; Parámetro <x

Bilateral: El investigador desea comprobar la hipótesis de un cambio en el parámetro.


El nivel de significancia se divide en dos y existen dos regiones de rechazo.

Ensayo de hipótesis:

Ho; Parámetro = x

H1; Parámetro ≠x
PROBLEMAS:

1-Una muestra aleatoria de 100 muertes registradas en Estados Unidos el año pasado
muestra una vida promedio de 71.8 años. Suponga una desviación estándar poblacional de
8.9 años, ¿esto parece indicar que la vida media hoy en día es mayor que 70 años? Utilice
un nivel de significancia de 0.05.

2-. Una empresa eléctrica fabrica focos que tienen una duración que se distribuye de forma
aproximadamente normal con una media de 800 horas y una desviación estándar de 40
horas. Si una muestra aleatoria de 30 focos tiene una duración promedio de 788 horas,
¿muestran los datos suficiente evidencia para decir que la duración media ha cambiado?
Utilice un nivel de significancia del 0.04.

3-Una muestra aleatoria de 64 bolsas de palomitas de maíz pesan, en promedio 5.23 onzas
con una desviación estándar de 0.24 onzas. Pruebe la hipótesis de que µ= 5.5 onzas contra a
la hipótesis alternativa, µ < 5.5 onzas en el nivel de significancia de 0.05.

4-Un constructor afirma que se instalan bombas de calor en 70% de todas las casas que se
construyen hoy en día en la ciudad de Richmond. ¿Estaría de acuerdo con esta afirmación
si una investigación de casas nuevas en esta ciudad muestra que 8 de 15 tienen instaladas
bombas de calor? Utilice un nivel de significancia de 0.10.

5-Un fabricante de semiconductores produce controladores que se emplean en aplicaciones


de motores automovilísticos. El cliente requiere que la fracción de controladores
defectuosos en uno de los pasos de manufactura críticos no sea mayor que 0.05, y que el
fabricante demuestre esta característica del proceso de fabricación con este nivel de calidad,
utilizando α = 0.05. El fabricante de semiconductores toma una muestra aleatoria de 200
dispositivos y encuentra que cuatro de ellos son defectuosos. ¿El fabricante puede
demostrar al cliente la calidad del proceso?

6-Un diseñador de productos está interesado en reducir el tiempo de secado de una pintura
tapaporos. Se prueban dos fórmulas de pintura; la fórmula 1 tiene el contenido químico
estándar, y la fórmula 2 tiene un nuevo ingrediente secante que debe reducir el tiempo de
secado. De la experiencia se sabe que la desviación estándar del tiempo de secado es ocho
minutos, y esta variabilidad inherente no debe verse afectada por la adición del nuevo
ingrediente. Se pintan diez especímenes con la fórmula 1, y otros diez con la fórmula 2. Los
dos tiempos promedio de secado muéstrales son 121 min y 112 min respectivamente. ¿A
qué conclusiones puede llegar el diseñador del producto sobre la eficacia del nuevo
ingrediente, utilizando α = 0?05?
7- Existen dos tipos de plástico apropiados para su uso por un fabricante de componentes
electrónicos. La tensión de ruptura de ese plástico es un parámetro importante. Se sabe que
𝜎1 = 𝜎1 = 1𝑝𝑠𝑖. De una muestra aleatoria de tamaño 10 y 12 para cada plástico
respectivamente, se tiene una media de 162.5 para el plástico 1 y de 155 para el plástico 2.
La compañía no adoptará el plástico 1 a menos que la tensión de ruptura de éste exceda a la
del plástico 2 al menos por 10 psi. Con base a la información contenida en la muestra, ¿la
compañía deberá utilizar el plástico 1? Utilice α = 0.05 para llegar a una decisión.

8-Se evalúan dos tipos diferentes de soluciones para pulir, para su posible uso en una
operación de pulido en la fabricación de lentes intraoculares utilizados en el ojo humano
después de una cirugía de cataratas. Se pulen 300 lentes con la primera solución y, de éstos,
253 no presentaron defectos inducidos por el pulido. Después se pulen otros 300 lentes con
la segunda solución, de los cuales 196 resultan satisfactorios. ¿Existe alguna razón para
creer que las dos soluciones para pulir son diferentes? Utilice α= 0.01

9-. Se tomará el voto entre los residentes de una ciudad y el condado circundante para
determinar si se debe construir una planta química propuesta. El lugar de construcción está
dentro de los límites de la ciudad y por esta razón muchos votantes del condado consideran
que la propuesta pasará debido a la gran proporción de votantes que favorecen la
construcción. Para determinar si hay una diferencia significativa en la proporción de
votantes de la ciudad y votantes del condado que favorecen la propuesta, se realiza una
encuesta. Si 120 de 200 votantes de la ciudad favorecen la propuesta y 240 de 500
residentes del condado también lo hacen, ¿estaría de acuerdo en que la proporción de
votantes de la ciudad que favorecen la propuesta es más alto que la proporción de votantes
del condado? Utilice un nivel de significancia de 0.025.
VI Regresión y correlación

El problema principal de la inferencia estadística en una distribución de dos variables es el


de determinar la verdadera relación entre X y Y; Es decir, como se comportan las dos
variables, una con respecto a la otra. Los almacenes con altos descuentos tendrán mayores
ventas. estudiantes altos deberían tener mayores pesos corporales.

El problema que se plantea es como se establece un tipo de relación en forma de ecuación,


de tal manera que, basados en el valor de una X, se puede hallar una estimación de la otra
variable.

Una ecuación de este tipo se conoce como una relación de estimación, el procedimiento de
estimación es también una técnica de predicción, lo cual es función fundamental de la
ciencia natural o social. En la ciencia naturales, la predicción se hace posible porque existe
la relación causa efecto entre dos o más variables.

Diagrama de dispersión: Es la gráfica que representa la relación entre dos variables.

La siguiente grafica muestra en un cómo están relacionados la variable descuento con


volumen de ventas. Es claro que entre mayor descuento se ofrezca a los clientes mayor será
el volumen de ventas, hay una tendencia creciente.

Para hacer una estimación se parte


de una propuesta de un modelo. En
el análisis de dos variables interesa
un modelo particular la recta de
regresión de la población. Esta. la
cual se refiere a la población, no
puede ser conocida y por tanto, debe
ser estimada con base a los datos
muéstrales y se obtiene la recta de
regresión estimada.

Como es de esperarse, para dar validez a las conclusiones acerca de la citada recta, hay que
fijar cierto supuestos, entre los de mayor relevancia están los siguientes.

1-los valores de las variables de x, y se toman previamente, se consideran variables


determinísticas.

2- se supone que la relación de las variables X y Y está dada por la ecuación 𝑦 = 𝑏𝑥 + 𝑐


donde 𝑏 𝑦 𝑐 corresponden al coeficiente angular de la ecuación y al coeficiente de posición
u origen respectivamente.
El coeficiente angular también se denomina pendiente, la que a su vez puede ser:

Mayor que cero - Menor que cero-Igual a cero.

El coeficiente de posición, m también denominado como origen en la ordenada corresponde


a la altura de la perpendicular levantada desde el punto de origen, al igual que b puede ser
mayor, menor o igual a cero.

Procedimiento abreviado del cálculo:

∑ 𝑥𝑖 ∑ 𝑦𝑖 ∑ 𝑥𝑖2 −𝑛𝑥̅ ∑ 𝑦𝑖2 −𝑛𝑦̅


Media:𝑥̅ = 𝑦̅ = varianza: 𝑠𝑥2 = 𝑠𝑦2 =
𝑛 𝑛 𝑛 𝑛

Desviación típica 𝑠𝑥 = √𝑠𝑥2 𝑠𝑦 = √𝑠𝑦2


∑(𝑥𝑖 −𝑥̅ )(𝑦𝑖 −𝑦̅) ∑ 𝑥𝑖 𝑦𝑖
Covarianza 𝑐𝑜𝑣 = 𝑐𝑜𝑣 = − 𝑥̅ 𝑦̅
𝑛 𝑛

Calculo de la ecuación : 𝑦 = 𝒃𝑥 + 𝒄

Ventas Costos

𝑥 𝑦 𝑥𝑦 𝑥2 𝑦2
8 5 40 64 25
12 7 84 144 49
18 10 180 324 100
32 16 512 1.024 256
40 22 880 1.600 484
110 60 1.696 3.156 914

Para determina el coeficiente angular (b)

𝑛 ∑ 𝑥𝑖 𝑦𝑖 − (∑ 𝑥𝑖 ) (∑ 𝑦𝑖 ) ∑ 𝑥𝑖 𝑦𝑖 − 𝑛𝑥̅ 𝑦̅
𝑏= = 0.51 𝑏=
2
𝑛 ∑ 𝑥𝑖 − (∑ 𝑥𝑖 )2 ∑ 𝑥𝑖2 − 𝑛𝑥̅ 2

∑(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅)


𝑏=
∑(𝑥𝑖 − 𝑥̅ )2

Para determina el coeficiente de posición (c)


∑ 𝑦𝑖 −𝑏 ∑ 𝑥𝑖
𝑐 = 𝑦̅ − 𝑏𝑥̅ 𝑐= = 0.78
𝑛

𝒚 = 𝟎. 𝟓𝟏𝒙 + 𝟎. 𝟕𝟖

¿Si las ventas son de 20 millones cual será el costo para ese año?

𝒚 = 𝟎. 𝟓𝟏(𝟐𝟎) + 𝟎. 𝟕𝟖 = 𝟏𝟎. 𝟗𝟖𝑴𝒊𝒍𝒍𝒐𝒏𝒆𝒔

Calculo del error estándar de estimación

Los estimados que se hacen, por lo general, difieren del valor real, por lo tanto, hay
necesidad de calcular el margen de error que se pueda cometer. En principio calculados la
varianza residual o varianza no explicada, correspondiente a los puntos del diagrama de
dispersión que no quedan sobre la recta de estimación, en otras palabras, aquellos que
quedaron por fuera de ella. Los modelos para calcularla son variados y aproximadamente
2
los resultados son iguales. 𝑠𝑦𝑥 = 𝑉𝑅 = 𝑆𝑒2

2
∑ 𝑦𝑖2 − 𝑐 ∑ 𝑦𝑖 − 𝑏 ∑ 𝑦𝑖 𝑥𝑖
𝑠𝑦𝑥 = = 0.448
𝑛
2
𝑠𝑦𝑥 = 𝑠𝑦2 (1 − 𝑟 2 )

2
𝑐𝑜𝑣 2
𝑠𝑦𝑥 = 𝑠𝑦2 − = 0.38
𝑠𝑥2

Desviación típica residual

2 →𝑠
𝑠𝑦𝑥 = √𝑠𝑦𝑥 𝑦𝑥 = √0.38 = 0.62

Ahora se puede fijar los límites de confianza para el valor estimado:


𝑆𝑦𝑥

𝑌±𝑡 𝑛

Cuando la muestra es pequeña (n≤30) utilizamos


“t de student, como en este caso, si es mayor de 30
utilizamos el valor de z.

0.62
10.98 ± 𝟑. 𝟏𝟖𝟐𝟓 10.98 ± 0.40
5
10.58 < 𝑦 < 11.38
Coeficiente de correlación ( R )
2
𝐶𝑜𝑣 2 𝑆𝑦𝑥 𝐶𝑜𝑣
𝑅2 = 𝑅2 = 1 − 𝑟=𝑅=
𝑆𝑋2 𝑆𝑌2 𝑆𝑦2 𝑆𝑥 𝑆𝑦

Entre más cercano esté R a 1, hay una mayor correlación cuando r≤30 se dice que no hay
correlación, por lo tanto, la relación utilizada no nos va a dar una buena estimación

Observemos el comportamiento grafico del coeficiente de correlación en el siguiente


gráfico.

Como complemento al análisis de regresión, se puede aplicar la prueba de hipótesis al


coeficiente de regresión y al coeficiente de correlación.

You might also like