You are on page 1of 48

PROBABILIDAD Y ESTADSTICA

UNIDAD NMERO 5

E S TA D I S T I C A A P L I C A D A

INTRODUCCIN
1

Pregntate si lo que ests haciendo hoy


te acerca al lugar en el que quieres estar maana.

La Estadstica es por tanto un potente auxiliar en muchas ciencias y


actividades humanas, pues es un lenguaje basado en resultados cuantitativos y
grficos que permite comunicar informacin, resolver problemas de diseo
experimental y ayudar a la toma de decisiones, en base al anlisis de la
informacin muestral y en situaciones de incertidumbre.
La palabra estadstica se origina, en las tcnicas de recoleccin, organizacin,
conservacin, y tratamiento de los datos propios antiguamente de un estado,
con que los antiguos gobernantes controlaban a sus sbditos y dominios
econmicos. Estas tcnicas evolucionaron a la par con el desarrollo de las
matemticas, utilizando sus herramientas en el proceso del anlisis e
interpretacin de la informacin.
Con este trabajo se pretende formarnos una idea de los conceptos bsicos de la
estadstica aplicada; para facilitar nuestra induccin al curso.
Ya que en nuestros das, la estadstica se ha convertido en un mtodo efectivo
para describir con exactitud los valores de datos econmicos, polticos,
sociales, psicolgicos, biolgicos y fsicos, y sirve como herramienta para
relacionar y analizar dichos datos.
Son de uso cotidiano las diferentes tcnicas estadsticas que partiendo de
observaciones muestrales o histricas, crean modelos lgico-matemticos que
se "aventuran" a describir o pronosticar un determinado fenmeno con cierto
grado de certidumbre medible.

INDICE
2

Contenid

INTRODUCCIN............................................................................................................... 2
1 Inferencia Estadstica................................................................................................... 4
MUESTREOS.................................................................................................................... 5
Tipos de Muestreo.............................................................................................................. 5
PRUEBA DE HIPTESIS.................................................................................................... 6
Conclusiones de una Prueba de Hiptesis.............................................................................7
2

Estimacin puntual................................................................................................... 7

Propiedades de un estimador...............................................................................................8
Estimacin por intervalo...................................................................................................... 9
Estimacin puntual........................................................................................................... 10
Estimacin por intervalos................................................................................................... 10
Intervalos de confianza..................................................................................................... 11
Poblacin normal de varianza desconocida..........................................................................15
Intervalo de confianza para la diferencia entre medias...........................................................16
Intervalo de confianza para una proporcin..................................................................17
Aproximacin asinttica................................................................................................ 17
Intervalo exacto............................................................................................................ 18
Intervalo de confianza para razones de dos varianzas..................................................21
3 Prueba de Hiptesis.................................................................................................. 25
METODOLOGIA PARA LA PRUEBA DE HIPOTESIS.............................................................25
HIPOTESIS NULA..................................................................................................... 25
HIPOTESIS ALTERNATIVA......................................................................................... 25
ERROR TIPO UNO Y TIPO DOS........................................................................................ 26
ERROR TIPO 1......................................................................................................... 26
ERROR TIPO 2......................................................................................................... 26
PRUEBA DE HIPOTESIS PARA LA MEDIA..........................................................................26
PRUEBA DE HIPOTESIS PARA DIFERENCIA DE MEDIAS...................................................26
EJEMPLOS DE HIPTESIS NULA Y ALTERNATIVA.............................................................27
ERROR TIPO UNO Y TIPO DOS.......................................................................................28
ERROR TIPO 1............................................................................................................ 28
ERROR TIPO 2............................................................................................................ 28
PRUEBA DE HIPTESIS PARA LA MEDIA.........................................................................28

MUESTRAS GRANDES................................................................................................ 28
EJEMPLO................................................................................................................... 28
MUESTRAS PEQUEAS.............................................................................................. 29
EJEMPLO................................................................................................................... 29
PRUEBA DE HIPOTESIS PARA DIFERENCIA DE MEDIAS...................................................30
EJEMPLO................................................................................................................... 31
PRUEBA DE HIPOTESIS PARA PROPORCIONES...............................................................32
EJEMPLO................................................................................................................... 32
PRUEBA DE HIPTESIS PARA LA DIFERENCIA DE PROPORCIONES.................................33
EJEMPLO................................................................................................................... 33
PRUEBA DE HIPTESIS PARA UNA VARIANZA................................................................34
EJEMPLO................................................................................................................... 35
PRUEBA DE HIPOTESIS PARA LA RAZON DE VARIANZAS................................................36
EJEMPLO................................................................................................................... 36
4 Correlacin y Regresin............................................................................................. 38
DISTRIBUCIONES BIDIMENSIONALES.............................................................................38
COVARIANZA................................................................................................................. 40
CORRELACIN............................................................................................................... 40
COEFICIENTE DE CORRELACIN LINEAL........................................................................42
RECTA DE REGRESIN.................................................................................................. 43
Bibliografa...................................................................................................................... 44
Conclusin...................................................................................................................... 46

1 INFERENCIA ESTADSTICA
4

La Inferencia Estadstica es la parte de la estadstica matemtica que se encarga


del estudio de los mtodos para la obtencin del modelo de probabilidad, que
sigue una variable aleatoria de una determinada poblacin, a travs de una
muestra (parte de la misma) obtenida gracias a las pruebas correctas.
Se ocupa de predecir, sacar conclusiones, para una poblacin tomando como
base una muestra (es decir, una parte) de dicha poblacin. Como todas las
predicciones, siempre han de hacerse bajo un cierto grado de fiabilidad o
confianza. Ser esta ltima vertiente de la estadstica la que estudiemos en este
tema.
MUESTREOS
Hay muchas maneras de elegir una muestra de una poblacin. Antes de pasar a
analizar dichas formas de extraccin de muestras, lo que si hemos de dejar claro
es que todas las muestras han de cumplir varias condiciones indispensables. Es
evidente que para que el estudio a realizar sea fiable, hay que cuidar mucho la
eleccin de la muestra, para que represente en la medida de lo posible a la
poblacin de la que se extrae. Si la muestra est mal elegida, diremos que no es
representativa. En este caso, se pueden producir errores imprevistos e
incontrolados. Dichos errores se denominan sesgos y diremos que la muestra est
sesgada.
TIPOS DE MUESTREO
Muestreo no probabilstico: El investigador no elige la muestra al azar, sino
mediante determinados
Muestreo probabilstico: Cuando la muestra se elige al azar. En este caso
podemos distinguir
Varios tipos:
a) Muestreo aleatorio simple: Aquel en el que cada individuo de la poblacin tiene
las mismas
Posibilidades de salir en la muestra.
b) Muestreo sistemtico: En el que se elige un individuo al azar y a partir de el, a
intervalos
Constantes, se eligen los dems hasta completar la muestra.
c) Muestreo estratificado: En este muestreo se divide la poblacin en clases o
estratos y se
5

Escoge, aleatoriamente, un nmero de individuos de cada estrato proporcional al


nmero de componentes de cada estrato.
d) Muestreo por conglomerados: Si no disponemos de la relacin de los elementos
de la poblacin, o de los posibles estratos, no podemos aplicar los muestreos
anteriores.
PRUEBA DE HIPTESIS
Una prueba de hiptesis comprende cuatro Componentes principales:
-Hiptesis Nula
-Hiptesis Alternativa
-Estadstica de Prueba
-Regin de Rechazo
La Hiptesis Nula, denotada como H0 siempre especifica un solo valor del
parmetro de la poblacin si la hiptesis es simple o un conjunto de valores si es
compuesta (es lo que queremos desacreditar)
H 0: = 0
La Hiptesis Alternativa, denotada como H1 es la que responde nuestra pregunta,
la que se establece en base a la evidencia que tenemos. Puede tener cuatro
formas:
H 1 : =1
Como las conclusiones a las que lleguemos se basan en una muestra, hay
posibilidades de
Que nos equivoquemos. Dos decisiones correctas son posibles: Rechazar H0
cuando es falsa
No Rechazar H0 cuando es verdadera.
Dos decisiones incorrectas son posibles:
Rechazar H0 cuando es verdadera
No Rechazar H0 cuando es falsa.

TAMAOS DE ERRORES
6

H 0 Verdadera

H 0 Falsa

Rechazamos H 0

Error Tipo I P(error Tipo


I) = P(error Tipo I) =

Decisin Correcta

No Rechazamos H 0

Decisin Correcta

Error Tipo II Error Tipo II


P(error Tipo II) = P(error
Tipo II) =

CONCLUSIONES DE UNA PRUEBA DE HIPTESIS


Si rechazamos la Hiptesis Nula, concluimos que hay suficiente evidencia
estadstica para inferir que la hiptesis nula es falsa
Si no rechazamos la Hiptesis Nula, concluimos que no hay suficiente evidencia
estadstica para inferir que la hiptesis nula es falsa

ESTIMACIN PUNTUAL

Estimacin puntual consiste en utilizar el valor de un estadstico para inferir el


parmetro de una poblacin.

La media de la poblacin se puede estimar puntualmente mediante la


media de la muestra:

La proporcin de la poblacin se puede estimar puntualmente mediante la


proporcin de la muestra:

La desviacin tpica de la poblacin se puede estimar puntualmente


mediante la desviacin tpica de la muestra, aunque hay mejores
estimadores:

Estimador
Un estimador de un parmetro es un estadstico T=T (X 1,..., Xn)
Usado para estimar el valor del parmetro de una poblacin.
El valor observado del estadstico t = T(x1,..., xn) es la estimacin de , y la
^
representamos por

puede ser un solo parmetro o un conjunto de parmetros desconocidos,


= (1, ..., k )

PROPIEDADES

DE UN ESTIMADOR

Insesgado: Un estimador es insesgado cuando la media de su distribucin


muestral asociada coincide con la media de la poblacin. Esto ocurre, por
x =
ejemplo, con el estimador x , ya que
y con estimador p ya que
p = p

De varianza mnima: La variabilidad de un estimador viene determinada


por el cuadrado de su desviacin estndar. En el caso del estimador x ,
su desviacin estndar es

x =

, tambin llamada error estndar de

En el caso del error estndar de

p , p =

p (1 p )
n

Se observara que cuanto mayor sea el tamao de la muestra n, menor ser la


variabilidad del estimador x y de p, por tanto, mejor sern nuestras
estimaciones.

Diferencia entre un estimador y una estimacin


Existe una diferencia entre estimador y estimacin. El estimador es un estadstico
y, por tanto, una variable aleatoria y el valor de esta variable para una muestra
x , x , x , xn
concreta ( 1 2 3
) ser la estimacin puntual. El estimador tendr su
distribucin muestral.

Parmetro
poblacional

Estimador

Estimacin

Media

Object 129

Varianza

Proporcin

i 1

2 S 2

Xi
n
1 n
( X i X )2

n 1 i 1

X
nmeroxitos

n nmeropruebas

x
i 1

s2

1 n
xi x
n 1 i 1

x
n

ESTIMACIN POR INTERVALO


El objetivo que se pretende con los intervalos de confianza es obtener un intervalo
de poca amplitud y con una alta probabilidad de que el parmetro se encuentre
en su interior. As pues, elegiremos probabilidades cercanas a la unidad, que se
representan por 1- y cuyos valores ms frecuentes suelen ser 0'90, 0'95 y 0'99.

Ejercicio
Dada una poblacin X, que sigue una distribucin cualquiera con media y
desviacin estndar .
9

1. Sabemos (por el TCL) que, para valores grandes de n, la media muestral


sigue una distribucin aproximadamente normal con media
estndar

x =

x =

y desviacin

2. Por otra parte, el Teorema de Chebyshev nos dice que, en una distribucin
normal, aproximadamente un 95% de los datos estaban situados a una distancia
inferior a dos desviaciones estndar de la media.
De lo anterior se deduce que:

2 x < x < + 2 x =0.95


p

Por tanto, sta ltima frmula nos da un intervalo de valores tal que la probabilidad
de que la media de la poblacin est contenida en l es de 0.95.
Este tipo de intervalos se llaman intervalos de confianza de un parmetro
poblacional. El nivel de confianza (1 - ) del intervalo es la probabilidad de que
ste contenga al parmetro poblacional. En el ejemplo anterior, el nivel de
confianza era del 95% ( = 0,05).
ESTIMACIN PUNTUAL
Consideremos el estimador T(X1, ..., Xn) = Max{X1, ..., Xn} = X(n) para estimar el
extremo superior del intervalo. Queremos determinar si es un estimador
insesgado. Necesitamos conocer su distribucin para calcular su esperanza...
La densidad de una uniforme en (0, ) es f (x) = 1/ , para 0 < x < , y su funcin
x

de distribucin es F(x) = P(X x) =

1 dt= x
0

X(n) es, para 0 < x < :

10

, para 0 < x < . La distribucin de

y por tanto, la funcin de densidad de la v.a. X (n) es


Finalmente, calculamos su esperanza:
sesgado

ESTIMACIN

es

POR INTERVALOS

La estimacin por intervalos es un procedimiento de la estadstica inferencial


mediante el cual se realizan calculos con los datos de muestra cuyo resultado son
dos datos numericos que defnen un rango, intervalo o conjunto numrico que
servir para estimar el parmetro poblacional.
Por ejemplo, si se desea estimar el promedio de edad de la poblacin estudiantil
de una universidad y para ello elegimos una muestra, utilizando la estimacin por
intervalos se obtienen dos valores, por ejemplo 22.5 y 24.5, lo que quiere decir
que el verdadero valor del promedio de edad de esa poblacin estudiantil se
encontrar dentro del rango de 22.5 a 24.5 aos de edad, aunque nunca se sabr
con exactitud su verdadero valor. Una manera de expresar formalmente este
resultado es utilizando corchetes: [22.5, 24.5].
La estimacin por intervalos tiene varias ventajas; una es que no ofrece un valor
nico, sino un rango donde es muy posible o muy probable que el parmetro
poblacional se encuentre incluido. De esta manera se supera la limitacin de los
estimadores puntuales de que su resultado nico vara de muestra en muestra; es
decir, con la estimacin por intervalos tenemos ms probabilidad de acertar al
verdadero valor poblacional.
La principal ventaja de la estimacin por intervalos es que su resultado ofrece un
nivel de confianza que permite conocer en cunto le podemos creer o tenerle
confianza al resultado obtenido de la estimacin. Por esta razn, la estimacin por
intervalos tambin es conocida como estimacin por intervalos de confianza, pues

11

su nivel de confianza seala qu tan posible o qu tan probable es que el


parmetro poblacional se encuentre incluido dentro del rango definido.

INTERVALOS

DE CONFIANZA

En los mtodos de estimacin puntual se utiliza una funcin de los valores de la


muestra (estadstico) para dar la estimacin del parmetro en estudio. Si en vez
de esto, se utilizan dos funciones y se da el valor de dicho parmetro a partir del
intervalo que tiene por extremos los valores de dichas funciones para una
muestra, se dice que se est dando una estimacin por intervalos del parmetro, o
un intervalo de confianza.
En la construccin de estos intervalos, hay dos elementos fundamentales. La
amplitud del intervalo que dar la precisin de la estimacin, y que por lo tanto
deber ser la menor posible, y la probabilidad de que el intervalo contenga al
verdadero valor del parmetro a estimar, que se llama nivel de confianza o
coeficiente de confianza, y que deber ser lo mayor posible. Est claro que se
puede ganar en precisin a base de perder confianza en la estimacin.
Ejemplo
En el caso de que se seleccione una muestra aleatoria simple de una poblacin
descrita por la funcin f (x;) dependiente del parmetro que pretendemos
estimar. El problema se plantea como sigue: se fija un nivel de confianza, que se
denota por 1 , en donde 0<<1, y se trata de determinar dos funciones

De forma que:

Al intervalo
se le llama intervalo
de confianza de al nivel de confianza del
.Es muy importante
observar que sera un error afirmar que la probabilidad indicada anteriormente, es
la probabilidad de que est entre los nmeros reales
y

puesto que no es una variable aleatoria sino un


12

parmetro que tendr un valor concreto, aunque sea desconocido. Las variables
aleatorias son
y
la muestra, luego la probabilidad anterior debe ser considerada como la
probabilidad de que el intervalo aleatorio

al variar

contenga el verdadero valor de . Dicho en trminos


de frecuencias esto significa que de cada 100 muestras aleatorias que se tomen,
cabe esperar que
el

de ellas contenga al verdadero valor de

al
El esquema general para la estimacin de un intervalo de confianza es:
estimador coeficiente de confiabilidad error estndard
El coeficiente de confiabilidad ( z o t ) indica entre ms/menos cuntos errores
estndar del estimador est 1 del rea de la distribucin muestral del
estadstico.
La probabilidad de que los valores obtenidos a travs del estimador por medio de
un intervalo contenga el verdadero valor del parmetro que se pretende estimar de
la poblacin, es 1 . La probabilidad de estimar 1 de la poblacin se llama
tambin coeficiente de confianza o probabilidad de acertar. Los coeficientes de
confianza ms utilizados son: 0,90, 0,95 y 0,99.
La probabilidad (probabilidad de equivocarse) se divide en dos reas en los
extremos

Valores del coeficiente de confiabilidad si n >30( z) .


13

Para

Para

Para
A la mitad de la amplitud del intervalo de confianza se le llama precisin del
estimador.
En todo intervalo de confianza hay un aspecto positivo y un aspecto negativo:
El positivo, se ha usado una tcnica que acierta en una alta proporcin de casos;
El negativo, se desconoce si en el caso concreto se ha acertado.

Intervalo de confianza para la media


Poblacin normal de varianza conocida.
En estas condiciones, la variable aleatoria

media muestral se distribuye

segn una distribucin


, suponiendo que la poblacin es N (,2 ) con conocida. Esta propiedad
permite asegurar que la variable tipificada

sigue una distribucin N (0,1) , y

por lo tanto, fijado el nivel de confianza 1 , obtener el valor

Operando, resulta:

14

tal que:

con lo que las funciones 1 y 2 buscadas, en este caso, sern

y el intervalo de confianza para la media poblacional al nivel de confianza del (1


) 100% es:

Se puede ganar en precisin de dos formas, bien perdiendo confianza lo que, en


general, no interesa, o bien aumentando el tamao n de la muestra seleccionada.}
EJEMPLO
Las ventas diarias, en euros, en un determinado comercio siguen una distribucin
N (950, 200). Calcula la probabilidad de que las ventas diarias en ese comercio:
a) Superen los 1200 euros.
b) Estn entre 700 y 1000 euros.
SOLUCION

15

POBLACIN NORMAL DE VARIANZA DESCONOCIDA .


Sea ahora una poblacin N (,2 ) con desconocida. Es evidente que en este
caso se han de utilizar estimadores que no dependan del valor . De aqu la
importancia de las distribuciones que no dependen de este valor, como es el caso
de la t de Student. En estas condiciones, la variable

, es una t- Student con n 1 grados de libertad, en donde s es la


desviacin tpica muestral. Esta propiedad permite, fijado el nivel de confianza 1
, obtener el valor

al que:

Operando de igual forma que en el apartado anterior resulta:

y el intervalo de confianza en este caso es:

INTERVALO

DE CONFIANZA PARA LA DIFERENCIA ENTRE MEDIAS

16

Sean (X1, X2,, Xn) y (Y1, Y2,, Ym) muestras aleatorias simples
independientes.
(X1, X2,, Xn) es muestra aleatoria de una variable .X, que supondremos
(Y1, Y2,, Ym) es muestra aleatoria de una v.a. Y, que supondremos
Con ellas queremos construir intervalos de confianza para la diferencia de medias,
Con las muestras de X e Y obtenemos que

Por tanto el estadstico:

Tiene distribucin N (0, 1) y puede ser usado como estadstico pivote. Podemos
escribir la siguiente proposicin:

Remplazando P se obtiene

Operando se llega a que un intervalo con (1- ) 100% de confianza para


es:

17

Con Z /2 punto crtico de la distribucin normal estndar.


Si

escribimos el intervalo anterior como sigue:

INTERVALO DE CONFIANZA PARA UNA PROPORCIN


Dada una variable aleatoria con distribucin Binomial B(n, p), el objetivo es la
construccin de un intervalo de confianza para el parmetro p, basada en una
observacin de la variable que ha dado como valor x. El mismo caso se aplica si
estudiamos una Binomial B(1, p) y consideramos el nmero de veces que ocurre
el suceso que define la variable al repetir el experimento n veces en condiciones
de independencia.
Existen dos alternativas a la hora de construir un intervalo de confianza para p:
Considerar la aproximacin asinttica de la distribucin Binomial en la
distribucin Normal.
Utilizar un mtodo exacto.

APROXIMACIN ASINTTICA
Tiene la ventaja de la simplicidad en la expresin y en los clculos, y es la ms
referenciada en la mayora de textos de estadstica. Se basa en la aproximacin

Que, trasladada a la frecuencia relativa, resulta

Tomando como estadstico pivote

18

que sigue una distribucin N(0, 1), y aadiendo una correccin por continuidad al
pasar de una variable discreta a una continua, se obtiene el intervalo de confianza
asinttico:

donde z/2 es el valor de una distribucin Normal estndar que deja a su derecha
una probabilidad de /2 para un intervalo de confianza de (1 ) 100 %. Las
condiciones generalmente aceptadas para considerar vlida la aproximacin
asinttica anterior son:

El intervalo obtenido es un intervalo asinttico y por tanto condicionado a la validez


de la aproximacin utilizada.

INTERVALO EXACTO
Aun cuando las condiciones anteriores no se verifiquen, es posible la construccin
de un intervalo exacto, vlido siempre pero algo ms complicado en los clculos.
Es posible demostrar que un intervalo exacto para el parmetro p viene dado por
los valores siguientes:

Donde F/2,a,b es el valor de una distribucin F de Fisher-Snedecor con a y b


grados de libertad que deja a su derecha una probabilidad de /2 para un intervalo
de confianza de (1 ) 100 %.
Intervalo de confianza para la diferencia entre proporcines

19

Supngase que se tiene dos poblaciones independientes con proporciones


desconocidas

, y varianzas conocidas

desea encontrar un intervalo de confianza del

, respectivamente. Se
para la diferencia de

las proporciones
Sean

una muestra aleatoria de

primera poblacin y

una muestra aleatoria de

tomadas de la segunda poblacin. Si


estadstica

observaciones tomadas de la

observaciones

son las proporciones muestrales, la

es un estimador puntual de

. La variable aleatoria

tiene una distribucin normal estndar si las dos poblaciones son normales, o es
aproximadamente normal estndar si se cumplen las condiciones del teorema del
lmite central, respectivamente.

Esto implica que:

La anterior expresin se puede expresar como:


20

Por lo tanto, un intervalo de confianza para la diferencia entre

se obtiene:

Con el anterior intervalo se puede tambin probar la hiptesis nula


versus la alternativa

, donde se rechaza

la hiptesis nula si el valor cae fuera de este intervalo de confianza. Adems,


para probar esta hiptesis se puede hacer uso del estadstico:

El cual rechaza

si

Ejemplo
En una muestra aleatoria de 85 soportes para el cigeal de un motor de
automvil, 10 tienen un terminado que es ms rugoso de los que las
especificaciones permiten. Supngase que se hace una modificacin al proceso
de acabado de la superficie y que, de manera subsecuente, se toma una segunda
muestra de 85 ejes. El nmero de ejes defectuosos en esta segunda muestra es
de 8. Obtngase un intervalo de confianza del 95% para la diferencia en la
proporcin de los soportes defectuosos producidos por ambos procesos y pruebe
la hiptesis de que la proporcin de soportes defectuosos producidos por ambos
procesos es la misma.

Solucin.

21

De lo observado en las muestras se obtiene que

.
El inters es la diferencia en la proporcin de los soportes defectuosos entre
:

Un intervalo de confianza del 95% para la diferencia en la resistencia a la tensin


promedio es:

Este intervalo de confianza incluye al cero, as que, con base en los datos
muestrales, parece poco probable que los cambios hechos en el proceso de
acabado de la superficie hayan reducido el nmero de soportes defectuosos para
cigeal producidos por el proceso.
Si se utiliza el estadstico presentado en (1), se encuentra:

Rechazndose tambin la hiptesis nula, por lo tanto se concluye que los cambios
hechos en el proceso de acabado de la superficie no han reducido el nmero de
soportes defectuosos para cigeal producidos por el proceso.

22

INTERVALO DE CONFIANZA PARA RAZONES DE DOS VARIANZAS


Supngase que se tiene inters en dos poblacionales normales independientes,
donde las medias y varianzas de la poblacin,
y
, son desconocidas.
Se desea probar la hiptesis sobre la igualdad de las dos varianzas,
, por ejemplo. Supngase que para ello se tienen disponibles dos
muestras aleatorias; una de tamao

tomada de la poblacin 1, y otra de tamao

provenientes de la poblacin 2, y sean


probar la hiptesis bilateral

las varianzas muestrales. Para

Recuerde que:

Adems, la cola inferior de una F se calcula mediante

Por ejemplo,
Para construir un intervalo de confianza para

23

, ntese que:

La anterior expresin se puede expresar como:

Con el anterior intervalo se puede tambin probar la hiptesis nula


versus la alternativa

, donde se rechaza la hiptesis nula si el valor

cae fuera de este intervalo de confianza. Adems, para probar esta hiptesis se
puede hacer uso tambin del estadstico:

el cual rechaza

si

o si

Ejemplo
Una empresa ha estado experimentando con dos disposiciones fsicas distintas de
su lnea de ensamble.

Cul de las dos disposiciones recomendara usted?


Usando:
a) Un intervalo de confianza del 95%;
b) Una prueba de hiptesis bilateral con regla de decisin determinada por la
regin de rechazo (use un nivel de significancia del 5%);
c) Una prueba de hiptesis bilateral con regla de decisin determinada por el valor
p.

24

Solucin.
a)
y
Luego reemplazando en el intervalo
de confianza obtenido para la razn de varianzas, se obtiene que:

Puesto que todos los valores en el intervalo (0.1634; 0.9176) son menores de 1, la
varianza de la lnea de ensamble 2 es ms grande que la varianza de la lnea 1.
b) Para las siguientes hiptesis,

el estadstico de prueba correspondiente es:

Por lo tanto, se rechaza

puesto que

c) El valor p es igual a P(
Puesto que el valor p es menor que 5%, H es rechazada.

25

3 PRUEBA DE HIPTESIS
La prueba de hiptesis suele comenzar con alguna teora, afirmacin, o
aseveracin sobre un parmetro especifico de una poblacin.

METODOLOGIA PARA LA PRUEBA DE HIPOTESIS


HIPOTESIS NULA
H0
La hiptesis nula, denotada con
, es la afirmacin que se supone al principio
como cierta (la afirmacin de creencia previa).
La hiptesis nula se rechaza a favor de la alternativa solo si la evidencia muestral
H0
hace pensar que
, es falsa. Si la muestra no contradice de forma
contundente a

H0

, se continua con la creencia de que la hiptesis nula es

verdadera. Las dos conclusiones posibles de un anlisis de prueba de hiptesis


H0
H0
son entonces rechazar
o no rechazar
.
EJEMPLO: En muchos casos se formula una hiptesis estadstica, con el nico
propsito de rechazarla o nulificara. Por ejemplo, si quiere decidir si una moneda
est encargada se formula la hiptesis de que la moneda es buena (es decir,
p=0.5, donde p es la probabilidad de obtener caras). De esta forma similar, si
quiere decidir si un procedimiento (es decir, cualquier diferencia observada se
debe simplemente a Fluctuaciones en el muestreo de la misma poblacin). Tales
H0
hiptesis suelen llamarse hiptesis nulas y se denotan por
.
HIPOTESIS ALTERNATIVA
La hiptesis alternativa, denotada por
contradictoria a

H0

H1

, es la aseveracin de que es

. Siempre que se especifica una hiptesis nula, tambin se

determinan una hiptesis alternativa que debe ser cierta si la hiptesis nula es
H1
H0.
falsa. La hiptesis alternativa
es opuesta a la hiptesis nula

26

Cualquier hiptesis que difiera de una hiptesis dada, se denomina hiptesis


alternativa. Por ejemplo, si una hiptesis es p=0.5, las hiptesis alternativas
podran ser p=0.7, p0.5 o p>0.5. La hiptesis alternativa a la hiptesis nula se
H1
denota
.

ERROR TIPO UNO Y TIPO DOS


ERROR TIPO 1
Se presenta cuando se rechaza la hiptesis nula

HO

siendo cierta y no debera

rechazarse. La probabilidad de que se presente un error tipo 1 es .


ERROR TIPO 2
Se presenta cuando no se rechaza la hiptesis nula

HO

siendo falsa y debera

rechazarse. La probabilidad de que se presente un error tipo 2 es .


PRUEBA DE HIPOTESIS PARA LA MEDIA
Cuando se conoce la desviacin estndar, , y si la poblacin tiene una
distribucin normal, usted utiliza la prueba Z. si el tamao de la muestra es lo
bastante grande como para que tenga efecto el teorema del lmite central. La
ecuacin define al estadstico de prueba de Z para determinar la diferencia que

existe entre la media maestral X y la media poblacional cuando se conoce la


desviacin estndar .
PRUEBA DE HIPOTESIS PARA LA MEDIA ( CONOCIDA)
Z=

El denominador es el error estndar de la media, por lo que Z representa la

diferencia que existe entre X la en unidades de error estndar.


PRUEBA DE HIPOTESIS PARA DIFERENCIA DE MEDIAS
Se tienen dos poblaciones y se toman muestras aleatorias independientes de
tamaos n 1 y n 2, se puede comparar el comportamiento de dichas poblaciones a
travs de los promedios.
27

Se tienen dos tipos de concretos. Se toma una muestra de tamao 42 de cada uno
y se obtiene un promedio muestral de la conductividad trmica para el primero de
0.486 con una desviacin estndar de 0.187 y un promedio de 0.359 de
conductividad trmica con una desviacin estndar de 0.158 para el segundo.Esta
informacin sugiere que el promedio verdadero de conductividad trmica del
primer concreto es mayor que la del segundo, con = 0.01.

EJEMPLOS DE HIPTESIS NULA Y ALTERNATIVA


Establezca las hiptesis nula y alternativa.
a. Las millas por galn (mpg) promedio de un nuevo modelo de
automvil es 32.
b. Ms del 65% de los empleados de un colegio aportan a
Fondos Unidos.
c. En promedio, los empleados de cierta compaa viven a no
ms de 15 millas de la misma.
d. Al menos un 60% de la poblacin adulta de una comunidad
votar en las prximas elecciones Presidenciales.
e. El peso promedio de un pollo para asar es de al menos cuatro
libras.
Solucin:
28

a.
15

H0: = 32

b.

H1: 32

H0: p .65 c.

H0:

H1: p < .65

H1:

> 15
d.

H0: p .6
H1: p < .6

e.

H0: 4
H1: < 4

Si se rechaza la hiptesis nula y no hay otra opcin, el experimento puede ser


invlido. Por esta razn, la ciencia utiliza una serie de procesos deductivos e
inductivos para asegurar que no existan errores en las hiptesis.
Para probar si la hiptesis nula es cierta, se toma una muestra aleatoria y se
calcula la informacin, como el promedio, la proporcin, etc. Esta informacin
muestral se llama estadstica de prueba.
Estadstica de Prueba: Una estadstica de prueba se basa en la informacin de la
muestra como la media o la proporcin.

ERROR TIPO UNO Y TIPO DOS


ERROR TIPO 1
Se presenta cuando se rechaza la hiptesis nula H0 siendo cierta y no debera
rechazarse. La probabilidad de que se presente un error tipo 1 es .
Para ser muy cuidadosos en no cometer el error tipo 1, debemos especificar la
probabilidad de rechazar H0, denotada por . A sta se le llama nivel de
significancia.
Nivel de Significancia: La probabilidad ( ms alta de rechazar H0
cuando H0 es cierto se
llama nivel de
significancia.
Comentario:Para mantener la probabilidad de cometer el error tipo 1 baja, debemos
escoger un valor pequeo de .

ERROR TIPO 2
Se presenta cuando no se rechaza la hiptesis nula H0 siendo falsa y debera
rechazarse. La probabilidad de que se presente un error tipo 2 es .

PRUEBA DE HIPTESIS PARA LA MEDIA


MUESTRAS GRANDES
Cuando se conoce la desviacin estndar, , y si la poblacin tiene una
distribucin normal, se utiliza la prueba Z solo si el tamao de la muestra es lo
bastante grande. Procedemos a utilizar la siguiente formula.

29

EJEMPLO
Una muestra aleatoria de 100 muertes registradas en Estados Unidos el ao
pasado muestra una vida promedio de 71.8 aos. Suponga una desviacin
estndar poblacional de 8.9 aos. Queremos probar si la vida media hoy en da
es mayor a 70 aos con base en esa muestra. La muestra parecera indicar que
es as pero Cul es la probabilidad de que la media de la muestra no refleje la
verdadera media de la poblacin?
Utilizar un nivel de significancia de 0.05.
Solucin:
Se trata de una distribucin muestral de medias con desviacin estndar conocida.
Paso nmero 1. Datos.
=70 aos
s = 8.9 aos
X = 71.8 aos
n = 100
= 0.05
Paso nmero 2. Establecemos la hiptesis.
H0; = 70 aos.
H1; > 70 aos.
Paso nmero 3. Nivel de significancia.
z
= 0.05,
= 1.645
Paso nmero 4. Regla de decisin.
Si z 1.645 no se rechaza H0.
Si z > 1.645 se rechaza H0.
Paso nmero 5. Clculos del valor de z para los
datos.
Paso nmero 6. Decisin y justificacin.
Como 2.02 > 1.645 se rechaza H0 y se concluye con un nivel de significancia del
0.05 que la vida media hoy en da es mayor que 70 aos.

MUESTRAS PEQUEAS
Para el caso de muestras pequeas (n<30), el procedimiento a seguir es similar al
anterior, con la diferencia que
empleamos la
distribucin t de student.

EJEMPLO
El instituto elctrico Edison publica cifras del nmero anual de kilowatt hora que
gastan varios aparatos electrodomsticos. Se afirma que una aspiradora gasta un
30

promedio de 46 kilowatt-hora al ao. Si una muestra aleatoria de 12 lugares que


se incluye en un estudio indica que las aspiradoras gastan un promedio de 42
kilowatt-hora al ao con una desviacin estndar de 11.9 kilowatt-hora, esto
sugiere con un nivel de significancia de 0.05 que las aspiradoras gastan, en
promedio, menos de 46 kilowatt-hora anualmente?
Solucin:
Suponga que la poblacin de kilowatt-hora es normal.
Paso nmero 1. Datos.
= 46 kilowatt-hora
s = 11.9 kilowatt-hora
X = 42 kilowatt-hora
n = 12
= 0.05
Paso nmero 2. Prueba de hiptesis.
H0; = 46 kilowatt-hora
H 1 ; < 46 kilowatt-hora
Paso nmero 3. Valores crticos.
tc para 0.95 (= 0.05) con 11 grados de libertad.
Paso nmero 4. Regla de decisin
Si t -1.796 No se rechaza Ho.
Si t < -1.796 Se rechaza Ho.
Paso nmero 5. Clculo del valor t para los
datos.
Paso nmero 6. Decisin y justificacin.
Como 1.16 > -1.796, por lo tanto no se rechaza H0, y se concluye con un nivel de
significancia del 0.05 que el nmero promedio de kilowatt-hora que gastan al ao
las aspiradoras no es significativamente menor que 46.

PRUEBA DE HIPOTESIS PARA DIFERENCIA DE MEDIAS


En la prctica, se presenta una diversidad de problemas en la industria y en las
ciencias sociales que nos sugieren confrontar cual de dos procesos es mejor que
el otro a la luz de la media que arroja cada uno de ellos. Se nos podra ocurrir por
ejemplo:
a) verificar si el consumo de gasolina entre dos marcas de vehculos se puede
considerar idntico o por el contrario una marca es ms econmica que otra.
b) Verificar si los salarios de la industria metalrgica se pueden considerar o no
superiores a los salarios de la industria textil en una regin
c) Verificar si el contenido de determinada sustancia en una artculo fabricado por
una compaa A es inferior o no al contenido de dicha sustancia en el mismo
artculo fabricado por una compaa B de la competencia. etc.

31

Con el fin de resolver las pruebas de hiptesis para la diferencia de medias,


debemos tener en cuenta el mismo procedimiento y las mismas reglas que
seguimos para las pruebas de hiptesis para la media.
Las frmulas para el clculo de los estadsticos z y t, son las mismas
empleadas en el clculo de los intervalos de confianza para la diferencia de
medias.

En cuanto a la distribucin en el muestreo de la diferencia de medias, recordemos


los siguientes tres casos:
1) Si las dos poblaciones son normales, las diferencias de las medias muestrales
tambin se distribuirn normalmente cualquiera sea el tamao de las muestras. No
obstante, si no se conocen las desviaciones estndar poblacionales (1 y 2),
stas pueden ser reemplazadas por las desviaciones estndar de las muestras
(S1 y S2), si los tamaos de las muestras son mayores que 30 (n1 >30 y n2 >30 o
n1 +n2>60).
2) Segn el teorema central del lmite, si las dos poblaciones no son normales o
no sabemos si se cumple o no ste comportamiento, las diferencias de las medias
muestrales se distribuirn aproximadamente como una distribucin normal, si los
tamaos de las muestras son mayores que 30 (n1 >30 y n2 >30 o n1 +n2 >60)
3) Si las dos poblaciones son normales o estn muy cerca de ste
comportamiento y por otra parte no conocemos la desviaciones estndar
poblacionales y adems los tamaos de las muestras son menores que 30 (n1
<30 y n2 <30 o n1 +n2 <60), entonces, las diferencias de las medias muestrales
se distribuirn de acuerdo a la ley t-student.
EJEMPLO
Una compaa de transportes requiere comprar un gran lote de buses para el
transporte urbano con el fin de reemplazar su parque automotor y para tal fin
desea comprobar la afirmacin hecha por el proveedor de la marca B, en el
sentido de que la marca A es menos ahorradora de combustible. Para tal fin la
empresa toma una muestra aleatoria de 35 vehculos marca A y encuentra que la
misma tiene un promedio en el rendimiento de 18 kilmetros/galn con una
desviacin estndar de 8 kilmetros/galn, mientras que una muestra de 32
vehculos marca B presenta un promedio de 22 kilmetros/galn con desviacin
estndar de 3 kilmetros/galn. Qu decisin debe tomar el gerente de la
compaa, con un nivel de significacin del 5%?
Solucin
No se sabe si las poblaciones estn normalmente distribuidas, pero ambos
tamaos de muestras son mayores que 30, por lo cual segn el teorema central
32

del lmite, las diferencias de las medias muestrales, se distribuirn


aproximadamente como una distribucin normal.
Paso numero 1: Hiptesis nula e hiptesis alternativa.
H0: A B 0, H1: A B 0.
Paso numero 2: Nivel de significacin.
0.05
Paso numero 3 Criterio de decisin.
Como las diferencias de medias muestrales se distribuyen normalmente,
entonces, segn las tablas, el valor de Z es: -1.64. Por lo tanto, el criterio de
decisin ser el siguiente:
Si el valor de Z calculado es menor que 1.64 se rechaza la hiptesis nula de que
el rendimiento en ambas marcas es igual.
Paso numero 4: Clculo estadstico.

Paso numero 5: Tomar la decisin.


Como el valor de Z calculado (-2.75) se encuentra en la zona de rechazo,
entonces, con un nivel de significacin del 5%, debemos rechazar la hiptesis nula
de que el ahorro en ambas marcas es igual y en stas condiciones debemos
aceptar la hiptesis alternativa de que la marca A es menos ahorradora de
combustible que la marca B.
Nota: Observemos que como no conocamos las desviaciones estndar
poblacionales para el clculo de z, pudimos reemplazar a stas por las
desviaciones estndar muestrales, puesto que ambos tamaos de muestra son
mayores que 30.

PRUEBA DE HIPOTESIS PARA PROPORCIONES


Para resolver pruebas de hiptesis para la proporcin en muestras grandes
podemos basarnos en la distribucin en el muestreo de la proporcin utilizando la
distribucin normal y el proceso que debemos seguir es muy similar al utilizado
para el caso de la media.
EJEMPLO
El rector de una universidad pblica afirma que el 15% de los estudiantes de la
universidad que l dirige est en contra de una ley que actualmente se discute en
el congreso y que supuestamente afecta a la comunidad universitaria. El
representante de los estudiantes, considera que dicha proporcin es mayor y para
comprobarlo toma una muestra de 100 estudiantes seleccionados aleatoriamente

33

y encuentra que el 23% estn en desacuerdo con dicho proyecto de ley. Se pide
comprobar si el rector tiene o no la razn con un nivel de significacin del 5%.
Solucin
No se sabe si la poblacin est normalmente distribuida, pero n=100>30, por lo
cual segn el teorema central del lmite, las proporciones muestrales se
distribuirn aproximadamente como una distribucin normal.
Paso numero 1: Hiptesis nula e hiptesis alternativa.
H0: P=0.15, H1: P>0.15. Puesto que el representante de los estudiantes, piensa
que la proporcin es superior a la afirmada por el seor rector.
Paso numero 2: Nivel de significacin.
0.05
Paso numero 3: Criterio de decisin.
Como la proporcin muestral se distribuye normalmente entonces, segn la tabla
el valor de z es: +1.64. Por lo tanto, el criterio de decisin ser el siguiente: Si el
valor de Z calculado es mayor que +1.64, se rechaza la hiptesis nula de que la
proporcin es del 15%.
Paso numero 4: Clculo del estadstico.
Sobre el cual se basar la decisin: n=100, p=0.23, q=0.77. Segn la frmula para
Z, en la distribucin en el muestreo de la proporcin, el correspondiente valor de z
ser:

Paso numero 5: Tomar la decisin.


Como el valor de Z calculado (+2.24) se encuentra en la zona de rechazo,
entonces, con un nivel de significacin del 5%, debemos rechazar la hiptesis nula
de que la proporcin de estudiantes en contra de la ley es del 15% y por
consiguiente debemos aceptar la hiptesis del representante estudiantil de que
dicha proporcin es mayor.

PRUEBA DE HIPTESIS PARA LA DIFERENCIA DE


PROPORCIONES
Para resolver pruebas de hiptesis para la diferencia de proporciones en muestras
grandes, podemos basarnos en la distribucin y en el muestreo de las diferencias
de proporciones utilizando la distribucin normal y el proceso que debemos seguir
es muy similar al utilizado para el caso de la media.
34

La hiptesis nula puede plantearse como H0: P1 - P2 =0 H0: P1 = P2 y en ambos


casos, la hiptesis alternativas podran ser: H1: P1 P 0 H1: P1 -P2 >0 H1: P1
- P2<0.
Si la hiptesis nula se plantea como: H0: P1 - P2 =A (Siendo A un valor cualquiera),
las hiptesis alternativas seran las mismas anteriores pero cambiando el valor
0(cero) por el valor de A.
EJEMPLO
Una compaa asegura que el mercado para su producto X tiene una aceptacin
de iguales proporciones en la ciudad A que en la ciudad B. Un especialista en
mercado pone en duda dicha afirmacin y para tal fin tom una muestra aleatoria
de 500 amas de casa en la ciudad A y encontr que el 59.6% de las mismas
prefera el artculo X. Por otra parte tom una muestra aleatoria de 300 amas de
casa en la ciudad B y encontr que el 50% de las mismas preferan el artculo X.
Existe una diferencia real entre las dos ciudades? Nivel de significacin 5%.
Solucin
No se sabe si las poblaciones estn normalmente distribuidas, pero n1=500>30 y
n2=300>30, por lo cual segn el teorema central del lmite, las diferencias de las
proporciones muestrales se distribuirn aproximadamente como una distribucin
normal.
Paso numero 1: Plantear Hiptesis nula e hiptesis alternativa.
H0: PA=PB, H1: PAPB. La prueba es bilateral, puesto que el especialista en
mercado no est afirmando que ciudad tiene ms proporcin que la otra.
Paso numero 2: Nivel de significacin.
0.05
Paso numero 3: Criterio de decisin.
Como las diferencias de las proporciones muestrales se distribuyen normalmente
y la prueba es bilateral, entonces, segn las tablas el valor de z es: 1.96. Por lo
tanto, el criterio de decisin ser el siguiente: Si el valor de Z calculado es mayor
que +1.96 o menor que 1.96, se rechaza la hiptesis nula de que la proporcin es
idntica en ambas ciudades.
Paso numero 4: Clculo del estadstico sobre el cual se basar la decisin.
n1=500, p1=0.596, n2=300, p2=0.50. En la distribucin el muestreo de la
diferencia de proporciones, correspondiente al valor de z ser:

35

Paso numero 5: Tomar la decisin.


Como el valor de Z calculado (+2.65) se encuentra en la zona de rechazo,
entonces, con un nivel de significacin del 5%, debemos rechazar la hiptesis nula
de que las proporciones en ambas ciudades son iguales.

PRUEBA DE HIPTESIS PARA UNA VARIANZA


Para una prueba de hiptesis relativa a una varianza debemos tener en cuenta
que la distribucin Ji-cuadrada se da siempre y cuando se trate de poblaciones
normales y el estadstico de prueba es la variable Ji-cuadrada con (n-1) grados de
libertad y que se expresa como:

Una prueba de hiptesis para la varianza debe tener una hiptesis nula que ser:
2
H0: =A, siendo A un valor hipottico, por lo cual la hiptesis alternativa podra
ser: H1:

A, H1:

< A H1:

>A, segn la prueba sea bilateral en el

primer caso o unilateral en los dos casos siguientes.


Dado que la varianza mide el grado de variabilidad de un conjunto poblacional,
una prueba de hiptesis para la varianza puede ser til para comprobar por
ejemplo el grado de variabilidad que presenta un proceso productivo, despus de
que ste ha sido objeto de algunos cambios tcnicos. El proceso que sigue una
prueba de hiptesis para la varianza.
EJEMPLO
Se sabe que el contenido en gramos de un producto fabricado por una compaa,
no rene las especificaciones si la varianza de un lote de produccin se aleja
demasiado hacia arriba o hacia abajo de 6.5. Comprobar si un gran lote de
produccin rene las especificaciones, si una muestra aleatoria de 20 unidades
extrada aleatoriamente de dicho lote arroj una varianza de 7.3. Utilizar un nivel
de significacin del 5%.
Solucin:
Se sabe que el contenido del producto se distribuye normalmente.
Paso numero 1: Hiptesis nula e hiptesis alternativa.
2
2
H0: = 6.5, H1: 6.5. La prueba es bilateral, puesto que el problema es
claro en el sentido de que un valor diferente a 6.5 no rene las especificaciones.
Paso numero 2: Nivel de significacin.
0.05
36

Paso numero 3: Criterio de decisin.


Como la poblacin se distribuye normalmente y la prueba es bilateral, entonces,
2
segn las tabla para 19 grados de libertad el valor de X .0975 = 8.9065 y el valor
de

X 0.025

=32.8523. Por lo tanto, el criterio de decisin ser el siguiente: Si el

2
valor de X

calculado es menor que 8.90652 o mayor que 32.8523, se rechaza

la hiptesis nula de que la varianza sigue siendo de 6.5, con un nivel de


significacin del 5%.
Paso numero 4: Clculo del estadstico sobre el cual se basar la decisin.
2
n=20, S =7.3. Segn la frmula tenemos:

Paso numero 5: Tomar la decisin.


2
Como el valor de X calculado(21.34) se encuentra en la zona de aceptacin,
entonces, con un nivel de significacin del 5% se acepta la hiptesis nula de que
2
la variabilidad en el contenido sigue siendo la misma, es decir = 6.5.

PRUEBA DE HIPOTESIS PARA LA RAZON DE


VARIANZAS
Se define como la razn de dos variables Ji-cuadrada independientes,
provenientes de dos poblaciones normales, dividida cada una de ellas por sus
respectivos grados de libertad. En stas condiciones la razn de varianzas se
puede expresar como sigue:

El numerador representa a la varianza muestral mayor, mientras que el


denominador representa a la varianza muestral menor. Si el valor de F segn la
frmula anterior es igual a 1, entonces, podemos afirmar que las dos varianzas
poblacionales son iguales, pero si es diferente de 1, dicha diferencia puede ser no
significativa y podra deberse a problemas aleatorios o del azar. Tambin podra
37

suceder que si la razn es diferente de 1 dicha diferencia sea significativa como


para pensar que las dos varianzas poblaciones son diferentes.
Las pruebas de hiptesis para la razn de dos varianzas sigue el mismo proceso
visto en las secciones anteriores y el criterio de decisin F debe buscarse en las
tablas correspondientes.
Recordemos adems que para buscar el valor de F en las tablas, debemos
localizar los grados de libertad del numerador en la primera fila de la tabla y
localizar los grados de libertad del denominador en la primera columna de la tabla
La hiptesis nula ser siempre H0:

2
1

2
2

21
22

= 1.

EJEMPLO
Se quiere comprobar si la variabilidad en la duracin de unas lmparas marca A es
igualmente variable que la duracin de otra marca B de la competencia. Para tal
fin, se toma una muestra aleatoria de 13 lmparas tipo A y se encuentra que la
desviacin estndar muestral es S=8, mientras que en otra muestra aleatoria de
13 lmparas tipo B se encuentra que la desviacin estndar muestral es de S=4.
Se pide probar la hiptesis nula de que la variabilidad es igual en ambas
poblaciones con un nivel de significacin del 5%.
Solucin:
Se supone que la duracin de las lmparas se distribuye normalmente para ambas
marcas.
Paso numero 1: Hiptesis nula e hiptesis alternativa para prueba bilateral.
2
2
2
2
H0: 1 = 2 y H1: 1 2 .
Paso numero 2: Nivel de significacin.
0.05.
Paso numero 3: Criterio de decisin.
Si el valor de F calculado se encuentra fuera del intervalo sealado por los dos
valores de F segn la tabla, entonces rechazamos la hiptesis nula de que las dos
desviaciones estndar poblacionales son iguales. Es decir, si el valor de F
calculado est fuera del intervalo F(0.025,12,12) =3.28 y F(0.975,12,12) =
1/3.28 = 0.305, entonces se rechaza la hiptesis nula.
Paso numero 4: Clculo del estadstico sobre el cual se basar la decisin.
n1=13, S1=8, n2=13, S2=4
82
F= 42 = 4

38

Paso numero 5: Decisin.


Como 4 se encuentra fuera del intervalo segn el criterio de decisin, entonces,
con un nivel de significacin del 5%, se rechaza la hiptesis nula de que la
variabilidad sea igual para ambas marcas.

4 CORRELACIN Y REGRESIN
DISTRIBUCIONES BIDIMENSIONALES
Dos variables x e y estn relacionadas funcionalmente cuando conocida la primera
se puede saber con exactitud el valor de la segunda.
Dos variables x e y estn relacionadas estadsticamente cuando conocida la
primera se puede estimar aproximadamente el valor de la segunda.
Una variable bidimensional es una variable en la que cada individuo est definido
por un par de caracteres, (X, Y).

39

Estos dos caracteres son a


en las que s existe relacin
variables es la variable
variable dependiente.
Son aquellas en las que a
corresponden los valores de
representamos por el par.
(xi , yi).

Matemtic
as

Fsic
a

2
3
4
4
5
6
7
7
8
10
10
10

1
3
2
4
4
4
6
4
6
7
9
10

su vez variables estadsticas


entre ellas, una de las dos
independiente y la otra
cada individuo le
dos variables, las

Si representamos cada par de valores como las coordenadas de un punto, el


conjunto de todos ellos se llama nube de puntos o diagrama de dispersin.

Sobre la nube de puntos puede trazarse una recta que se ajuste a ellos lo mejor
posible, llamada recta de regresin.

Distribuciones Bidimensionales
12
10
8
6
4
2
0

40

10

11

COVARIANZA
La covarianza de una variable bidimensional es la media aritmtica de los
productos de las desviaciones de cada una de las variables respecto a sus medias
respectivas.
La covarianza se representa por sxy o xy.

La covarianza indica el sentido de la correlacin entre las variables

Si xy > 0 la correlacin es directa.

Si xy < 0 la correlacin es inversa.


La covarianza presenta como inconveniente, el hecho de que su valor depende de
la escala elegida para los ejes.

41

Es decir, la covarianza variar si expresamos la altura en metros o en centmetros.


Tambin variar si el dinero lo expresamos en euros o en dlares.

CORRELACIN
La correlacin trata de establecer la relacin o dependencia que existe entre las
dos variables que intervienen en una distribucin bidimensional.
Es decir, determinar si los cambios en una de las variables influyen en los cambios
de la otra. En caso de que suceda, diremos que las variables estn
correlacionadas o que hay correlacin entre ellas.
1 Correlacin directa
La correlacin directa se da cuando al aumentar una de las variables la otra
aumenta.
La recta correspondiente a la nube de puntos de la distribucin es una recta
creciente.

2 Correlacin inversa
La correlacin inversa se da cuando al aumentar una de las variables la otra
disminuye.
La recta correspondiente a la nube de puntos de la distribucin es una recta
decreciente.

42

3 Correlacin nula
La correlacin nula se da cuando no hay dependencia de ningn tipo entre las
variables.
En este caso se dice que las variables son incorreladas y la nube de puntos tiene
una forma redondeada.

COEFICIENTE DE CORRELACIN LINEAL


El coeficiente de correlacin lineal es el cociente entre la covarianza y el producto
de las desviaciones tpicas de ambas variables.
El coeficiente de correlacin lineal se expresa mediante la letra r.

Propiedades
43

1. El coeficiente de correlacin no vara al hacerlo la escala de medicin.


Es decir, se expresa a la altura en metros o en centmetros el coeficiente de
correlacin no vara.
2. El signo del coeficiente de correlacin es el mismo que el de la covarianza.
Si la covarianza es positiva, la correlacin es directa.
Si la covarianza es negativa, la correlacin es inversa.
Si la covarianza es nula, no existe correlacin.
3. El coeficiente de correlacin lineal es un nmero real comprendido entre 1 y 1.
1 r 1
4. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin
es fuerte e inversa, y ser tanto ms fuerte cuanto ms se aproxime r a 1.
5. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin
es fuerte y directa, y ser tanto ms fuerte cuanto ms se aproxime r a 1.
6. Si el coeficiente de correlacin lineal toma valores cercanos a 0, la correlacin
es dbil.
7. Si r = 1 1, los puntos de la nube estn sobre la recta creciente o decreciente.
Entre ambas variables hay dependencia funcional.

RECTA DE REGRESIN
La recta de regresin es la que mejor se ajusta a la nube de puntos.
La recta de regresin pasa por el punto
de gravedad.

centro de gravedad llamado centro

Recta de regresin de Y sobre X


La recta de regresin de Y sobre X se utiliza para estimar los valores de la Y a
partir de los de la X.
La pendiente de la recta es el cociente entre la covarianza y la varianza de la
variable X.
44

Recta de regresin de X sobre Y


La recta de regresin de X sobre Y se utiliza para estimar los valores de la X a
partir de los de la Y.
La pendiente de la recta es el cociente entre la covarianza y la varianza de la
variable Y.

BIBLIOGRAFA
Covarianza y Complementos
http://www.biostat.jhsph.edu/~lcollado/Courses/MEyAdDG/day2/Pruebas%20de
%20Hip%C3%B3tesis.pdf
Gua documentos Unidad 5
http://www.cecyt11.ipn.mx/Documents/estudiantes/guia_estudio/probabilidad%20y
%20estadistica.PDF
Regresin y correlacin
http://probyestfjad.blogspot.mx/2008/12/desarrollo-de-la-unidad-5-regresin-y.html
Libro de Probabilidad y Estadstica
http://www.mate.unlp.edu.ar/~maron/MaronnaHome_archivos/Probabilidad%20y
%20Estadistica%20Elementales.pdf
Libro de Probabilidad y Estadstica
http://www.x.edu.uy/inet/EstadisticayProbabilidad.pdf

45

2 Estimacin Puntual
http://www.est.uc3m.es/esp/nueva_docencia/getafe/ciencias_estadisticas/Tecnicas
InferenciaEstadistica/doc_grupo1/Intervalos-Grado%20en%20Est.%20y
%20Empr_9.pdf
http://www.ub.edu/stat/GrupsInnovacio/Statmedia/demo/Temas/Capitulo8/B0C8m1
t11.htm
http://www.virtual.unal.edu.co/cursos/ciencias/2001065/html/un3/cont_307_85.html
http://www.ub.edu/stat/GrupsInnovacio/Statmedia/demo/Temas/Capitulo8/B0C8m1
t17.htm
http://www.geociencias.unam.mx/~ramon/EstInf/Clase11.pdf

3 Hiptesis

Devore, J. (2005). Probabilidad y Estadstica para ingeniera y ciencias Sexta


edicin. Mxico, D. F.: Thomson.
Walpole, R. (1999). Probabilidad y estadstica para ingenieros. Mxico, D. F.:
Prentice Hall.
Alvarado J., Obagi J. (2008). Fundamentos de inferencia estadstica, Primera
edicin. Bogot, D.C.: Editorial Pontificia Universidad Javeriana.

Explorable, Hiptesis nula. (s.f.). Recuperado el 15 de mayo del 2015, de


https://explorable.com/es/hipotesis-nula
Pruebas de hiptesis para una muestra. (s.f.). Recuperado el 15 de mayo del
2015, de
http://www.geociencias.unam.mx/~ramon/EstInf/Clase13.pdf
Pruebas de hiptesis para dos muestras. (s.f.). Recuperado el 15 de mayo del
2015, de
http://es.slideshare.net/domingodelacerda/prueba-de-hipotesis-para-dos-muestra
Prueba de hiptesis para medias. (s.f.). Recuperado el 15 de mayo del 2015, de
http://www.monografias.com/trabajos91/prueba-hipotesis-medias-excel-ywinstats/prueba-hipotesis-medias-excel-y-winstats.shtml
Formato con autor del documento consultado:
46

Giraldo, Hugo. (Fecha de revisin o copyright, no disponible).


Estadstica. Recuperado el 15 de mayo del 2015, del sitio Web
de la Universidad Nacional de Colombia de la URL:
http://www.bdigital.unal.edu.co/2010/1/hugogomezgiraldo.2009.pdf

CONCLUSIN

A continuacin presentamos nuestro trabajo de investigacin y por consecuencia


de estudio didctico de la unidad nmero cinco de probabilidad y estadstica,
sabemos que no solo basta con leer la unidad completa, sino que llevarla a cabo
con ejercicios, es por eso que el equipo decidi llevarlo en prctica y saber
realmente lo que estamos estudiando.
Somos conscientes de nuestras capacidades de estudio por eso, hay que estar
bien preparados para un futuro y ejercer nuestra especialidad y comportarnos
realmente como Ingenieros, de manera que somos capaces de analizar y
comprender loes elementos de la unidad 5 a fondo.

47

48

You might also like