You are on page 1of 16

1

Captulo 1. Conceptos bsicos de la Estadstica


1.1 El anlisis estadstico
El anlisis estadstico de datos engloba un conjunto de procedimientos diseados para:
1. Seleccionar datos
2. describirlos y
3. extraer conclusiones de ellos.
Estadstica: Ciencia que recoge, ordena y analiza los datos de una muestra extraida de una determinada
poblacin, para hacer inferencias acerca de esa poblacin valindose del clculo de probabilidades
Estadstica descriptiva. Organizar y resumir la informacin contenida en un conjunto (muestra) de datos.

Estadstica inferencial. Generalizar (inferir) las propiedades de un conjunto de datos empricos (muestra)
al conjunto total de datos (poblacin) a los que representa. Para poder efectuar esta generalizacin es
imprescindible que el conjunto de datos utilizados para obtener informacin sea representativo del
conjunto total de datos sobre el que se desea realizar la inferencia, es decir, es necesario efectuar una
correcta seleccin de los datos (Tcnicas de muestreo).
2
Captulo 1. Conceptos bsicos de la Estadstica
1.2 Conceptos bsicos
Poblacin. Conjunto de elementos que poseen una o ms caractersticas en comn. Dependiendo del nmero
de elementos de que constan, las poblaciones son finitas o infinitas.
Muestra. Subconjunto de elementos de una poblacin. El objetivo de la inferencia estadstica es extraer
conclusiones referidas a todos los elementos de la poblacin a partir de la observacin de slo unos pocos
elementos de esa poblacin. Para que esto sea posible es necesario que la muestra sea representativa de la
poblacin, esto se consigue mediante las tcnicas de muestreo.
Parmetro. Valor numrico que describe una caracterstica de una poblacin. Los parmetros son, en general,
valores poblacionales desconocidos. Los parmetros son valores numricos constantes, es decir, NO son
variables.
Estadstico. Valor numrico que describe una caracterstica de la muestra. NO es un valor numrico constante,
sino que es una variable: su valor concreto depende de la muestra en la que es calculado.
n
Muestreo. Proceso seguido para extraer una muestra de una poblacin. Es necesario utilizar muestras
representativas del total de la poblacin, es decir, muestras en las que exista alguna garanta de que cualquier
elemento de la poblacin ha podido estar representado en ellas. El muestreo puede ser de dos tipos:
- Muestreo probabilstico. En este muestreo se conoce (o puede calcularse) la probabilidad asociada a
cada una de las muestras que es posible extraer de una determinada poblacin
- Muestreo no probabilstico. En l se desconoce o no se tiene en cuenta la probabilidad asociada a cada
una de las muestras posibles; el investigador selecciona aquella muestra que, en su opinin, es ms
representativa.
Solo el muestreo probabilstico permite obtener una idea sobre el grado de representatividad de una muestra.
Distribucin muestral. El concepto de distribucin muestral se refiere al comportamiento de un estadstico.
Los estadsticos son variables aleatorias. Como tales, tienen su propia funcin de probabilidad. Una
distribucin muestral puede quedar caracterizada haciendo explcita su forma o su valor esperado y su varianza.
3
Captulo 1. Conceptos bsicos de la Estadstica
1.3 Distribuciones de probabilidad ms usuales
DISTRIBUCIN NORMAL.
( )
2
2
2
Una v.a. X se dice que sigue una distribucion Normal de media y desviacion tipica (X N( , )) si
su funcion de densidad es
1 1
( ) exp ,
2
2
x
f x x
o o

o
to


= e
`

)
Caso tabulado: N(0,1) Tipificacin:
Si ( , ) (0,1)
X
X N Z N

o
o

=
DISTRIBUCIN CHI-CUADRADO
2 2 2
1 n 1 n
Sean X ,...,X v.a. independientes e identicamente distribuidas segun N(0,1) Y=X + +X _
DISTRIBUCIN T-STUDENT
2
n
Z
Sean Z (0,1), Y , Z e Y v.a. independientes T=
Y
n
n
N t _
DISTRIBUCIN F-SNEDECOR
2 2
m ,
/
Sean X , Y , X e Y v.a. independientes F=
/
n n m
X n
F
Y m
_ _
4
Captulo 1. Conceptos bsicos de la Estadstica
1.4 La inferencia estadstica
Consiste en utilizar la informacin muestral para inferir alguna propiedad de la poblacin. Es decir, utilizar
un estadstico que recibe el nombre de estimador para inferir el valor de algn parmetro. A esta estimacin
directa se le llama estimacin puntual.
Si al valor muestral o estimador puntual se le suma y resta una cantidad para estimar no un valor concreto,
sino un rango de valores, se habla de estimacin por intervalos. La cantidad que se suma y se resta se llama
error mximo y depende de la distribucin muestral del estadstico. El error mximo se calcula intentando que
el intervalo construido incluya el valor del parmetro con una probabilidad alta y conocida. Esta probabilidad
recibe el nombre de nivel de confianza y suele establecerse en 0.95. El intervalo de valores se le llama
intervalo de confianza y viene definido por dos valores: el lmite inferior y el lmite superior.
1.4.1 La estimacin de parmetros
1.4.2 Contrastes de hiptesis
Es un mtodo de toma decisiones. Es un procedimiento que permite decidir si una proposicin acerca de una
poblacin puede ser mantenida o debe ser rechazada. Pasos:
1. Formular estadsticamente la hiptesis cientfica que se desea contrastar.
2. Buscar evidencia emprica relevante capaz de informar sobre si la hiptesis establecida es o no
sostenible.
3. Establecer una regla de decisin. Esta regla es de este tipo: si el resultado muestral observado es,
suponiendo correcta la hiptesis, muy poco probable, se considerar que la hiptesis es incompatible con
los datos; por el contrario, si el resultado muestral observado es, suponiendo correcta la hiptesis,
probable, se considerar que la hiptesis es compatible con los datos.

v m
=
5
Captulo 1. Conceptos bsicos de la Estadstica
1.4 La inferencia estadstica
1.4.2 Contrastes de hiptesis
Hiptesis estadsticas. Una afirmacin sobre la forma de una o ms distribuciones de probabilidad o sobre
el valor de uno o ms parmetros de esas distribuciones. Un contraste de hiptesis se basa en la formulacin
de dos hiptesis:
1. Hiptesis nula. Es la que se somete a contraste.
2. Hiptesis alternativa. Es la negacin de la hiptesis nula. Incluye todo lo que excluye la hip. nula.
Suelen plantearse como hiptesis rivales. Son exhaustivas y mutuamente excluyentes.
El signo = siempre va en la hiptesis nula ya que es desde donde se inicia el proceso de contrastacin.
Si en la hip. alternativa aparece el signo distinto estamos ante un contraste bilateral. En otro caso ser un
contraste unilateral.
Supuestos. Una hiptesis que especifica por completo la distribucin poblacional se le llama simple. En otro
caso se denomina compuesta. Los supuestos son un conjunto de afirmaciones que hay que establecer sobre la
poblacin de partida y sobre la muestra utilizada para conseguir determinar la distribucin de probabilidad en
la que se basar la decisin sobre la hiptesis nula.
Estadstico de contraste. Es un resultado muestral que
1. proporciona informacin emprica relevante sobre la afirmacin propuesta en la hiptesis nula.
2. posee una distribucin muestral conocida.

6
Captulo 1. Conceptos bsicos de la Estadstica
1.4 La inferencia estadstica
1.4.2 Contrastes de hiptesis
Regla de decisin. Criterio que se utiliza para decidir si la hiptesis nula planteada debe o no ser rechazada.
Se basa en la particin de la distribucin muestral del estadstico de contraste en dos zonas exclusivas y
exhaustivas:
1. Zona de rechazo. rea de la distribucin muestral que corresponde a los valores del estadstico de
contraste que se encuentran tan alejados de la afirmacin de la hiptesis nula, que es muy poco
probable que ocurran si la hiptesis nula es verdadera. Su probabilidad se denomina nivel de
significacin.
2. Zona de aceptacin. rea de la distribucin muestral que corresponde a los valores del estadstico
prximos a la afirmacin establecida en la hiptesis nula.
Los valores que separan ambas regiones se denominan valores crticos. La regla de decisin consiste en
rechazar la hiptesis nulas si el estadstico de contraste toma un valor perteneciente a la regin de rechazo y
mantenerla si el estadstico toma un valor perteneciente a la zona de aceptacin.
El tamao de las zonas de rechazo y de aceptacin se determina fijando el nivel de significacin (1%, 5%)
La forma de dividir la distribucin muestral en zona de rechazo y zona de aceptacin depende de que el
contraste sea bilateral o unilateral.
La decisin. Consiste en rechazar o mantener la hiptesis nula particular. Si se rechaza se est afirmando que
esa hiptesis es falsa. Por el contrario, si se mantiene, no se est afirmando que ha quedado probado que esa
hiptesis es verdad, simplemente se est afirmando que no se dispone de evidencia emprica suficiente para
rechazarla y que, por tanto, puede considerarse compatible con los datos.
7
Captulo 1. Conceptos bsicos de la Estadstica
1.5 Intervalos de confianza en poblaciones normales
Media
poblacional:
Diferencias de
medias
poblacionales:


Muestras pequeas (< o = 30):
Diferencias de
medias pobl.:

Muestras grandes
o
o
=
(
(

|
|
.
|

\
|
e

1
2
1 ; 1
n
S
t X P
n
2 2
y x
o o = -
( )
( ) ( )
2 2
2;1
2
1 1
1 1
1
2
x y
x y
n m
n S m S
P X Y t
n m n m
o
o
+
( | |
+
( |
e + =
| + (
\ .
2 2
y x
o o = - ( )
( ) ( )
2
2
2 2 2
2 2 2
;1
2
2 2
1
1 , ,
1
1 1
y
x x x
x y
v
y y
S
S S n m
P X Y t v
n m S
n n m m
o
u
o
o u
u o

| |
+
( | | |
\ .
( |
e + = = = ~
|
(
\ . +

( ) o
o
=
(
(

|
|
.
|

\
|
+ e

1
2
2
2
1
y
y
x
x
y x
n
S
n
S
z Y X P
8
Captulo 1. Conceptos bsicos de la Estadstica
1.5 Intervalos de confianza en poblaciones normales

Varianza
poblacional:
Cociente de
varianzas
pob.:
Proporcin
poblacional:
Diferencia de
proporciones
poblacionales
2 2 2
2 2 2
1, 1;1
2
1, 1;1
2
1
, 1
y y y
n m
x x x
m n
S S
P f
f S S
o
o
o
o
o


(
| |
( |
e =
( |
|
(
\ .

o
o
=
(
(

|
|
.
|

\
|

e

1
) 1 (

2
1
n
p p
z p p P
( )
1
2
(1 )
(1 )
1
y y
x x
x y x y
p p
p p
P p p p p z
n m
o
o

(
| |

( e + = |
|
(
\ .

( ) ( )
o
_ _
o
o o
=
(
(
(

|
|
|
.
|

\
|

e

1
1
,
1
2
2
; 1
2
2
2
1 ; 1
2
2
n n
S n S n
P
9
Sobre la media poblacional
Captulo 1. Conceptos bsicos de la Estadstica
1.6 Contrastes de hiptesis en poblaciones normales
Hiptesis Nula Valor del Estadstico bajo Hip. Nula
Hiptesis Alternativa Regin Crtica
0 0
: = H
n
S
X
t
0
exp

=
o
o
o
o







s <
> >

>
s
=
1 ; 1 exp 0 0 1
1 ; 1 exp 0 0 1
2
1 ; 1
exp
2
1 ; 1
exp
0 0 1
t si Rechazar : H
t si Rechazar : H
si Rechazar : H
n
n
n
n
t H
t H
t t

t t
H
10
Sobre la diferencia de medias poblacionales.
Varianzas Poblacionales desconocidas pero iguales. Muestras Pequeas
Hiptesis Nula Valor del Estadstico bajo Hip. Nula
Hiptesis Alternativa Regin Crtica
0 0
: =
y x
H
( ) ( )
0
exp
2 2
1 1
1 1
2
x y
X Y
t
n S m S
n m n m

=
+
+
+
exp
2;1
2
1 0 0
exp
2;1
2
1 0 0 exp 2;1
1
H : Rechazar si
H : Rechazar si t
H :
n m
x y
n m
x y n m
t t
H
t t
H t
o
o
o

+
+
+
s

>

> >
0 0 exp 2;1
Rechazar si t
x y n m
H t
o

+
< s
Captulo 1. Conceptos bsicos de la Estadstica
1.6 Contrastes de hiptesis en poblaciones normales
11
Hiptesis Nula Valor del Estadstico bajo Hip. Nula
Hiptesis Alternativa Regin Crtica
0 0
: =
y x
H
0
exp
2
2
y
x
X Y
t
S
S
n m

=
+
o
o
o
o


s <
> >

>
s
=
1 ; exp 0 0 1
1 ; exp 0 0 1
2
1 ;
exp
2
1 ;
exp
0 0 1
t si Rechazar : H
t si Rechazar : H
si Rechazar : H
v y x
v y x
v
v
y x
t H
t H
t t

t t
H
( ) ( )
2
2 2
2 2 2
2 2 2 2
1
;
1
1 1
x x
y y
S n m
v
S
n n m m
u
o
u
u o
| |
+
|
\ .
= = ~
+

Sobre la diferencia de medias poblacionales.
Varianzas Poblacionales desconocidas y diferentes. Muestras Pequeas
Captulo 1. Conceptos bsicos de la Estadstica
1.6 Contrastes de hiptesis en poblaciones normales
12
Hiptesis Nula Valor del Estadstico bajo Hip. Nula
Hiptesis Alternativa Regin Crtica
0 0
: =
y x
H
0
exp
2
2
y
x
X Y
z
S
S
n m

=
+
o
o
o
o


s <
> >

>
s
=
1 exp 0 0 1
1 exp 0 0 1
2
1
exp
2
1
exp
0 0 1
si Rechazar : H
si Rechazar : H
si Rechazar : H
z z H
z z H
z z

z z
H
y x
y x
y x
Sobre la diferencia de medias poblacionales.
Varianzas Poblacionales desconocidas. Muestras grandes
Captulo 1. Conceptos bsicos de la Estadstica
1.6 Contrastes de hiptesis en poblaciones normales
13
Hiptesis Nula Valor del Estadstico bajo Hip. Nula
Hiptesis Alternativa Regin Crtica
2
0
2
0
: o o = H
( )
2
0
2
exp
1
o
_
S n
=
2
; 1 exp 0
2
0
2
1
2
1 ; 1 exp 0
2
0
2
1
2
2
1 ; 1
exp
2
2
; 1
exp
0
2
0
2
1
si Rechazar : H
si Rechazar : H
si Rechazar : H
o
o
o
o
_ _ o o
_ _ o o
_ _
_ _
o o

s <
> >

>
s
=
n
n
n
n
H
H

H
Sobre la varianza poblacional
Captulo 1. Conceptos bsicos de la Estadstica
1.6 Contrastes de hiptesis en poblaciones normales
14
Hiptesis Nula Valor del Estadstico bajo Hip. Nula
Hiptesis Alternativa Regin Crtica
2 2
0
:
y x
H o o =
2
2
exp
y
x
S
S
f =
exp
1, 1;1
2
2 2
1 0
exp
1, 1;1
2
2 2
1 0
1
H : Rechazar si
H : Rechazar si
m n
x y
n m
x y
f
f
H

f f
H
o
o
o o
o o

>

>
exp 1, 1;1
2 2
1 0 exp
1, 1;1
f
1
H : Rechazar si f
n m
x y
m n
f
H
f
o
o
o o


>
< s
Sobre igualdad de varianzas poblacionales
Captulo 1. Conceptos bsicos de la Estadstica
1.6 Contrastes de hiptesis en poblaciones normales
15
Hiptesis Nula Valor del Estadstico bajo Hip. Nula
Hiptesis Alternativa Regin Crtica
0 0
: p p H =
( )
n
p p
p p
z
0 0
0
exp
1

=
o
o
o
o

s <
> >

>
s
=
1 exp 0 0 1
1 exp 0 0 1
2
1
exp
2
1
exp
0 0 1
si Rechazar p : H
si Rechazar p : H
si Rechazar p : H
z z H p
z z H p
z z

z z
H p
Sobre una proporcin poblacional
Captulo 1. Conceptos bsicos de la Estadstica
1.6 Contrastes de hiptesis en poblaciones normales
16
Hiptesis Nula Valor del Estadstico bajo Hip. Nula
Hiptesis Alternativa Regin Crtica
y x
p p H = :
0
exp


1
x y
x y x y
p p
z
np mp np mp
n m
nm n m n m

=
+ + | | +

|
+ +
\ .
o
o
o
o

s <
> >

>
s
=
1 exp 0 y x 1
1 exp 0 y x 1
2
1
exp
2
1
exp
0 y x 1
si Rechazar p : H
si Rechazar p : H
si Rechazar p : H
z z H p
z z H p
z z

z z
H p
Sobre igualdad de proporciones poblacionales
Captulo 1. Conceptos bsicos de la Estadstica
1.6 Contrastes de hiptesis en poblaciones normales

You might also like