Professional Documents
Culture Documents
INFERENCIA ESTADSTICA
INTRODUCCIN.
El empleo de encuestas es uno de los mtodos de investigacin ms utilizados en
la actualidad. La realidad, en continuo cambio y con muchsimas opciones diferentes, es
muy difcil de abarcar en su totalidad. Por este motivo se hace necesario seleccionar una
parte lo ms pequea posible, pero representativa del total, en la que sea posible medir
las caractersticas deseadas. Esta necesidad ha obligado a crear un instrumento
matemtico que llamamos muestreo.
Las muestras que se elijan para hacer un estudio deben ser lo ms pequeas
posible por exigencias de tiempo y coste. Adems, el aumento del nmero de datos no
siempre acarrea una mayor certeza, ya que ms importante que escoger muchos datos es
que los datos estn bien seleccionados, con el fin de que sean representativos de la
poblacin que se desea estudiar. Se ver como el azar juega un papel importante en la
eleccin de la muestra para que sta sea representativa.
En este tema estudiaremos dos parmetros de una poblacin: la media de una
determinada caracterstica numrica y la proporcin o porcentaje de la poblacin que
comparte un determinado rasgo comn.
La inferencia estadstica se basa en resultados de la teora de la probabilidad, los
cuales nos aseguran, que al estudiar la media o la proporcin de muestras, tomadas
adecuadamente en la poblacin, estas caractersticas sern muy similares a las de la
poblacin total.
El mtodo de inferencia estadstica hace estimaciones de lo que ocurre en toda la
poblacin estudiando lo que ocurre en una parte de la misma (la muestra). Como se
pretende sacar conclusiones sobre el total de la poblacin a partir de una muestra de la
misma, estas conclusiones estarn sujetas a error. La teora de la probabilidad permite
tambin acompaar a la estimacin muestral de una media o de una proporcin, en una
poblacin, de la probabilidad de que el error cometido no exceda de un determinado
valor, o del riesgo (probabilidad de equivocacin) que se corre al aceptar o al rechazar
una hiptesis sobre los valores de la media o de la proporcin de la poblacin.
Ahora bien, la inferencia se hace a partir de muestras que deben estar
debidamente escogidas. Por esta razn trataremos previamente a los mtodos de la
inferencia, las tcnicas de muestreo, es decir, las diversas formas de poder seleccionar
una muestra que sea adecuada para realizar las inferencias, controlando el posible error.
Para trabajar este tema se necesita el manejo de los nmeros combinatorios
como herramienta de clculo y el conocimiento y uso de la distribucin normal y sus
propiedades.
Finalmente, insistir en la importancia de la inferencia estadstica como disciplina
fundamental en todas las reas cientficas, tanto naturales como sociales.
Inferencia estadstica.
ESTADSTICA
POBLACIN Y MUESTRA.
En el campo de la Estadstica el concepto de poblacin se encuentra prximo a
la nocin general de grupo o conjunto.
Definicin.
POBLACIN.
Se llama poblacin o universo a cualquier conjunto, colectivo o
coleccin finita o infinita de individuos o elementos.
Una poblacin puede ser, no slo un conjunto de personas, sino tambin un
conjunto de animales, objetos, fenmenos, medidas, .....
Ejemplo:
Si pasamos un test a todos los alumnos espaoles de una determinada edad, los
resultados obtenidos constituyen una poblacin de medidas de la capacidad a la que se
derige el test.
Definicin.
CENSO.
Se da el nombre de censo a la enumeracin y anotacin de ciertas
caractersticas de todos los elementos de una poblacin.
Ejemplo:
El profesor-tutor de un grupo de un instituto realiza un listado de los alumnos/as
de su tutora, en la incluye, nombre y apellidos, nombre de los padres, domicilio,
telfono, nmero de hermanos y asignaturas pendientes del curso anterior. Este sera un
ejemplo de censo de la poblacin formada por el alumnado del grupo en cuestin.
Las poblaciones en Estadstica pueden ser finitas o infinitas. Una poblacin es
finita cuando consta de un nmero limitado de unidades, y una poblacin es infinita
cuando su tamao es indefinidamente grande.
Ejemplo:
- Si consideramos el nmero de hermanos que tienen los alumnos/as de un
curso de un instituto determinado, estaramos hablando de una poblacin
finita. Habra tantos valores como alumnos/as haya en dicho curso.
- Si obtenemos una serie de medidas del tiempo que tarda un alumno en
resolver una divisin de dos cifras, estas medidas pueden consideradas parte
de un conjunto mucho mayor, de tamao indefinidamente grande,
constituido por todas las medidas que obtendramos si repitisemos la
experiencia una y otra vez.
- Supongamos que se lanza un dado en reiteradas ocasiones, y anotamos el
valor de la cara superior. Tal experiencia puede ser repetidamente hasta el
infinito, por lo que cualquier conjunto de resultados podra ser considerado
una parte extrada de una poblacin indefinidamente grande.
En definitiva, con frecuencia, las poblaciones en Estadstica suelen ser
consideradas infinitas.
Inferencia estadstica.
ESTADSTICA
El gran tamao que presentan algunas poblaciones es precisamente la principal
razn que hace recomendable reducir su estudio a muestras obtenidas de ellas.
Definicin.
MUESTRA.
Se define muestra como una parte o subconjunto de una poblacin,
debidamente elegida, que se somete a observacin cientfica en representacin
de la misma, con el propsito de obtener resultados vlidos para el total de la
poblacin.
Para que una muestra se considere vlida debe cumplir que:
Inferencia estadstica.
ESTADSTICA
c) El impacto sobre la realidad estudiada. Cuando el estudio realizado pudiera
provocar efectos en los sujetos, parece adecuado limitar la realizacin de
experimentos a mbitos reducidos. Por ejemplo, la medicin de los
resultados de un nuevo mtodo de aprendizaje de la lectura habra de hacerse
sobre un nmero reducido de alumnos, sin extender a toda la poblacin la
nueva metodologa hasta no confirmar los resultados positivos de la misma.
d) Una poblacin homognea. Si la poblacin es homognea se pueden obtener
muy buenos resultados a partir de cualquier muestra.
e) La falta de personal. Si no se dispone de suficiente personal preparado para
llevar a cabo un estudio exhaustivo, tambin resulta aconsejables hacer un
muestreo.
Por otro lado, el uso del muestreo presenta limitaciones, entre estas destacamos:
a)
b)
c)
d)
El riesgo que supone la toma de una muestra que pueda no ser representativa.
Cuando es necesaria informacin de todos los elementos de la poblacin.
Cuando no se domina bien la tcnica de muestreo.
Cuando la poblacin est formada por un nmero muy pequeo de
elementos, ya que una ligera equivocacin en la toma de la muestra puede
originar grandes errores.
Inferencia estadstica.
ESTADSTICA
Definicin.
ESTADSTICO Y ESTIMADOR DE UN ESTADSTICO.
Los valores que describen a las poblaciones recibirn el nombre de
parmetros o estadsticos, mientras que las medidas que describen el
comportamiento de una muestra se denomina estimador del parmetro o
estimador del estadstico.
Ejemplo:
A partir del valor alcanzado por la media en una muestra podramos intentar
estimar el valor de la media de en la poblacin. As, si los diez jvenes del ejemplo
anterior son alumnos/as elegidos al azar de una escuela de baloncesto, intentaramos
deducir la estatura media de los integrantes de dicha escuela, tomando como referencia
los 176 centmetros obtenidos.
TIPOS DE MUESTREO.
Definicin.
MUESTREO.
Se llama muestreo al procedimiento mediante el cual elegimos a las
unidades estadsticas que forman la muestra, dentro del conjunto que constituye
la poblacin.
Diremos que el muestreo es probabilstico cuando todos los elementos
de la poblacin poseen un probabilidad conocida (o calculada de antemano), no
nula, de ser elegidos para formar parte de la muestra. Se contrapone al llamado
muestreo no probabilstico, en el que, o bien no se conoce la probabilidad de
que los elementos de la poblacin sean seleccionados para la muestra, o bien
para parte de ellos esta probabilidad es nula y, por tanto, no es posible llevar a
cabo inferencias estadsticas.
Lgicamente, el muestreo que se encuentra en la base de la mayora de los
mtodos de la Estadstica Inferencial es el muestreo probabilstico. Para llevarlo a cabo
es necesario que la seleccin pueda considerarse como una prueba o experimento
aleatorio o de azar, de los que constituyen la base de la teora de la probabilidad en la
cual se fundamenta la estadstica matemtica.
Las generalizaciones de resultados, a partir del estudio de muestras extradas
mediante procedimientos de muestreo no probabilstico, nos impiden conocer el margen
de error con el que hacemos las generalizaciones a la poblacin. En cambio, el muestreo
probabiltico permite hacer inferencias sobre la poblacin, y gracias a los
procedimientos de la Estadstica Inferencial podemos conocer el error con el que se
realizan las generalizaciones.
En las pginas siguientes, se describen muestreos probabilsticos (muestreo
aleatorio con y sin reposicin, muestreo aleatorio sistemtico, muestreo estratificado,
muestreo por conglomerados, muestreo polietpico) y muestreos no probabilticos
(muestreo intencional, por cuotas, incidental y accidental), pero antes incluiremos dos
Inferencia estadstica.
ESTADSTICA
conceptos que aparecen al referirnos al muestreo: factor o coeficiente de elevacin y
fraccin de muestreo.
Definiciones.
FACTOR DE ELEVACIN.
Se denomina factor o coeficiente de elevacin al cociente entre el
N
tamao de la poblacin y el tamao de la muestra,
. Representa el nmero de
n
elementos que hay en la poblacin por cada elemento de la muestra.
FRACCIN DE MUESTREO.
Se denomina fraccin de muestreo al cociente entre el tamao de la
n
muestra y el tamao de la poblacin,
. Si se multiplica por 100, representa el
N
porcentaje de la poblacin que representa la muestra.
A) MUESTREOS PROBABILSTICOS.
Muestreo aleatorio simple con y sin reposicin. Se denomina muestreo
aleatorio simple a aquel en que todos los elementos de la poblacin tienen la misma
probabilidad de formar parte de la muestra y sta es determinada nicamente por el
azar. Se trata de un tipo de muestreo probabilstico que permite con facilidad llevar a
cabo inferencias estadsticas y calcular la probabilidad de error asociada a las mismas.
Concretando, el muestreo aleatorio simple consiste en seleccionar n elementos
con o sin reemplazamiento de entre los N elementos que componen la poblacin, de tal
modo que todas las muestras de tamao n que se puedan formar tengan la misma
probabilidad de ser elegidas.
Si la muestra se selecciona sin reemplazamiento (es decir, cuando un elemento
ha sido extrado queda descartado de cara a la siguiente extraccin) se habla de
muestreo aleatorio sin reposicin, tambin llamado muestreo irrestrictamente
aleatorio.
Si la muestra se selecciona con reemplazamiento (es decir, el elemento elegido
en cada extraccin vuelve a ser incluido en la poblacin antes de extraer el siguiente
elemento) se habla de muestreo aleatorio con reposicin, tambin llamado
generalmente muestreo aleatorio simple.
Si bien los dos mtodos son distintos, cuando el tamao de la poblacin es
infinito o tan grande que pueda considerarse como infinito, ambos mtodos llegan a las
n
mismas conclusiones. Si la fraccin de muestreo
es mayor de 0.1 (se muestrea ms
N
del 10 % de la poblacin) la diferencia entre ambos mtodos puede ser apreciable,
llegando a conclusiones contradictorias segn se aplique un mtodo u otro.
Inferencia estadstica.
ESTADSTICA
Ejemplo:
En el muestreo aleatorio sin reposicin, el nmero de muestras de tamao n que
N
se pueden formar es: , y, por tanto, la probabilidad de elegir una muestra
n
N n ! n! .
1
determinada es: p
N!
N
n
La probabilidad de que un elemento determinado de la poblacin forme parte de
n
la muestra viene dada por p .
N
En efecto:
N 1
casos favorables n 1 N 1! N n ! n! n
p
.
N n ! n 1! N! N
casos posibles
N
n
Inferencia estadstica.
ESTADSTICA
Muestreo aleatorio sistemtico. El muestreo aleatorio sistemtico resulta ser un
procedimiento ms cmodo que el muestreo aleatorio, con o sin reposicin, cuando la
poblacin o la muestra que vamos a extraer son grandes. En lugar de recurrir a
papeletas, bolas, tablas de nmeros aleatorios o calculadora, puede determinarse la
muestra eligiendo sistemticamente, en una relacin ordenada de los individuos de la
poblacin, aquellos que se encuentren a una distancia determinada. Suponiendo que el
tamao de la muestra es N y que la muestra que queramos extraer constara de n
individuos, procederamos del siguiente modo:
N
.
n
b) Elegimos aleatoriamente un nmero m comprendido entre 1 y k.
c) Determinamos la muestra sumndole repetidamente k al nmero, m,
elegido.
a) Calculamos el coeficiente de elevacin, k
m, m k , m 2k , m 3k , ........, m n 1k
Para que la muestra conserve el carcter aleatorio, debemos procurar que la
ordenacin de los individuos de la poblacin no presente tendencias que hagan recaer la
eleccin sistemtica sobre unidades que no sean representativas de la heterogeneidad de
la poblacin.
Ejemplo:
Supongamos que queremos hacer una investigacin en un instituto de 720
alumnos y alumnas, de los que queremos tomar una muestra de 80 individuos. En
primer lugar, ordenar todos los alumnos y alumnas alfabticamente sera un buen
criterio de ordenacin. Sin embargo, disponer los alumnos situando una tras otra las
listas de los alumnos/as de cada clase, en las que estos aparezcan por orden de
calificaciones, podra llevar a que se seleccionaran sistemticamente los alumnos/as con
calificaciones altas y no los de las calificaciones bajas, o viceversa.
Una vez ordenados adecuadamente, calculamos el coeficiente o factor de
720
elevacin
9 . Elegimos aleatoriamente un nmero entre 1 y 9 (tabla de nmeros
80
aleatorios, calculadora, .....). Si el nmero obtenido fuese 6, los individuos
seleccionados seran:
{6, 15 (= 6+9), 24 (= 6+2 9), 33 (=6+3 9), ........, 717 (=6+79 9)}
Evidentemente, k no suele ser un nmero entero. Si se desprecian los decimales
ocurrir que una parte de los sujetos que se encuentran al final de la ordenacin pierden
toda posibilidad de ser elegidos. Una solucin podra consistir en mantener los
decimales del coeficiente k y redondear el resultado de las sumas al nmero entero ms
prximo, una vez que se han realizado todas ellas. Otra sera, sumar alternativamente las
cantidades Ent(k) y Ent(k) +1.
Adems del procedimiento que acabamos de exponer, existen otras formas de
muestreo que tambin se consideran muestreos sistemticos. Por ejemplo, para elegir
una muestra de personas, podemos seleccionar una o varias letras del abecedario y
tomar como muestra todos los sujetos cuyo apellido comience por esa(s) letra(s).
Inferencia estadstica.
ESTADSTICA
Muestreo estratificado. El muestreo estratificado se realiza cuando queremos
garantizar cierta representatividad de la muestra respecto de alguna caracterstica. Para
ello, en funcin de esa caracterstica, dividimos la poblacin de tamao N en K estratos
o subpoblaciones de tamaos respectivos N1 , N 2 , N 3 , ........, N K y elegimos de forma
aleatoria (mediante sorteo, tablas, procedimientos sistemticos, .....) submuestras de
tamaos n1 , n2 , n3 , ........, nk en cada estrato, asegurndonos de este modo de que
todas las subpoblaciones estarn representadas en la muestra. La muestra total ser la
suma de las submuestras elegidas en cada estrato, es decir, n n1 n2 n3 ........ nk .
Cabe diferenciar entre muestreo estratificado con asignacin proporcional o de
afijacin proporcional, muestreo estratificado con asignacin constante o de afijacin
igual y muestreo estratificado con asignacin ptima.
En el muestreo estratificado con asignacin proporcional, o de afijacin
proporcional, se respeta la importancia cuantitativa de cada estrato, asignando en la
muestra un nmero de individuos proporcional al tamao del estrato en la poblacin.
n
n
n1
n
n
2 3 ............ k
N1 N 2 N 3
Nk N
En el muestreo estratificado con asignacin constante, o de afijacin igual,
todos los estratos contribuyen a la muestra con idntico nmero de individuos, con
independencia de cual sea la importancia numrica de dicho estrato.
Finalmente, se habla de muestreo estratificado con asignacin ptima cuando
la contribucin de cada estrato se determina a partir de parmetros ya conocidos de la
poblacin.
Ejemplo:
Se desea extraer una muestra de 60 alumnos y alumnas de un centro escolar en el
que hay 500 matriculados, de los que 300 son nios y 200 son nias, para estimar la
estatura media.
Si se utiliza un muestreo estratificado de afijacin igual deberamos
seleccionar 30 nios y 30 nias.
Si se utiliza un muestreo estratificado de asignacin proporcional deberamos
escoger 36 nios y 24 nias.
Si conocemos la variabilidad de la caracterstica considerada, y sabemos que
la varianza en el caso de los alumnos es de 15 cm y en las alumnas 5 cm, la
proporcin de alumnos a alumnas sera de 3 : 1, y usando un muestreo
estratificado de asignacin ptima, los tamaos de las submuestras deberan
ser de 45 nios y 15 nias.
Lgicamente, el menos recomendable de los tres tipos de muestreo estratificado
es el de asignacin constante, ya que asigna el mismo tamao a cada estrato, y como
consecuencia se favorece a los estratos de menor tamao y perjudica a los grandes, en
cuanto a la precisin de los resultados que obtengamos.
Inferencia estadstica.
ESTADSTICA
Muestreo por conglomerados. El muestreo por conglomerados se utiliza
cuando las unidades de la poblacin presentan alguna forma de agrupamiento, que
permite elegir grupos en lugar de individuos. De esta forma, el acceso a la muestra
queda facilitado considerablemente, al quedar reunidos en una serie de grupos los
individuos que la constituyen. Al realizar el muestreo, seleccionaramos aleatoriamente
una serie de grupos o conglomerados, tratando de reunir el nmero total de individuos
que pretendemos incluir en la muestra. Los conglomerados deben ser lo ms
representativos posible de la poblacin, es decir, deben representar la heterogeneidad de
la poblacin del estudio y ser entre s homogneos.
Este procedimiento no requiere construir censos o listados completos de los
elementos de la poblacin, que son sustituidos en este caso por los censos de
conglomerados. En realidad, el muestreo por conglomerados no es ms que la
aplicacin de los muestreos aleatorios con o sin reposicin, sistemtico o estratificado al
caso en que la unidad de muestreo no son los individuos sino los grupos de individuos.
Usando este procedimiento se evita la dispersin de unidades a la que conducen otros
tipos de muestreo, y se reducen los costes y el tiempo de un trabajo de recogida de
datos.
Cuando los conglomerados se corresponden con zonas geogrficas, y se define
el conglomerado como un rea o parte bien limitada del terreno, se denomina muestreo
por reas.
Ejemplo:
Si queremos hacer un estudio sobre la influencia de un determinado pienso en el
engorde de cerdos criados en granjas, podemos seleccionar aleatoriamente las granjas y
luego dentro de ellas estudiar los pesos de los cerdos, bien de todos los cerdos de cada
granja o de una muestra representativa de la poblacin de cerdos de la misma.
Inferencia estadstica.
10
ESTADSTICA
Ejemplo:
En el ejemplo anterior referido al estudio sobre la influencia de un determinado
pienso en el engorde de cerdos, supongamos que el estudio se realiza a nivel de toda
Espaa. Entonces, en una primera etapa, podramos seleccionar de forma aleatoria una
serie de provincias; en segundo lugar, en cada una de las provincias seleccionar tambin
aleatoriamente algunas comarcas (bien delimitadas); posteriormente, dentro de cada
comarca elegir al azar un grupo de granjas; y finalmente, en cada una de ellas estudiar
todos los cerdos o una muestra de ellos elegida adecuadamente.
B) MUESTREOS NO PROBABILSTICOS.
Muestreo intencional u opintico. En el muestreo intencional u opintico la
representatividad depende de la intencin u opinin de la persona que selecciona la
muestra, y que, segn su criterio, procura que sea representativa. Por tanto, la
evaluacin de la representatividad es subjetiva. En este caso, la composicin de la
muestra puede estar influida por las preferencias o tendencias, aun las inconscientes, del
individuo que la obtiene, y no slo por factores objetivos que son los que deben tenerse
en cuenta de modo riguroso, como ocurre en el muestreo probabilstico.
Ejemplo:
Se pretende hacer una encuesta en un instituto, entre los alumnos de 4 de
E.S.O., para saber la modalidad de Bachillerato que seguirn los que continen
estudiando. El Jefe de Estudios pregunta a unos cuantos alumnos de cada grupo de 4 de
E.S.O., con el nico criterio de que piensa que esos seguirn estudiando.
Este tipo de muestreo carece, pues, de una base terica satisfactoria a pesar de lo
cual su uso est bastante generalizado, especialmente el llamado muestreo por cuotas.
Inferencia estadstica.
11
ESTADSTICA
Muestreo incidental. En el muestreo incidental el investigador determina
deliberadamente qu individuos formarn parte de la muestra, tratando de recoger a los
casos considerados tpicamente representativos de la poblacin. Los criterios de
eleccin suelen basarse generalmente en el conocimiento terico sobre el tema de
estudio. Pero, en definitiva, a pesar de la posible buena intencin y conocimiento del
tema y de la poblacin que tenga el investigador, la muestra no servir para hacer
inferencias a toda la poblacin ya que siempre cabe que pueda estar distorsionada por
tendencias o preferencias subconscientes o inconscientes del investigador.
Ejemplo:
Para estimar el problema de absentismo escolar, un investigador puede
seleccionar los alumnos de un centro situado en una zona de trabajadores agrcolas
temporeros que han de desplazarse en determinadas pocas del ao, los alumnos de un
centro situado en una barriada marginal de una gran ciudad y los de un centro
residencial, dado que por su conocimiento terico del problema sabe que stos
representan los diferentes tipos de comportamientos en relacin con la asistencia a
clase.
Inferencia estadstica.
12
ESTADSTICA
INFERENCIA ESTADSTICA.
Llamamos inferencia al paso de lo particular a lo general, no en el sentido de la
induccin completa utilizada en matemticas, sino tal como se emplea en las ciencias de
la naturaleza. Se podra decir que es una afirmacin relativa a poblaciones estadsticas,
efectuada a partir de ciertas observaciones con determinada medida de incertidumbre.
Podemos considerar como un problema crucial de la Estadstica el de inferir la
poblacin o afirmar algo sobre ella a partir de una muestra. Esto equivale a basar
conclusiones y/o decisiones en la ignorancia o incertidumbre parciales.
Para que la inferencia sea la ms satisfactoria posible en una situacin
determinada se emplean tcnicas estadstico-matemticas, que permiten estimar, por
medio de muestras, las caractersticas de una poblacin, sustituyendo las conjeturas ms
o menos ingeniosas por procedimientos objetivos cuya representatividad puede medirse.
En conclusin, el problema fundamental que trata de resolver la Inferencia
estadstica es obtener de las propiedades de la muestra las de la poblacin en estudio.
Inferencia estadstica.
13
ESTADSTICA
Formaremos muestras de tamao 2 recurriendo a dos vas diferentes:
a) Procedimiento emprico.- Seleccionamos al azar una muestra con reposicin
de 2 elementos y calculamos su media. Repetimos el proceso hasta un total
de 20 veces. Los resultados de este proceso podran ser, por ejemplo:
x1
x2
x
x1
x2
1
2
1.5
1
3
2
2
1
1.5
2
3
2.5
2
2
2
1
3
2
2
1
1.5
3
1
2
3
3
3
1
1
1
1
2
1.5
2
3
2.5
3
3
3
3
2
2.5
2
1
1.5
1
2
1.5
1
2
1.5
3
2
2.5
3
1
2
1
3
2
ni
1
7
6
4
2
x
1
1.5
2
2.5
3
fi
0.05
0.35
0.30
0.20
0.10
x1
x2
x
1
1
1
1
2
1.5
1
3
2
2
1
1.5
2
2
2
2
3
2.5
3
1
2
3
2
2.5
3
3
3
x
1
1.5
2
2.5
3
Inferencia estadstica.
ni
1
7
6
4
2
fi
1/9 = 0.11
2/9 = 0.22
3/9 = 0.33
2/9 = 0.22
1/9 = 0.11
14
ESTADSTICA
Conociendo esta distribucin muestral terica, se tiene que la probabilidad de
obtener el valor X 1 para la media de una muestra extrada al azar de la poblacin es
p X 1 0'11 , mientras que la probabilidad de obtener el valor X 2 es
pX 2 0'33 . Es decir, en un 11 % de los casos, la muestra tendr como media 1 y
Inferencia estadstica.
15
ESTADSTICA
b) El conjunto de muestras de tamao 3 de la poblacin P tiene 64 elementos
diferentes. Y procediendo de un modo anlogo podemos obtener la siguiente
tabla:
Distribucin de medias muestrales (n = 3)
ni
x
1
1
4/3 3
5/3 6
2
7
7/3 9
8/3 9
3
10
10/3 6
11/3 6
4
3
13/3 3
5
1
As hemos construido la distribucin muestral de medias de tamao 3.
c) Igual podemos hacer la distribucin muestral de medias de tamao 4. En este
caso hay 256 muestras diferentes.
Distribucin de medias muestrales (n = 4)
ni
x
1
1
5/4 4
6/4 10
7/4 16
2
23
9/4 28
10/4 34
11/4 32
3
31
13/4 24
14/4 22
15/4 12
4
10
17/4 4
18/4 4
5
1
T= 256
Inferencia estadstica.
16
ESTADSTICA
En resumen, se han construido las tres distribuciones muestrales de
medias, asociadas con la poblacin P. Las caractersticas de la poblacin P y de
las tres distribuciones muestrales se exponen a continuacin.
Poblacin
Distribucin muestral de medias, n = 2
Distribucin muestral de medias, n = 3
Distribucin muestral de medias, n = 4
Tamao
4
16
64
256
Media
2.75
2.75
2.75
2.75
Desviacin Tpica
1.479016
1.045825
0.853912
0.73509
Distribucin de la poblacin.
Inferencia estadstica.
17
ESTADSTICA
Veamos como se relacionan la desviacin tpica de la poblacin con la
desviacin tpica de la distribucin muestral y con el tamao de las muestras. Obsrvese
que:
1.045825033 2 1.479019945
0.853912565 3 1.479019948
0.739509972 4 1.479019944
Tras la lectura del teorema central del lmite, cabe preguntarse: qu entendemos
por un n sufucientemente grande?.
Inferencia estadstica.
18
ESTADSTICA
X
X
N n
N 1
X
X
Pero por el teorema del lmite central sabemos que la distribucin muestral de
las medias se acerca a la distribucin normal cuando aumenta el tamao de la muestra.
Insistimos, cunto ms se aleje la distribucin poblacional del modelo normal,
ms debe incrementarse el tamao de la muestra para que la distribucin muestral de la
media se aproxime a una curva normal. Por tanto, en la prctica:
a) Si la poblacin es normal no habr ningn problema al afirmar que la
.
distribucin muestral de la media es normal N ,
n
N ,
cuando el tamao de la muestra es mayor o igual que 30.
n
Inferencia estadstica.
19
ESTADSTICA
Puesto que X presenta una distribucin muestral normal, la variable tipificada
Z X se distribuye normalmente N (0 , 1).
s
n 1
X
n
n
n 1
X 0.8165.... , es igual a
-
N n 1.6399
32
0.81995.. .
N 1
3 1
2
Inferencia estadstica.
20
ESTADSTICA
La distribucin de medias muestrales es:
5
6
7
X
Ni
1
2
3
8
2
9
1
Total
9
1.6399
2
1.1547.. .
p q
, de media
n
pq
, cuando n es suficientemente grande y p no se
n
acerca ni a 0 ni a 1, verificando n p 5 y n q 5 , y la poblacin es infinita o
finita con reemplazamiento.
p y desviacin tpica
p
p
Inferencia estadstica.
pq
n
21
ESTADSTICA
b) Si la poblacin es finita y la extraccin se hace sin reemplazamiento,
tenemos:
p
p
pq N n
n
N 1
Ejemplo:
- Consideramos la poblacin P = {1, 2, 3}. La proporcin de cifras pares es
2
1
p y de cifras impares es q . Las muestras con reemplazamiento de tamao 2 y
3
3
sus correspondientes proporciones p de cifras pares son:
Muestra
1,1 1,2 1,3 2,1 2,2 2,3 3,1 3,2 3,3
p
0
0.5
0
0.5
1
0.5
0
0.5
0
Con todas las proporciones consideradas como valores de una variable
estadstica calculamos su media y su desviacin tpica.
ni
Xp
0
0.5
1
4
4
1
9
p q
1
3 3
p
n
2
3
- Consideramos la poblacin P = {1, 2, 3}. La proporcin de cifras pares
2
1
es p y de cifras impares es q . Las muestras sin reemplazamiento de tamao 2
3
3
y sus correspondientes proporciones p de cifras pares son:
Muestra
1,2 1,3 2,1 2,3 3,1 3,2
p
0.5
0
0.5
0.5
0
0.5
Con todas las proporciones consideradas como valores de una variable
estadstica calculamos su media y su desviacin tpica.
ni
Xp
0
0.5
Inferencia estadstica.
2
4
6
22
ESTADSTICA
Obtenemos as la distribucin muestral de las proporciones, X p , de media y
desviacin tpica:
1
1
1
y
p 3
p
18 3 2
Pero tambin podemos obtener la desviacin tpica as:
1 2
p q
N n
32 1
1
1
3 3
p
n
N 1
2
3 1 3
2 3 2
ESTIMACIN DE PARMETROS.
Si es un parmetro caracterstico de una poblacin, cuyo valor desconocemos,
posibles muestras de esa poblacin puede tener diferentes valores del estadstico E . El
estadstico que tomamos como estimador es por tanto una variable, mientras que el
parmetro es una constante. Cada uno de los valores del estimador constituye una
estimacin del parmetro. En el ejemplo sobre las edades de los alumnos universitarios,
extraemos 5 muestras aleatorias y calculamos la media de edad de cada una de ellas. Las
respectivas medias X 1 , X 2 , X 3 , X 4 y X 5 son estimaciones , puesto que hemos
tomado el estadstico X como estimador de .
Pero para que un estadstico sea tomado como estimador de un parmetro
poblacional, debemos contar con ciertas garantas de que los valores del estadstico
(estimaciones) se aproximan al verdadero valor del parmetro. Una de las condiciones
bsicas es que la muestra sea representativa de la poblacin, a lo que contribuye
especialmente el que la muestra sea aleatoria.
Recordamos que definimos estimador como un estadstico que permite obtener
un valor aproximado para alguna caracterstica de la poblacin. Cada uno de los valores
de ese estadstico representan una estimacin. Mientras que el estimador es una variable
aleatoria, la estimacin es un valor numrico alcanzado por esa variable aleatoria.
La estimacin de un parmetro se puede hacer mediante estimacin puntual o
por estimacin por intervalos. La estimacin puntual consiste en obtener un nico valor
del parmetro poblacional a partir de las observaciones muestrales, y se llama as
porque se le puede asignar un punto sobre la recta real. Mientras que en la estimacin
por intervalo se obtienen dos puntos, que definen un intervalo en la recta real que
contendr el valor del parmetro desconocido con cierta seguridad.
Inferencia estadstica.
23
ESTADSTICA
ERROR MUESTRAL.
Siempre que tomamos una muestra en representacin de toda la poblacin se
comete un error. Normalmente existe una diferencia entre los valores obtenidos a partir
de la muestra y los correspondientes a la poblacin. Pero cuando hablamos del error
muestral no nos referimos al error real que hemos obtenido nosotros, sino a un error
determinado estadsticamente, vlido para todas las posibles muestras del mismo
tamao.
Sea x la media de una muestra de tamao n y sea la media poblacional de la
poblacin de tamao N. Obteniendo todas las muestras de tamao n y calculando la
media x de cada una, se obtiene una distribucin normal, llamada distribucin muestral
de las medias o distribucin de las medias muestrales X .
La curva de Gauss representa la distribucin de todas las medias de tamao n
obtenidas en la poblacin. La media de las medias coincide con la media de la
poblacin, obtenindose muchas muestras cuyas medias, x , son iguales o muy cercanas
a y muy pocos casos de medias muestrales, alejadas o muy alejadas de la media
proporcional .
Definicin.
ERROR MUESTRAL.
Se define el error muestral o error de muestreo como la desviacin
tpica de la distribucin muestral de las medias o de las proporciones.
Inferencia estadstica.
24
ESTADSTICA
Recordamos que, para la distribucin de las medias muestrales y para la
distribucin de las proporciones muestrales, respectivamente:
pq
n
N n
,
N 1
pq
N n
n
N 1
Definicin.
NIVEL DE CONFIANZA.
Se denomina nivel de confianza o coeficiente de confianza a la
probabilidad de que el estimador por intervalo cubra el verdadero valor del
parmetro que se pretende estimar. Se expresa por 1 - .
Estrictamente, establece el porcentaje de muestras (de un tamao dado) en las
que el estadstico que deseamos estimar tiene un valor dentro del intervalo estimado. Un
nivel de confianza de 90% o del 95% indica que, de toda el rea encerrada por la curva
de Gauss y el eje OX, probablemente el 90% o el 95% de las veces contendr a la media
poblacional , desestimando el 10% o el 5%, restante.
Inferencia estadstica.
25
ESTADSTICA
Definicin.
NIVEL DE SIGNIFICACIN.
Se denomina nivel de significacin o nivel de riesgo a la diferencia
entre la certeza y el nivel de confianza deseado. Por tanto, se expresa por .
Definicin.
ERROR MXIMO ADMISIBLE.
Se define el error mximo admisible como el valor d que verifica que
la probabilidad de que la media muestral x y la media poblacional difieran en
menos de la cantidad d con el nivel de confianza elegido (1 - ):
p x d 1
De lo anterior se deduce:
p d x d 1
O lo que es lo mismo:
p x d x d 1
Si:
d X
entonces
d 2 X entonces
d 3 X entonces
Es decir:
d X
p x X x X 0.6826
px 3
0.9973
p x 2 X x 2 X 0.9544
X
x 3 X
En general:
p x k X x k X 1
p k Z k 1 p k Z k pZ k pZ k
pZ k 1 pZ k 2 pZ k 1 1
De donde:
p Z k 1
cuyo valor lo podemos obtener en la tabla N(0 , 1) para una valor dado .
Inferencia estadstica.
26
ESTADSTICA
Valores de k, ms usuales, segn el nivel de confianza 1 -
1-
K
682 %
1
50 %
0.67
90 %
1.65
95 %
1.96
955 %
2
99 %
2.58
997 %
3
d k X k
d k X k
N n
(poblacin finita sin reemplazamiento).
N 1
d k p k
(poblacin finita sin reemplazamiento).
n
N 1
TAMAO DE LA MUESTRA.
Las encuestas se realizan en una muestra representativa de la poblacin. Su
tamao vara de unas encuestas a otras y viene recogido en la llamada ficha tcnica. En
dicha ficha tcnica debe aparecer: el tamao de la muestra, el nivel de confianza y el
margen de error. El tamao n de la muestra depende del tamao N de la poblacin, del
nivel de confianza (1 - ) adoptado y del error mximo admisible d.
DISTRIBUCIN DE LAS PROPORCIONES MUESTRALES:
d k
pq
k 2 p q
n
n
d2
Inferencia estadstica.
27
ESTADSTICA
d k
pq
k2 N pq
N n
n
n
N 1
N 1d 2 k 2 p q
d k k
n
X
n
d2
N k 2 2
N n
n
N 1
d 2 N 1 k 2 2
n
Recordemos que si la poblacin no es normal basta con tomar una muestra
suficientemente grande.
Inferencia estadstica.
28
ESTADSTICA
Grficamente:
p z Z z 1
2
2
Sustituyendo:
p z
z 1
2
2
n
o bien:
p z
z 1
2
2
n
de donde:
1
p X z
X z
n
n
2
2
Inferencia estadstica.
29
ESTADSTICA
CUANDO SE CONOCE LA DESVIACIN TPICA POBLACIONAL.
En este caso, el intervalo de confianza de la media poblacional es:
x z
, xz
n
n
2
2
s
s
x z
, xz
n
n
2
2
Observaciones.
Para establecer los intervalos de confianza:
donde se tiene: s n 1
2
n 1
x ni
n 1
, de
x ni
N n
N n
x z
, xz
n
n
N 1
N 1
2
2
Inferencia estadstica.
30
ESTADSTICA
p' p
pq
, lo que permite tipificar la variable Z
normal N p,
que sigue una
n
pq
n
distribucin N(0,1) y obtener con un nivel de confianza (1-), el intervalo de confianza
para el parmetro poblacional p, a partir de la expresin:
p' p
p z
z 1
pq
2
2
n
o lo que es igual:
p p'
p z
z 1
pq
2
2
n
de donde:
p p' z
pq
p p' z
n
2
pq
1
n
p q
, tiene el grave inconveniente de
n
2
que est dado en funcin de p. Por tanto, una vez extrada la muestra y obtenida la
proporcin muestral p, debemos estimar los valores de p y q, mediante: p = p y q = q.
p p' z
2
Inferencia estadstica.
p' q'
p p' z
n
2
p' q'
1
n
31
ESTADSTICA
Ejemplos:
- Supongamos que deseamos valorar el grado medio de conocimientos en
historia de una poblacin de varios miles de estudiantes. Sabemos que la
desviacin tpica poblacional es de 2.3 puntos. Nos proponemos estimar la
media poblacional, , pasando una prueba a 100 alumnos, con un nivel de
confianza del 95 %. Calculamos la media en la muestra, resultando ser de
6.32. Para hacer esta estimacin vamos a construir el intervalo de confianza
de con un nivel de confianza del 95 %.
El intervalo de confianza para la media en poblaciones infinitas o finitas con
reemplazamiento, caso que suponemos (de varios miles), es:
x z
, xz
n
n
2
2
En nuestro ejemplo:
0.05
Como: p Z z 1 1
0.975 , tenemos z 1.96 , y as:
2
2
2
2
2.3
2.3
6.32 1.96
, 6.32 1.96
100
100
s
s
x z
, xz
n
n
2
2
1.12
1.12
3.25 1.96
, 3.25 1.96
400
400
3.14 , 3.36
Y as el intervalo buscado es:
- De la duracin de un proceso sabemos que la desviacin tpica poblacional
es 0.5 segundos. Cul es el nmero mnimo de medidas que hay que realizar
para que, con un nivel de confianza del 99 %, el error de estimacin no
exceda de 0. 1 segundos?.
un z 2.575 .
2
Inferencia estadstica.
32
ESTADSTICA
Obtenemos el tamao n de la muestra a partir de la relacin: z
2
d,
z
2
2.575 0.5
de donde: n 2
.
Es
decir,
n
165.76 y el tamao
d
0
.
1
de la muestra debe ser 166 medidas (el menor entero mayor que 165.76).
Un monitor de un gimnasio quiere estimar la estatura media de todos los
asociados al mismo, con un error menor de 0.5 cm, utilizando una muestra de
30 asociados. Sabiendo que la desviacin tpica = 5.3 cm, cul sera el
nivel de confianza con el que se realiza la estimacin?.
5.3
104
0.347 . As, el error mximo admisible sera
300
p' q'
0.347 0.653
1.645
0.045 , y con este dato tenemos
n
300
d z
2
z p' q'
Inferencia estadstica.
33
ESTADSTICA
CONTRASTE DE HIPTESIS.
El contraste de hiptesis o la prueba de decisin estadstica permite
comprobar ciertas afirmaciones que realizamos acerca de una poblacin, referidas a sus
parmetros o a la forma en que se distribuye. Mediante este tipo de pruebas podramos
decidir acerca del ajuste de las distribuciones observadas a distribuciones tericas, la
existencia de diferencias entre grupos, relaciones entre variables, etc.
Definicin.
TEST ESTADSTICO.
Un test estadstico es un procedimiento para, a partir de una muestra
aleatoria y significativa, extraer conclusiones que permitan aceptar o rechazar
una hiptesis previamente emitida sobre el valor de un parmetro desconocido
de esa poblacin.
HIPTESIS ESTADSTICAS.
En cualquier estudio sobre la realidad el investigador se plantea interrogantes a
los que trata de dar respuesta o temas de inters sobre los que pretende incrementar su
conocimiento. En la indagacin sobre esos interrogantes, el investigador formula
hiptesis, que son posibles soluciones o respuestas a los problemas planteados. Tales
hiptesis permanecern en el terreno de la conjetura hasta tanto no sean comprobadas.
La estadstica permite comprobar hiptesis cientficas a partir de los datos recogidos
sobre un problema, pero para ello es necesario que tales hiptesis sean formuladas en
trminos estadsticos. Es decir, las hiptesis cientficas tienen que ser operativizadas
previamente, expresadas en forma de afirmaciones acerca de parmetros. Por tanto, en
una prueba de decisin estadstica no contrastamos directamente las hiptesis
cientficas, sino que trabajamos con hiptesis estadsticas que son una traduccin de
aquellas. Tras comprobar la hiptesis estadstica, podemos inferir que la hiptesis
cientfica queda validada.
Las hiptesis estadsticas son proposiciones acerca de parmetros de la
poblacin (media, proporciones, varianza, diferencia de medias, etc.) o de su
distribucin. Cuando llevamos a cabo una prueba estadstica, estamos trabajando con
una hiptesis nula, que simbolizaremos por H0. Junto a esta, consideramos la hiptesis
alternativa, opuesta a la anterior, que queda simbolizada por H1.
Veamos en qu consiste cada una de ellas:
Puesto que cada una de estas hiptesis afirma lo contrario que la otra es
incompatible que ambas sean ciertas. Por tanto, si llegamos a la conclusin de que la
hiptesis nula no se cumple, podemos afirmar que se cumple la hiptesis alternativa y
viceversa.
Inferencia estadstica.
34
ESTADSTICA
1
p x z
xz
n
n
2
2
1
p z
xz
n
n
2
2
Inferencia estadstica.
35
ESTADSTICA
CONTRASTES BILATERALES Y UNILATERALES.
Las hiptesis nula y la hiptesis alternativa deben ser mutuamente excluyentes y
complementarias, y el contraste de hiptesis puede ser bilateral o unilateral.
HIPTESIS:
H 0 : 0
H1 : 0
Regin de aceptacin:
0 z
,
n
n
2
2
x 0 z
2
x 0 z
2
Observacin.
Cuando la desviacin tpica poblacional no sea conocida, y la muestra sea
suficientemente grande podremos utilizar la desviacin tpica de la muestra o, en su
caso, la indique la hiptesis.
Ejemplo:
Se cree que el cociente intelectual medio de los estudiantes de una universidad
es 113, con una desviacin tpica de 7. Para contrastar la hiptesis, se extrae una
muestra de 180 estudiantes y se obtiene en estos estudiantes un cociente intelectual
medio de 115. Podemos aceptar la hiptesis con un nivel de significacin del 5 %?.
H 0 : 113 .
Hiptesis nula,
Hiptesis alternativa, H1 : 113 .
Inferencia estadstica.
36
ESTADSTICA
Como el tamao de la muestra es superior a 30, las medias muestrales se
7
distribuiran (si la hiptesis fuese cierta) segn una ley N 113,
.
180
7
7
113 1.96
, 113 1.96
= 111.98 , 114.02 .
180
180
z
HIPTESIS:
H 0 : 0
H1 : 0
Regin de aceptacin:
, 0 z
Regin de rechazo:
,
0 z
n
Observacin.
Es importante hacer notar que al quedar la regin crtica en una sola cola,
determinamos z , con la condicin pZ z 1 .
Inferencia estadstica.
37
ESTADSTICA
CONTRASTE UNILATERAL IZQUIERDO. La regin crtica se sita en el
lado izquierdo.
-z
HIPTESIS:
H 0 : 0
H1 : 0
Regin de aceptacin:
0 z
,
n
Regin de rechazo:
, 0 z
Ejemplo:
El peso de los pollos de una granja es una distribucin normal de media 2.6 kg y
desviacin tpica 0.5. Se experimenta un nuevo tipo de alimentacin con 50 cras.
Cuando se hacen adultos se les pesa y se obtiene una media de 2.78 kg. Vamos a
contrastar la hiptesis de que el peso medio de la poblacin no aumenta con un nivel de
significacin del 1 %.
Hiptesis nula:
H 0 : 2.6
Hiptesis alternativa: H1 : 2.6
Como el nivel de confianza es del 99 %, pZ z 0.99 , de donde se obtiene
0.5
, o sea,
que z 2.33 . Y, por tanto, la regin de aceptacin es: , 2.6 2.33
50
Inferencia estadstica.
38
ESTADSTICA
Regin de aceptacin:
p z
0
2
p q
0 0 , p z
0
n
2
p q
0 0
n
p q
0 0
n
p' p z
0
p q
0 0
n
Ejemplo:
Un dentista afirma que el 40 % de los nios de diez aos presentan indicios de
caries dental. Tomada una muestra de 100 nios, se observ que 30 presentaban indicios
de caries. Utilizando la aproximacin normal queremos comprobar, con un nivel de
significacin del 5 %, si el resultado proporcionado por la muestra permite rechazar la
hiptesis del dentista.
Hiptesis nula:
H 0 : p 0.4
Hiptesis alternativa: H1 : p 0.4
Un nivel de significacin del 5 % determina que z 1.96 , y tenemos la
2
p z
0
2
p q
0 0
n
0.4 0.6
0.4 0.6
0.4 1.96
,
0
.
4
1
.
96
100
100
0.304 , 0.496
Es decir, si la hiptesis nula fuese cierta, con un nivel de significacin del 5 %,
la proporcin de nios con indicios de caries en esa poblacin estara comprendida entre
el 30.4 % y el 49.6 %. Comprobamos que la proporcin obtenida en la muestra queda en
la regin crtica, y por esto, rechazamos la hiptesis nula y aceptamos la alternativa con
ese nivel de significacin. Es decir, rechazamos la hiptesis del dentista, y aceptamos
que el porcentaje de nios con indicios de caries es distinto del 40 %.
Inferencia estadstica.
p q
0 0 , p z
0
n
2
39
ESTADSTICA
CONTRASTE UNILATERAL DERECHO.
HIPTESIS:
H 0 : p p0
H 1 : p p0
Regin de aceptacin:
0 , p z
0
p q
0 0
n
Regin crtica:
p z
0
p q
0 0 , 1
n
Ejemplo:
Segn la ley electoral de cierto pas, para obtener representacin parlamentaria,
un partido poltico ha de conseguir ms del 5 % de los votos. Poco antes de celebrarse
las elecciones, una encuesta realizada sobre 1000 ciudadanos elegidos al azar revela que
slo 65 de ellos votarn al partido V. Puede estimarse, con un nivel de significacin
del 1 %, que V no tendr representacin parlamentaria?. Y con un nivel de
significacin del 5 %?
H 0 : p 0.05
Hiptesis nula:
Hiptesis alternativa: H1 : p 0.05
Un nivel de significacin del 5 % determina que z 2.33 , ( pZ z 0.99 ),
y tenemos la siguiente regin de aceptacin:
p q
0 0
0 , p z
0.05 0.95
0 , 0.05 2.33
1000
0 , 0.066
Es decir, si la hiptesis nula fuese cierta, con un nivel de significacin del 1 %,
la proporcin de votantes de V sera inferior al 6.6 %. Comprobamos que la proporcin
65
obtenida en la muestra
0.065 , es de un 6.5 % y queda en la regin de
1000
Inferencia estadstica.
40
ESTADSTICA
CONTRASTE UNILATERAL IZQUIERDO.
HIPTESIS:
H 0 : p p0
H 1 : p p0
Regin de aceptacin:
p z
0
p q
0 0 , 1
n
Regin crtica:
0 , p z
0
p q
0 0
n
Ejemplo:
En las ltimas votaciones, hace un ao, el 53 % de los votantes de un pueblo
estaban a favor del alcalde. Se acaba de realizar una encuesta a 360 personas elegidas al
azar y 176 de ellas estaban a favor del alcalde. Se puede afirmar con un nivel de
confianza del 90 % que el alcalde no pierde popularidad?
Test de hiptesis para la proporcin (unilateral izquierdo).
H 0 : p 0.53
Hiptesis nula:
Hiptesis alternativa: H1 : p 0.53
Es decir, la hiptesis nula mantiene que la proporcin de votos favorable al
alcalde es la misma de las pasadas elecciones o ha aumentado.
Un nivel de confianza del 90 %, nos da un z 1.28 ( z 1.2817 ,
interpolando).
Regin de aceptacin:
p q
p z
0 0 , 1
0
n
0.53 0.47
0.53 1.28
, 1
360
0.496 , 1
Consideramos ahora los resultados de la muestra: un 48.9 % estuvieron a favor
176
del alcalde
0.489 , y como este resultado cae fuera de la regin de aceptacin
360
Inferencia estadstica.
41
ESTADSTICA
Ejemplo:
Las estaturas de las alumnas de COU eran, en 1990, de media 167 cm y
desviacin tpica 7 cm. Emitimos la hiptesis de que las actuales alumnas de 2 de
Bachillerato tienen la misma media. Vamos a contrastar la hiptesis mediante una
muestra de tamao 60 y con un nivel de significacin del 0.1.
Hiptesis nula:
H 0 : 167
Hiptesis alternativa: H1 : 167
165.51 , 168.49
La regin de aceptacin sera:
Si al extraer la muestra obtenemos una media de 168.72 cm, rechazamos la
hiptesis nula. Pero podemos estar equivocados. Es decir, podemos cometer un error de
tipo I.
Si al extraer la muestra obtenemos una media de 168.12 cm, aceptamos la
hiptesis nula. Si estuviramos equivocados se cometera un error de tipo II.
Cuando se acepta la hiptesis nula H0 decimos que la diferencia existente entre
el valor del parmetro formulado por la hiptesis nula y el valor que le correspondera,
segn la informacin que proporciona la muestra, es no significativa, mientras que si se
rechaza la hiptesis nula H0 para = 5% decimos que existe una diferencia
significativa y para = 1% decimos que existe una diferencia muy significativa.
Inferencia estadstica.
42
ESTADSTICA
En los grficos siguientes la curvas de lnea continua representan la verdadera
distribucin de las medias muestrales (media ). Las curvas de lnea discontinua son las
supuestas distribuciones (media 0). Sobre ellas se construyen los intervalos de
aceptacin. El rea marcada nos da, en cada caso, la proporcin de muestras para las
cuales se aceptara la hiptesis nula y, por tanto, se cometera un error de tipo II. Es
claro que para muestras grandes esta probabilidad es mucho menor.
n pequeo
n grande
Inferencia estadstica.
43