You are on page 1of 67

Matemticas aplicadas Estadstica Inferencial

SECUENCIA DIDCTICA: Muestreando en la escuela


Autor: Alejandro Acebo Gutirrez
Contenido temtico Teora elemental de muestreo
Propsito del contenido
temtico:
Conocer los conceptos bsicos de la teora elemental de
muestreo para que el alumno lo utilice al realizar trabajos de
investigacin cientfica.
Conceptos fundamentales: Teora elemental de muestreo
Conceptos subsidiarios:
Teora de muestreo, muestreo aleatorio simple, con y sin
reemplazamiento, diseo de muestras, distribucin muestral de
medias, errores al muestrear.
Tema integrador La Educacin
Nmero de sesiones 2 (semanas) con alto porcentaje de estudio independiente
Valores y actitudes Libertad, justicia, solidaridad, tolerancia.
Categoras Diversidad y espacio.
BLOQUE: ACTIVIDADES DE APERTURA Observacin
Te damos una cordial bienvenida como estudiante del curso de matemticas
aplicadas y te deseamos xito en ste ltimo semestre de tu bachillerato. Al igual
que otros semestres, te recomendamos que contestes todas tus actividades de
aprendizaje y participes activamente en las siguientes secuencias didcticas
para que construyas un aprendizaje significativo. Recuerda lo importante es que
aprendas a aprender, a resolver problemas de la vida cotidiana.
Iniciamos, ayudndole al director
Un CBTA del estado Nayarit, tiene inscritos a un total de 550 estudiantes, de los cuales
290 cursan el primer ao, 188 el segundo ao y 72 el tercer ao. El director, quiere saber
su opinin sobre la infraestructura de la escuela, pero no considera conveniente
preguntar a todos, debido, entre otras causas, al alto costo que representa.
a) Cuntos alumnos se deben de seleccionar de los tres grupos, si se desea saber
la opinin de solo 100 estudiantes?
b) Qu diseo de muestreo se debe utilizar?.
c) Por qu ese diseo? Argumentar
Integrados en equipos de 3 estudiantes encuentra la solucin y argumenta tus
respuestas
Contextualizar
el tema
integrador en
base a:
Las
expectativas
educativas en el
presente
semestre y al
momento de
egresar del
bachillerato.
BLOQUE: ACTIVIDADES DE DESARROLLO
Revisin de contenidos:
1.- Lee de manera individual y cuidadosamente, los contenido relacionados al
problema en tu gua didctica. Como la teora de muestreo, el muestreo aleatorio
simple, los nmeros aleatorios, el muestreo con o sin reemplazamiento y el de
diseos de muestras.
2.- Junto con los integrantes de tu equipo, comenten las estrategias para la solucin de
las preguntas antes sealadas.
3. Realicen otras consultas, en libros, internet, o apuntes diversos.
Consultar la
presente gua
didctica para
argumentar su
solucin y otras
bibliografas.
BLOQUE: ACTIVIDADES DE CIERRE
En reunin plenaria, expondrn las vas de solucin que hallan encontrado a
dichos preguntas ya sea con rotafolio, lminas, o presentaciones PowerPoint.
Tambin podrn confrontar las respuestas de otros equipos
En la plenaria, encontraras la solucin ms idnea entre todo el grupo.
De manera respetuosa podrs solicitar a todo el grupo, te disipen algunas dudas
que tengas respecto al tema y a la solucin del problema en general.
El facilitador propiciar la exposicin libre de las emociones y sentimientos
generados durante el desarrollo del tema.
Se considera
conveniente
realiza un
ejercicio similar
en tu escuela,
como tarea.
1
Matemticas aplicadas Estadstica Inferencial
n el curso pasado de Probabilidad y Estadstica (V semestre), pudiste conocer el rea de
estudio y las aplicaciones de la estadstica descriptiva; por lo que ya estas preparado,
para incursionar en el mbito de la estadstica inferencial, pero antes de iniciar con esta
interesante rama de la Estadstica, reflexiona y contesta las siguientes preguntas.
E
Cmo le haras para conocer el grado de aceptacin de una bebida refrescante, entre los
integrantes de tu grupo escolar?
____________________________________________________________________________
________________________________________________
Cmo le haras si quisieras saber lo anterior, pero ahora, entre los estudiantes del plantel?
____________________________________________________________________________
________________________________________________
Cmo le haras si quisieras saber lo mismo, pero entre los integrantes de la comunidad donde
esta ubicado tu plantel?
____________________________________________________________________________
________________________________________________
Cmo le haras si quisieras saber lo mismo, pero entre los habitantes de la capital de tu
estado?
____________________________________________________________________________
________________________________________________
Ahora observa, la siguiente imagen
Si la observas muy de cerca, es equivalente a tomar una
pequea muestra de la imagen; en principio solo tienes en tu
mente, un conjunto de datos que no te dicen nada.
Sin embargo, si te alejas unos 3 a 5 metros y observas de nuevo
la imagen, empezars a extraer ms informacin de la imagen o
poblacin y posiblemente, adivines qu representa sta imagen.
Si logras lo anterior, habrs hecho una inferencia de los datos
muestrales, para tener una imagen del conjunto.
Esto es en resumidas cuentas, el objeto de la Estadstica
Inferencial. Obtener muestras, e inferir datos sobre la poblacin.
Al dar respuesta a las preguntas anteriores, es momento de iniciar otra aventura en el mundo
de la Estadstica Inferencial. ADELANTE Y CON MUCHO ENTUSIASMO.
2
Matemticas aplicadas Estadstica Inferencial
INTRODUCCIN:
Una diferencia importante entre la estadstica y probabilidad es que:
En la Probabilidad se razona a partir de la poblacin hasta llegar a la muestra.
En la Estadstica el razonamiento parte de la muestra para llegar al conocimiento de toda la
poblacin.
El estudio de una poblacin tomando como base las muestras, se llama ESTADSTICA
INFERENCIAL o INDUCTIVA, algunos autores la citan como teora de muestras.
La inferencia estadstica trata de conocer o explicar el comportamiento de la poblacin,
mediante los datos obtenidos de una muestra. Como no podemos estar absolutamente seguros
de la veracidad de las inferencias obtenidas, las llamaremos probabilidades. Ahora, para
predecir a partir de una muestra, es necesario haberla seleccionado y recopilado
cuidadosamente; si la muestra no se selecciona adecuadamente, o si la recoleccin es
incorrecta o hay desviaciones en los datos, con ningn anlisis estadstico que se aplique, se
llegar a buenas conclusiones.
POR LO TANTO ES NECESARIO ESTUDIAR LA
TEMA: ----------------
TEORA DE MUESTREO
a teora de muestreo es el estudio de las relaciones existentes entre una poblacin y las
muestras extradas de ellas. Es de gran utilidad en muchos campos; por ejemplo, para
ESTIMAR caractersticas desconocidas de poblaciones (como la media y la varianza
poblacionales), denominadas parmetros de la poblacin o simplemente parmetros, a partir del
conocimiento de las caractersticas muestrales correspondientes, nombradas estadsticos de la
muestra o, en forma sencilla, estadsticos. Esto es
L
A los valores (mu) y (ro) que son, respectivamente la media y la desviacin estndar
poblacionales, se les llama PARMETROS de la poblacin. Como la media de la muestra ( x )
nos da una idea del valor de , se dice que x ESTIMA a o que x es un estimador del
parmetro ; anlogamente, s (desviacin estndar) estima a (Desviacin estndar de la
poblacin), o de otra forma, que s es un estimador de .
Recordemos sus frmulas:
3
TEORIA ELEMENTAL DEL MUESTREO
Cmo son las
frmulas de la
media y de la
desviacin estndar
Matemticas aplicadas Estadstica Inferencial
Parmetros de la
poblacin
Parmetros
Smbolo Nombre Frmula

Media poblacional
i
X
N

Desviacin estndar
poblacional
2
( )
i
X
N


Estadsticos de la
muestra
Estimadores
x Media muestral
i
X
x
n


S
Desviacin estndar
muestral
2
( )
1
i
X X
S
n

La teora del muestreo tambin sirve para determinar si las diferencias observadas entre dos
muestras se deben a variaciones por el azar o si en realidad son significativas. Dichas
cuestiones surgen, por ejemplo, al probar un nuevo suero para el tratamiento de una
enfermedad o al decidir si un proceso de produccin es mejor que otro. Sus respuestas
involucran el uso de las denominadas pruebas significativas y de hiptesis, que son importantes
en la teora de decisiones, la cual estudiaremos ms adelante.
MUESTREO ALEATORIO SIMPLE O AL AZAR Y NMEROS ALEATORIOS
C
omo ya se seal al principio de este apartado; para que las conclusiones de la teora de
muestreo y la estadstica inferencial sean vlidas, se deben elegir muestras
REPRESENTATIVAS de la poblacin.
Una forma de obtener una muestra representativa, es por medio del proceso denominado
MUESTREO ALEATORIO SIMPLE, en el cual cada miembro de una poblacin tienen las
mismas probabilidades de ser incluido en la muestra. Una tcnica de obtencin de una muestra
aleatoria es la asignacin de nmeros a cada miembro de la poblacin, anotar estos nmeros
en pedazos de papel, colocarlos en una urna y despus sacar nmeros de dicha urna, teniendo
cuidado de mezclarlos muy bien antes de cada extraccin.
Otro concepto importante es si la poblacin es finita o infinita. Una poblacin es FINITA, si
consta de un nmero finito o fijo de elementos, medidas u observaciones. En cambio, una
poblacin es INFINITA, al menos hipotticamente, porque contienen una infinidad de
elementos, medidas u observaciones.
Resumiendo
Recordemos con un ejemplo Cuntas muestras distintas de n, podemos tomar de una
poblacin finita de tamao N ?.
4
Una muestra de tamao n de una poblacin finita de tamao N, es una
variable aleatoria si se selecciona de manera tal que cada una de las (N Cn)
muestras posibles, tiene la misma probabilidad, 1/N Cn de ser seleccionada
Matemticas aplicadas Estadstica Inferencial
Cuando n = 2 y N = 12? Solucin; hay 12C2= 12.11/ 2! = 66 muestras distintas.
Y cuando n = 3 y N = 100 Solucin; Hay 100C3 = 161,700 muestras distintas.
Ahora con poblacin infinita
Por independiente queremos decir, que las probabilidades relacionadas con cualquiera de las
variables aleatorias son las mismas, sin que tengan importancia los valores que se hayan
observado, para las otras variables aleatorias.
NMEROS ALEATORIOS
Otro mtodo alternativo al muestreo aleatorio o al azar, es el uso de una tabla de NMEROS
ALEATORIOS, especialmente elaborados para dicho propsito (como la tabla de la pgina
seis), que contienen nmeros entre cero y uno, distribuidos uniformemente.
Para obtener una muestra aleatoria, escogemos un nmero cualquiera de stos, digamos que
elegimos el sptimo nmero de la quinta columna (.266194) y a partir de l, tomamos tantos
nmeros como tenga la muestra. Para elegir una muestra de 6 de 20 individuos nos fijamos en
los siguientes cinco nmeros, los multiplicamos por 20, (el tamao de la poblacin), y
redondeamos a nmeros enteros.
En la siguiente tabla tenemos estos clculos:
ri
.246194 .361474 .721938 .874239 .588587 .987107
20 x ri 4.92388 7.22948 14.43876 17.48478 11.77174 19.74214
Redondeado 5 7 14 17 12 20
Esto significa que la muestra que obtuvimos, consiste de los individuos 5, 7, 14, 17, 12 y 20. En
caso de que despus de redondear, obtengamos un nmero repetido simplemente lo ignoramos
y tomamos un nmero aleatorio ms de la tabla. Existen tablas extensas de nmeros aleatorios
que pueden consultarse en caso necesario, o bien, es posible generar secuencias de nmeros
aleatorios en hojas de clculo para computadoras personales.
MUESTREO CON Y SIN REEMPLAZAMIENTO
i se saca un nmero de una urna, existe la opcin de reponer o no, el nmero en la urna
antes de la segunda extraccin. En el primer caso, el nmero puede salir una y otra vez,
mientras que en el segundo caso, esto pasara una vez. El muestreo en que cada
miembro de la poblacin sera elegido ms de una vez, se denomina MUESTREO CON
REEMPLAZAMIENTO, mientras que si cada miembro no puede ser elegido ms de una vez, se
denomina MUESTREO SIN REEMPLAZAMIENTO.
S
Las poblaciones son finitas o infinitas. Si, por ejemplo, se extraen 10 bolas sucesivamente sin
reemplazamiento de una urna con 100 bolas, se hace un muestreo de una poblacin finita;
mientras que si se lanza una moneda 50 veces y se cuenta el nmero de caras, el muestreo es
5
Una muestra de tamao n de una poblacin infinita, es aleatoria si consta de valores
de variables aleatorias independientes, que tienen la misma distribucin.
Matemticas aplicadas Estadstica Inferencial
de una poblacin infinita. Una poblacin finita en la que se realiza un muestreo con
reemplazamiento, puede considerarse tericamente infinita, ya que es posible extraer cualquier
nmero de muestras sin agotar la poblacin. Para muchos propsitos prcticos, efectuar el
muestreo de una poblacin finita muy grande, llega a tomarse como muestreo de una poblacin
infinita.
TABLA DE NMEROS ALEATORIOS
.695068 .562823 .320635 .905239 .385775 .122307 .086846 .450445
.805913 .002301 .782180 .796922 .831441 .788578 .724832 .015705
.094442 .232042 .352716 .451598 .967543 .714261 .542868 .916486
.654244 .266617 .077187 .292421 .725393 .753031 .545621 .207688
.290330 .131461 .627016 .828471 .781755 .565886 .578796 .365034
.748739 .941812 .905990 .550117 .183213 .187656 .316564 .111104
.221169 .319317 .466664 .081688 .246194 .361474 .721938 .874239
.588587 .987107 .647365 .173754 .646875 .284028 .239494 .749584
.937687 .689820 .818804 .740821 .989363 .644515 .080688 .916764
.002736 .946318 .035611 .655810 .381565 .742813 .305726 .226729
.603410 .390122 .967842 .731978 .355516 .915298 .250148 .385909
.715715 .919611 .240272 .415541 .054394 .571107 .670640 .167211
.597542 .913490 .279269 .744025 .428829 .629999 .275269 .350164
.006625 .790428 .639912 .390941 .434190 .780697 .425575 .713078
.396010 .023133 .876266 .060652 .657453 .311012 .687109 .276703
.755674 .693671 .840188 .733594 .825936 .944366 .361341 .741072
.600667 .658730 .616694 .813899 .322635 .078211 .787992 .858724
.421401 .723064 .151870 .171769 .637507 .150843 .260049 .685027
.005809 .959250 .723322 .880411 .993144 .258811 .133291 .071528
.720998 .359282 .805228 .389532 .862456 .823710 .282315 .280507
.885559 .412858 .592425 .158577 .007733 .097627 .463281 .989519
.482054 .657293 .249104 .947260 .022476 .390369 .680906 .980937
.714028 .737552 .078762 .699915 .513055 .293689 .945228 .773218
.855181 .346466 .111000 .089797 .055481 .962412 .844186 .223863
.999352 .456042 .301013 .916413 .496661 .653221 .211123 .308422
.249058 .416967 .078323 .179296 .801952 .157172 .019341 .287353
.144735 .259332 .732924 .346352 .591400 .813805 .890398 .363413
.530463 .874892 .316023 .237563 .810613 .752123 .232516 .696245
.442014 .148786 .976778 .433333 .635090 .281786 .337549 .696245
.366574 .482655 .932723 .210948 .277263 .956223 .032354 .380662
Guillermo Pastor. Estadstica Bsica. Editorial trillas, Conalep. 1 Edicin 12 reimpresin enero 2003.
DISEOS DE MUESTRAS
as clases de muestras que hasta ahora hemos estudiado, son las muestras aleatorias
simples y nmeros aleatorios y no hemos considerado la posibilidad, de que en ciertas
condiciones, puede haber muestras que son ms fciles de obtener, ms econmicas o
ms informativas que las muestras aleatorias y no hemos entrado en detalles sobre la pregunta
de lo qu, podra hacerse, cuando el muestreo aleatorio es imposible.
L
6
Matemticas aplicadas Estadstica Inferencial
Hay muchas otras maneras de seleccionar una muestra de la poblacin y hay gran cantidad de
bibliografa sobre el tema de los procedimientos del diseo del muestreo.
A continuacin estudiaremos brevemente, algunos diseos de muestras que no es ms que un
plan determinado, antes de recopilar cualquier dato, para tomar una muestra de una poblacin.
MUESTREO SISTEMTICO
En algunos casos, la manera ms prctica de efectuar un muestreo, consiste en seleccionar,
digamos, cada vigsimo nombre de una lista, cada decimosegunda casa de un lado de una
calle y as sucesivamente. Esto se conoce como muestreo sistemtico. En este caso, se
divide la poblacin en subconjuntos de tamao igual, segn la frmula que a continuacin
analizaremos, despus se toma al azar, la unidad en la que se debe comenzar, que ocupa el
lugar K y el resto de los elementos de la muestra, ocupan los siguientes lugares.
... , , K
n
N
K
n
N
K 2 + + Hagamos un ejemplo para comprender mejor este muestreo
En una colonia de la ciudad de Xalisco, Nayarit; de 8060 habitantes segn el censo, se va a
hacer una encuesta, y se selecciona una muestra sistemtica de 20 personas, entre 1200
padres de familia, para conocer el grado de aceptacin de la gestin administrativa de la ciudad,
por parte del presidente municipal.
Primero calculamos el factor de elevacin = 60
20
1200

n
N
, a continuacin seleccionamos un
elemento, AL AZAR, entre el 1 y el 60, supongamos que el seleccionado es el 27(este ser K),
entonces, el primer nmero ser 27; el segundo nmero ser 27+60 = 87; el tercer nmero
seleccionado ser 27+ 2(60) = 147; el cuarto nmero 27+ 3(60)= 207 y as sucesivamente
sern el 267, 327, 387, 447, 507, 567, 627, 687, 747, 807, 867, 927, 987, 1047, 1107, 1167. Se
han seleccionado a 20 personas, a las que les corresponden los nmeros citados.
Cuando el resultado de N/n no es entero, se redondea al entero menor, esto puede producir
una pequea dificultad que no afecta y debe despreciarse cuando n > 50.
MUESTREO ESTRATIFICADO
En este muestreo, la poblacin se divide en estratos homogneos internamente y lo ms
heterogneos externamente entre s.
Si tenemos informacin acerca de la constitucin de una poblacin (es decir, su composicin) y
sta es importante para nuestra investigacin, podemos mejorar el muestreo aleatorio por
medio de la ESTRATIFICACIN. Este es un procedimiento, que consiste en estratificar (o
dividir) en un nmero de subpoblaciones o estratos que no se traslapen y luego tomar una
muestra de cada estrato. Si los artculos, personas o cosas seleccionados de cada estrato
7
El muestreo sistemtico es semejante al aleatorio simple, si se selecciona el elemento inicial
en forma aleatoria. Sus ventajas son: de fcil aplicacin y se extiende la muestra a toda la
poblacin. Sus desventajas son que se presentan dificultades al tratar de calcular la varianza,
y aumento de la varianza si existe periodicidad en la numeracin de los elementos; adems,
de posible presencia de periodicidades ocultas.
Matemticas aplicadas Estadstica Inferencial
constituyen muestras aleatorias simples, el procedimiento completo (primero la estratificacin y
luego el muestreo aleatorio) se conoce como muestreo aleatorio simple estratificado.
Hagamos un ejemplo para analizar mejor este tipo de muestreo.
En una colonia con una poblacin aproximada de 17000 habitantes se sabe, segn el censo
reciente, que 7800 son jvenes, 2950 de la tercera edad y 6250 son nios.
Calcular el tamao de la muestra de cada estrato, si se desea saber las preferencias de 300
personas, en sus programas de televisin.
Para las personas jvenes su clculo ser: 300 (7800/17000) = 300 (0.4588) = 138
Para la tercera edad: 300 (2950/17000) = 300 (0.1735) = 52
Para los nios: 300 (6250/17000) = 300 (0.3674) = 110
Suma total = 300
Se contina con el muestreo aleatorio, para seleccionar las personas de cada estrato que van a
hacer motivo de la investigacin.
MUESTREO POR CONGLOMERADOS
Esta tcnica tiene utilidad, cuando el universo que se requiere estudiar admite ser subdividido
en universos menores, de caractersticas similares a las del universo total. La poblacin se
divide en reas, que se llaman conglomerados; cada uno de stos, ser lo ms heterogneo
posible internamente, y lo ms homogneo entre s; a continuacin se selecciona, al azar, uno o
algunos conglomerados, que forman la muestra.
Para ilustrar esta clase de muestreo, supongamos que una gran empresa quiere estudiar los
diferentes gastos familiares, en el rea de Guadalajara, Jalisco. Al intentar elaborar los
programas de gastos de 1,200 familias, la empresa encuentra que el muestreo aleatorio simple
es prcticamente imposible. Dado que no se cuenta con las listas adecuadas, y el costo de
ponerse en contacto con las familias dispersas en esta gran ciudad, es muy alto. Una manera
en que se puede tomar una muestra de esta situacin, es dividiendo el rea total de
Guadalajara, en varias reas ms pequeas que no se traslapen, digamos, manzanas,
regiones, sectores etc., de la ciudad; entonces se seleccionan algunas casas al azar, y todas
las familias que residen en estas manzanas, constituyen la muestra definitiva.
Tanto en el muestreo estratificado como en el de conglomerados, la poblacin se divide en
grupos bien definidos. Usamos el muestreo estratificado, cuando cada grupo tiene una pequea
8
La ventaja del muestreo estratificado, es que permite obtener informacin, sobre las
caractersticas motivo de estudio y aumenta la precisin de las estimaciones sobre toda la
poblacin; y en general, da mejores resultados que el muestreo aleatorio, mientras ms
diferentes sean los estratos entre s y sean ms homogneos internamente.
Sus desventajas son: dificultad para decidir a qu estrato se asigna cada uno de los
elementos de la poblacin y cmo elegir el tamao de la muestra de cada estrato, para que el
total sea n.
Este mtodo, se utiliza cuando resulta muy costoso elaborar una lista completa, de todos los
elementos de la poblacin. El inconveniente se presenta, cuando los conglomerados no son
homogneos entre s, ya que la muestra final, puede no ser representativa de la poblacin.
Sin embargo, tiene la ventaja de simplificar, el levantamiento de la poblacin
Matemticas aplicadas Estadstica Inferencial
variacin dentro de s mismo, pero hay una amplia variacin dentro de los grupos. Usamos el
muestreo por conglomerados en el caso opuesto: cuando hay una variacin considerable dentro
de cada grupo, pero los grupos son esencialmente similares entre s.
ERRORES AL MUESTREAR.
ecordemos que la muestra descansa, en el principio de que las partes representan al
todo y, por tal, refleja las caractersticas que definen a la poblacin de la cual fue
extrada, lo cual nos indica, que es representativa. Es decir, que para hacer una
generalizacin exacta de una poblacin, es necesario tomar una muestra representativa. Por lo
tanto, la validez de la generalizacin, depende de la validez y tamao de la muestra.
R
Cuando trabajamos con muestras, generalmente se presentan dos tipos de errores:
Error sistemtico. Llamado de distorsin o sesgo de la muestra, se presentan por
causas ajenas a la muestra:
Situaciones inadecuadas : se presentan, por ejemplo, cuando el encuestador tiene
dificultades para obtener la informacin y la sustituye por la que ms fcilmente est a
su alcance, que no siempre es la ms confiable.
Insuficiencia en la recoleccin de datos : hay distorsin por falta de respuestas, o
respuestas inadecuadas, ya sea por ignorancia o falta de datos relativos a los elementos
incluidos. Distorsiones del encuestador causadas por prejuicios, inters personal o por
fallas en la aplicacin de instrumentos.
Errores de cobertura a causa de que no se han incluido elementos importantes y
significativos para la investigacin que se realiza.
Error de muestreo o muestral. Cualquiera que sea el procedimiento utilizado y la
perfeccin del mtodo empleado, la muestra diferir de la poblacin. A esta diferencia se
la denomina error de muestreo.
Cuando una muestra es aleatoria o probabilstica, es posible calcular sobre ella, el error
muestral. Este error, indica el porcentaje de incertidumbre, es decir, el riesgo que se corre que
la muestra elegida no sea representativa. Si trabajamos con un error calculado en 5%, ello
significa que existe un 95% de probabilidades de que el conjunto muestral, represente
adecuadamente, al universo del cual ha sido extrado.
A medida que incrementamos el tamao de la muestra, el error muestral tiende a reducirse,
pues la muestra va acercndose ms al tamao del universo. Del mismo modo, para una
muestra determinada, su error ser menor cuanto ms pequeo sea el universo a partir del cual
se la ha seleccionado. As, para un universo de 10,000 casos, una muestra de 200 unidades
tendr un error mayor que una de 300; esto es; N = 10,000 y n = 200 por lo tanto su fraccin
de muestreo n/N = 200 / 10,000 = 0.02 y N = 10,000 y n = 300 por lo que su fraccin de
muestreo n/N = 300 / 10,000 = 0.03, por lo tanto la fraccin de muestreo ms chica (0.02), ser
la que tenga mayor error muestral.
De manera similar, si vara el tamao del universo con igual tamao de muestra, se confirma
tambin la anterior afirmacin; por ejemplo para una muestra de n = 200 casos, se tendr un
error mayor, si el universo tiene 10,000 unidades, que si el universo posee solamente 2,000
unidades.
9
Matemticas aplicadas Estadstica Inferencial
Hagamos los clculos, n = 200 y N = 10,000; la fraccin de muestreo es n/N = 0.02; en la otra
poblacin N = 2,000 y n = 200, n/N = 0.1 se confirma que la primera fraccin de muestreo que
es la ms chica, tendr un error de muestreo mayor, ya que disminuy el universo de la
poblacin, con una misma muestra.
Para fijar el tamao de la muestra adecuado a cada investigacin, es preciso primero
determinar el porcentaje de error que estamos dispuestos a admitir.
Una vez hecho esto, debern realizarse las operaciones estadsticas correspondientes, para
poder calcular el tamao de la muestra, que nos permite situarnos dentro del margen de error
aceptado. Dichos clculos se estudiarn en otro apartado; sin embargo, si el tamao de la
muestra queda determinado previamente por consideraciones prcticas; no hay otra alternativa
que aceptar el nivel de error, que su magnitud acarree.
Antes que contestes las preguntas de la pgina siguiente...
Elabora en tu cuaderno un mapa conceptual o esquema, con
los principales conceptos hasta aqu estudiados .
COMPARALO CON OTROS TRABAJOS DE TUS COMPAEROS
Ahora s, contesta correctamente las siguientes actividades de aprendizaje...
A CONTINUACIN RESUELVE LAS SIGUIENTES ACTIVIDADES DE APRENDIZAJE PARA
QUE REAFIRMES LO APRENDIDO HASTA EL MOMENTO
Si tienes dudas, vuelve a leer los temas, pregunta a tus compaeros del grupo,
consulta otros libros o artculos, relacionados con los temas, etc.
TU PUEDES SI QUIERES.
10
Educacin humana y de
calidad
SAETA-
Aceboman, espero
me ayudes a salir
adelante Sale?
Matemticas aplicadas Estadstica Inferencial
ACTIVIDADES DE APRENDIZAJE:
Contesta correctamente las siguientes preguntas
1. Escribe el nombre y smbolo de los dos principales parmetros de la poblacin, as como sus
dos estadsticos de la muestra.
2. Cuntas muestras distintas de tamao n = 4 , podemos escoger de una poblacin finita de
tamao N = 30?
Respuesta: _________
3. Cuntas muestras distintas de tamao n =3, podemos tomar de una poblacin finita de
tamao N = 110?,
Respuesta: _________
4. Cuales son los tipos de errores que se pueden cometer cuando se trabaja con muestras?
___________________________ y ______________________ explcalos brevemente con tus
palabras.
5. Asigna a cada uno de los integrantes de tu grupo un nmero y utiliza la tabla de nmeros
aleatorios de la pgina 5, a partir del elemento 21 de la sexta columna hacia la derecha
determina una muestra aleatoria de seis estudiantes. Realiza tus clculos aqu o aun lado de la
hoja, por favor.
6. De los nmeros asignados en el ejercicio anterior, ahora a partir del 14 elemento de la
primera columna hacia abajo determina una muestra aleatoria de cuatro estudiantes.
7. Escribe que entiendes por MUESTREO ALEATORIO SIMPLE: ________________________
____________________________________________________________________
11
Matemticas aplicadas Estadstica Inferencial
8. De la lista de tus compaeros del grupo, anota en un pedazo de papel el nmero que
corresponde a cada uno de ellos. Mezcla bien todos los papelitos en una caja o urna y extrae
sin reemplazamiento 6 estudiantes para un muestra aleatoria simple. Anota aqu tu resultado.
__________________ _________________ _________________
__________________ _________________ _________________
9.- De la misma manera que el ejercicio anterior, Extrae una muestra aleatoria simple de 5
estudiantes con reemplazamiento. Anota aqu tus resultados.
__________________ _________________ _________________
__________________ _________________
10. En la colonia 2 de agosto de Tepic, Nayarit, de 1980 habitantes, se pretende realizar una
encuesta y seleccionar a 16 personas entre 180 seoras, para conocer el grado de aceptacin
de un nuevo producto de limpieza. De acuerdo al tipo de muestreo sistemtico, calcula, cuales
sern las 16 personas seleccionadas para ser entrevistadas?
Realiza tus clculos a un lado de la hoja, por favor.
11. La Universidad Autnoma de Nayarit, tiene una poblacin aproximada de 12,500
estudiantes, profesores y trabajadores y de los cuales 8500 son estudiantes, 1990 son
profesores y 2010 son trabajadores. Calcula el tamao de la muestra de cada estrato. si se
desea saber la opinin de 500 personas de la universidad, sobre la gestin del actual rector.
Realiza tus clculos aun lado de la hoja, por favor.
12. Un CBTA tiene inscritos a 550 estudiantes, de los cuales 290 cursan el 1er ao, 188 el 2do
ao y 72, 3er. ao. Calcula el tamao de la muestra de cada estrato, si se desea saber la
opinin de slo 100 estudiantes, sobre la eficiencia de la infraestructura del plantel.
Realiza tus clculos aun lado de la hoja, por favor.
13. A medida que se incrementa el tamao de la muestra, Se incrementa el error muestral?

SI___ NO____ Porque? _______________________________________________________
14. Observa detenidamente los siguientes datos y contesta Cul tendr mayor error muestral?
Poblacin 1 Universo (N = 350) y Muestra (n = 150)
Poblacin 2 Universo (N = 350) y Muestra (n = 250)

Qu poblacin tiene mayor error muestral? ______
15. Poblacin 1 N = 70 y n = 15
Poblacin 2 N = 800 y n = 150
Qu poblacin tiene mayor error muestral? ______
12
Matemticas aplicadas Estadstica Inferencial
DISTRIBUCIONES MUESTRALES:
E
l concepto de distribucin muestral, es el concepto ms bsico de la inferencia estadstica y se
puede definir como una distribucin de probabilidad, que consta de todos los valores posibles
de un estadstico de la muestra de tamao n (con o sin reemplazo). En cada muestra, se suele
calcular un estadstico, como la media o la desviacin estndar, que vara de una muestra a
otra. De esta forma se obtiene una distribucin del estadstico denominada distribucin
muestral. Si por ejemplo, el estadstico utilizado es la MEDIA MUESTRAL, entonces la
distribucin se llama distribucin del muestreo de medias o distribucin muestral de la media.
De forma similar, se puede obtener distribuciones muestrales de las desviaciones estndar, las
varianzas, las medianas, etctera.
DISTRIBUCIN MUESTRAL DE MEDIAS:
C
on el propsito de familiarizarnos con la forma de estudiar estos problemas, analizaremos un
caso muy simple. Supongamos que tenemos una poblacin de N = 5 nios y que nuestras
muestras son de tamao n = 2. (Es claro que para un problema de este tamao simplemente
tomamos las alturas de los cinco nios, las sumamos, dividimos entre 5 y se acab.)
El objetivo de ste anlisis, es entender algunos aspectos importantes de la distribucin
muestral de medias a travs de este ejemplo.
La media poblacional de las alturas es:
1.20 1.18 1.32 1.23 1.28
1.24
5

+ + + +

Y su desviacin estndar poblacional es:
Ahora Cuntas muestras posibles hay en una poblacin( N ) de 5 nios y queremos
muestras (n) de tamao 2, sin reemplazo? O dicho de otra manera, Cules son todas las
muestras de tamao igual a 2, que pueden obtenerse sin reemplazo de la poblacin de 5
nios?
Como es sin reemplazo, hay un total de 5C2 = (5)(4) / 2! = 10 muestras posibles. Que son los
NIOS: {1,2}, {1,3}, {1,4}, {1,5}, {2,3}, {2,4}, {2,5}, {3,4}, {3,5}, {4,5}.
Estas 10 muestras posibles, se pueden observar en la siguiente tabla
Nio 1 2 3 4 5
Altura 1.20 1.18 1.32 1.23 1.28
13
2 2 2
(1.20 1.24) (1.18 1.24) ... (1.28 1.24)
0.0514
5

+ + +

x

12.42
1.24
10
x
x
N

Matemticas aplicadas Estadstica Inferencial


TABLA DE DISTRIBUCIN MUESTRAL DE MEDIAS
Muestras del tamao igual a 2 sin reemplazo de poblacin de 5 nios
Nio
( altura )
1 (1.20) 2 (1.18) 3 (1.32) 4 (1.23) 5 (1.28)
1 ( 1.20 ) (1.20; 1.18) (1.20; 1.32) (1.20; 1.23) (1.20; 1.28)
2 ( 1.18 ) (1.18;1.32) (1.18; 1.23) (1.18; 1.28)
3 ( 1.32 ) (1.32; 1.23) (1.32; 1.28)
4 ( 1.23 ) (1.23; 1.28)
5 ( 1.28 )
Para cada una de estas muestras, tenemos una media . Por ejemplo, para la muestra {1,2},
su media es = (1.20 + 1.18) / 2 = 1.19 y para la muestra {3,5} su media es = (1.32 + 1.28)/2
= 1.30, etc. Segn se muestra en la siguiente tabla de medias.
MEDIAS DE LA DISTRIBUCIN MUESTRAL DE MEDIAS
Nio
(altura)
2 (1.18) 3 (1.32) 4 (1.23) 5 (1.28) Total
1 ( 1.20 ) (1.20+1.18)
= 1.19
(1.20+1.32)
= 1.26
(1.20+1.23)
= 1.215
(1.20+1.28)
= 1.24
4.905
2 ( 1.18 ) (1.18+1.32)
= 1.25
(1.18+1.23)
= 1.205
(1.18+1.28)
= 1.23
3.685
3 ( 1.32 ) (1.32+1.23)
= 1.275
(1.32+1.28)
= 1.30
2.575
4 ( 1.23 ) (1.23+1.28)
= 1.255
1.255
Total = 1.19 2.51 3.695 5.025 12.42
Ahora calculemos dos aspectos importantes de esta variable aleatoria, como son la MEDIA Y
LA DESVIACIN ESTNDAR de la distribucin muestral de medias.
La media que denotamos por la llamamos MEDIA DE LA DISTRIBUCIN MUESTRAL
que es la media de las medias de cada muestra.
Su frmula es resultado es igual a la media poblacional obtenida.
14
x
x
x
x

Matemticas aplicadas Estadstica Inferencial


Esto es, LA MEDIA DE LA POBLACIN, ES IGUAL A LA MEDIA DE LA DISTRIBUCIN
MUESTRAL DE MEDIAS (1.24)
Ahora, la desviacin estndar, que denotamos y llamaremos ERROR ESTNDAR DE
LA MEDIA, que es la desviacin estndar de la distribucin muestral de medias; Calculemos,
siguiendo los datos de la tabla y posteriormente analizaremos otra manera ms fcil.
ERROR ESTNDAR DE LA MEDIA
Muestra
Medias Medias al
cuadrado
{1,2} 1.19 1.4161
{1,3} 1.26 1.58761
{1,4} 1.215 1.476225
{1,5} 1.24 1.5376
{2,3} 1.25 1.5625
{2,4} 1.205 1.452025
{2,5} 1.23 1.5129
{3,4} 1.275 1.625625
{3,5} 1.30 1.69
{4,5} 1.255 1.575025
Total = 12.42 15.4356
Con los datos anteriores, podemos utilizar una frmula y obtener el error estndar de la media
que es.
Hasta aqu, hagamos un espacio de reflexin:
Hay dos resultados muy importantes, que describen la distribucin de la variable aleatoria de la
distribucin muestral de medias.
El primero de ellos nos dice, que la media de la distribucin muestral de medias, siempre
coincide con la media de la poblacin y que el error estndar de la media, es siempre menor
que la desviacin estndar de la poblacin, o igual a ella, si la dividimos entre la raz cuadrada
del tamao de la muestra. Ms precisamente:
15
x
2
x
03156 0
100
42 12 4356 15 10
2
2
2
2
.
) . ( ) . (
) ( ) (


N
x x N
x

Si tomamos muestras de tamao n de una poblacin de tamao N con media y


desviacin estndar , y se simbolizan la media y la desviacin estndar de la distribucin
muestral de medias por y respectivamente, entonces:
Las medias
y las desviaciones

Si tomamos muestras de tamao n de una poblacin de tamao N con media y
desviacin estndar , y se simbolizan la media y la desviacin estndar de la distribucin
muestral de medias por y respectivamente, entonces:
Las medias
y las desviaciones

x


x
x
n

N
n N
n
x

Matemticas aplicadas Estadstica Inferencial


Para el ejemplo que venimos desarrollando, utilizaremos la ltima frmula para estimar la
desviacin estndar de las medias muestrales o el error estndar de la media.

Coincide con el valor que obtuvimos antes para la desviacin estndar de la distribucin
muestral de medias.
Pero es preciso indicar que el factor
1
N n
N

de la segunda frmula, se conoce como factor de


correccin de la poblacin finita (cpf), ya que sin ste, las dos frmulas (para poblaciones
infinitas y finitas) son las mismas.
Una regla de uso muy frecuente, establece que el factor de correccin de poblacin finita (cpf),
se puede pasar por alto cuando n/N es menor o igual a 0.05, esto es, cuando la muestra
contiene el 5% o menos de la poblacin.
Por lo tanto, si la poblacin es infinita; o el muestreo se hace de una poblacin infinita con
reemplazamiento; o cuando N > 20n la frmula para encontrar el error estndar se reduce a
Para encontrar el error estndar de la media cuando la poblacin es finita y el muestreo se hace
sin reemplazo; o cuando N <20n es:
En la siguiente pgina
Realiza un ejercicio de sntesis de lo que se ha estudiado, donde debes completar los
espacios, para que escribas lo que consideres ms conveniente.
16
0.05154 5 2 0.05154 3
. . . 0.03156
1 5 1 4 2 2
x
N n
N n




x
n


.
1
x
N n
N n

Yo voy a ponerle ganas,


para que aceboman,
tambin me ayude.
Matemticas aplicadas Estadstica Inferencial
ACTIVIDADES DE APRENDIZAJE:
Contesta adecuadamente las siguientes preguntas y completa los espacios correctamente:
El tamao de la muestra se denota como?_____________
El tamao de la poblacin se denota como?____________
La media poblacional se denota como?____________
La desviacin estndar poblacional se escribe como?____________
La media de la distribucin muestral de medias se denota?__________
El error estndar de la media se denota como? _________________
En una distribucin muestral de medias :
La frmula de la media de la distribucin muestral de medias es: __________________
y su resultado es: ________________ a la media poblacional.
(Igual o diferente)
En cambio el error estndar de la media es:____________________________, que la
(Igual o diferente)
desviacin estndar poblacional.
Son dos frmulas para calcular el error estndar de la media
(1) Para poblaciones ______________o muestreo ________________ su frmula es
(Finitas o infinitas) (Con o sin reemplazo)
_________________________________
(2) Para poblaciones _______________o muestreo _______________ su frmula es
(Finitas o infinitas) (Con o sin reemplazo)
__________________________________
Cuando N > 20n se utiliza la frmula _________________para poblaciones______________
Cuando N < 20n se utiliza la frmula _________________para poblaciones______________
Finalmente, en una ficha bibliogrfica, realiza un esquema, mapa conceptual, o formulario con
los anteriores conceptos y frmulas, para que las tengas a la mano y las utilices posteriormente.
17
Gracias
Aceboman, me
caes bien
3 3000 25
. . 0.59759 0.6 lg
1 3000 1
25
x
N n
pu
N
n




Matemticas aplicadas Estadstica Inferencial
HORRIBLEMENTE BIEN, FELICIDADES
A CONTINUAR AUTOAPRENDIENDO
ERROR ESTNDAR O TPICO
omo se seal en el ejemplo anterior, en lugar de decir "la desviacin estndar de la
distribucin de las medias de la muestra" nos referimos al error estndar de la media. De
manera similar, la "desviacin estndar de la distribucin de las proporciones de la
muestra" se abrevia como error estndar de la proporcin.
C
El trmino error estndar se utiliza porque da a entender que la variabilidad en los estadsticos
de la muestras, provienen de un error de muestreo debido al azar; es decir, hay diferencias
entre cada muestra y la poblacin, y adems entre las diversas muestras debido nicamente a
los elementos que decidimos escoger para las muestras. Por lo tanto, mide el grado en el que
se puede esperar que flucten o varen los estadsticos de una muestra como consecuencia del
azar, pero no solo mide el error de azar que se ha cometido, sino tambin la probable precisin
que obtendremos si utilizamos una estadstica de muestra para estimar un parmetro de
poblacin.
Si el error estndar es bajo, hay buenas posibilidades de que el estadstico de una muestra
se aproxime al de la poblacin; en cambio
Si el error estndar es alto es ms probable que obtengamos una muestra que difiera
considerablemente de la poblacin.
Supngase que la estatura de 3,000 estudiantes universitarios hombres, se distribuye
normalmente, con una media de 68.0 pulg. y una desviacin estndar de 3.0 pulg. Si se
obtienen 80 muestras de 25 estudiantes cada una.
Cules seran las medias y las desviaciones estndar (error estndar) esperadas de la
distribucin muestral de medias, si los muestreos se hubieran hecho
a) con reemplazamiento y b) sin reemplazamiento?
El nmero de muestras de tamao 25 que podran obtenerse tericamente de un grupo de
3,000 estudiantes con reemplazamiento es de (3,000)
25
= 8.47 x 10
86
y sin reemplazamiento es
de 3000C25= 4.91 x 10
61
, que son mucho mayores que 80. Por tanto, no se obtiene una
verdadera distribucin muestral de medias, sino slo una distribucin muestral terica. Por
tanto
a) Con reemplazamiento
68.0 lg
x
pu
. y
3
0.6 lg.
25
x
pu
n


18
Entonces
analicemos un
problema, para
comprender
mejor todo lo
estudiando hasta
aqu sale?
Compaeros,
urge hacer un
ejercicio para
practicar
Mmmmm. Est
bien nimo!
Matemticas aplicadas Estadstica Inferencial
b) Sin reemplazamiento
68.0 lg
x
pu
y
ste ltimo resultado, es slo ligeramente menor que 0.6 pulg. y puede, para propsitos
prcticos, considerarse igual que el muestreo con reemplazamiento.
Por lo tanto, se esperara que la distribucin muestral de medias est distribuida
aproximadamente de manera normal, con media de la distribucin muestral
x

68.0 pulg. y el
error estndar de la media
x

0.6 pulg.
Pero profundicemos un poco ms; ahora queremos saber
Cuntas muestras de las 80 del anterior problema, esperaramos encontrar la media
entre 66.8 y 68.3 pulg? y tambin Cuntas muestras de las 80, sus medias son menor
que 66.4 pulg.?
DISTRIBUCIN NORMAL
E
ntre la gran cantidad de distribuciones continuas que se usan en la estadstica, la ms
importante, es la distribucin normal o curva normal. La frmula de esta distribucin fue
publicada por primera vez por Abraham Demoivre (1667-1754) en 1733. Otros matemticos que
figuran, en la historia inicial de la distribucin normal, son Pierre Simon, el Marqus de Laplace (
1749-1827) y Carl Friedrich Gauss (1777-1855), en cuyo honor se denomina a veces, como
distribucin de Gauss.
La frmula de la distribucin normal es:
2
1 1
( ) exp
2 2
x
f x


1
_
1

, 1
]
donde : = la media de la distribucin
= la desviacin tpica de la distribucin

= la constante 3.14159
y
2
1
exp
2
x

1
_
1

, 1
]
indica que el trmino entre corchetes es el exponente de e, donde
e = la constante 2.71828
La curva normal, es una curva en forma de campana que se extiende indefinidamente en
ambos extremos, cada vez, pegndose ms al eje horizontal sin llegarlo a tocarlo. Algunas
caractersticas importantes de la distribucin normal, son las que se mencionan a continuacin:
1. El rea total comprendida bajo la curva y por encima del eje horizontal, es igual a 1 (unidades
cuadradas).
2. La distribucin es simtrica al respecto de su media. Es decir, el 50% del rea est a la
derecha de la media y el 50% a la izquierda.
19
Momento! para esto, antes debemos repasar
aunque sea someramente, la famosa distribucin
normal y el teorema del lmite central, sale?
A darle;
A los
caballos;
rale o
Ipso facto
Matemticas aplicadas Estadstica Inferencial
3. La media, la mediana y la moda son todas iguales.
4. La distancia horizontal, que hay desde el punto de inflexin de la curva (el punto donde la curva
deja de ser cncava hacia abajo y empieza a ser cncava hacia arriba), hasta una perpendicular levantada
sobre la media, es igual a la desviacin estndar , como se muestra en la siguiente figura:
5. La distribucin normal, es realmente una familia de distribuciones, puesto que existe una
distribucin diferente para cada valor de y . En la siguiente figura se pueden ver tres
distribuciones normales con la misma desviacin estndar, pero diferente media. Las
distribuciones que tienen diferentes medias, se sitan en diferentes posiciones sobre el eje
horizontal.

Ahora se muestran, tres distribuciones normales con la misma media, pero con diferentes
desviaciones estndar. Aqu nos muestra, cmo mientras ms grande sea la distribucin
estndar, ms plana y ms extendida es la grfica de la distribucin.
6. La curva de una distribucin normal se extiende de (infinito) hasta +
Afortunadamente en la prctica, no es necesario alargar estas colas muy lejos, pues se
encuentran tan cerca del eje horizontal, que el rea bajo ellas es despreciable cuando nos
alejamos ms de cuatro o cinco desviaciones estndar de la media.
En la prctica, se pueden calcular las probabilidades de una variable X que est distribuida
normalmente, y que tenga valores entre ciertos nmeros Xa y Xb, utilizando la tabla reas bajo
20
Punto de inflexin

Distribucin normal con media y desviacin estndar


Tres distribuciones normales con desviaciones estndar iguales pero diferentes medias




Tres distribuciones normales con medias iguales pero desviaciones estndar diferentes
= 0.7071

= 1
Matemticas aplicadas Estadstica Inferencial
la curva normal estndar (que se encuentra en la pgina 23), donde aparecen las reas entre los
valores 0 y z, con z > 0, para la curva normal estndar.(= 0 y = 1 ).
Si utilizamos la simetra de la curva alrededor de la media, podemos calcular reas entre
cualquiera de los dos valores Xa y Xb. Para obtener reas bajo cualquier curva normal,
efectuamos el cambio de escala (ver la figura siguiente), que convierte las unidades de medida de
la escala original o la escala X, en unidades estndar por medio de la formula
x
z

, esta
nueva escala o valor de Z simplemente, nos indica en cuntas desviaciones estndar por
encima o por debajo de la media de su distribucin, se desva el valor correspondiente de X.
Antes de utilizar la frmula para valores de Z, te invitamos a que reflexiones detenidamente
unos ejemplos y calculemos, las reas correspondientes a probabilidades de una variable
aleatoria normal.
a) Encuentra el rea bajo la curva normal estndar a la izquierda de 0.83 o P(Z < 0.83)
Como el rea bajo toda la curva es 1, el
rea que est a la izquierda del 0 es 0.5; el
rea que est a la izquierda de 0.83 es igual
a la suma del rea a la izquierda del 0 ms
el rea entre 0 y 0.83. En la tabla reas
bajo la curva normal estndar de la pgina
22 encontramos que este ltimo valor es
0.2967. El rea que buscamos es entonces
0.5 + 0.2967 = 0.7967 observa su curva.
El rea que se ha calculado corresponde a
la probabilidad de que esta variable, tome
valores menores a 0.83 que es de 0.7967 o
79.67%
b) Encuentra el rea bajo la curva normal
estndar a la derecha de 1.07 o P(Z >
1.07)
El rea a la derecha del 0 es 0.5 y la
podemos descomponer como la suma del
rea entre 0 y 1.07 y el rea a la derecha
del 1.07. En la tabla reas bajo la curva
normal estndar, obtenemos que el rea
21

+ + 2 + 3 - - 2 -
3
Escala X
0
1 2 3 -1 -2 -3
Escala Z
99.73
%%%
%
95.45
%%%
% %
68.27%
0
0.83
rea bajo la curva normal estndar a la izquierda de 0.83 = 0.7967
1.07
0
rea bajo la curva normal estndar a la derecha de 1.07 = 0.1423
Matemticas aplicadas Estadstica Inferencial
entre 0 y 1.07 es 0.3577. El rea a la derecha de 1.07 es lo que le falta a 0.3577 para llegar a
0.5, es decir, 0.5 0.3577 = 0.1423.
Por tanto, la probabilidad de que esta variable tome valores mayores a 1.07 es de 0.1423 o
14.23%
c) Encuentra el rea bajo la curva normal estndar entre 0.24 y 1.18 o P(0.24 Z < 1.18)
Si el rea entre 0 y 1.18 le restamos el rea
entre 0 y 0.24 obtenemos el rea que
buscamos. El rea entre 1.18 y 0.24 es 0.3810
0.0948 = 0.29
Por tanto, la probabilidad de que esta variable
tome valores entre 0.24 y 1.18 es de 0.29 o
29%
d) Encuentra el rea bajo la curva normal estndar entre 1.70 y 0.93 o P(-1.70Z<-0.93)
Debemos observar primero que el nmero
-1.70 est a la izquierda del -0.93. El rea que
deseamos calcular es el rea de -1.70 a 0,
menos el rea de 0.93 a 0, esto es, 0.4554
0.3238 = 0.1316
Por tanto, la probabilidad de que esta variable
tome valores entre -1.70 y -0.93 es de 0.1316
o 13.16%
e) Encuentra el rea bajo la curva normal a la derecha de 0.47 o P ( Z - 0.47)
Esta rea es la suma del rea de 0.47 a 0
ms el rea a la derecha del 0, que por la
tabla reas bajo la curva normal estndar
vemos que es 0.1808 + 0.5 = 0.6808
Por tanto, la probabilidad de que esta variable
aleatoria tome valores mayores a -0.47 es de
0.6808 o 68.08%
22
1.18 0.24
rea bajo la curva normal estndar entre 0.24 y 1.18 = 0.29
- 0.93 - 1.70
rea bajo la curva normal estndar entre -1.70 y -0.93 = 0.1316
- 0.47
rea bajo la curva normal estndar a la derecha de -0.47 = 0.6808
Matemticas aplicadas Estadstica Inferencial
TABLA: REAS BAJO LA CURVA NORMAL ESTANDAR, desde 0 a z.
z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
0.0 .0000 .0040 .0080 .0120 .0160 .0199 .0239 .0279 .0319 .0359
0.1 .0398 .0438 .0478 .0517 .0557 .0596 .0636 .0675 .0714 .0753
0.2 .0793 .0832 .0871 .0910 .0948 .0987 .1026 .1064 .1103 .1141
0.3 .1179 .1217 .1255 .1293 .1331 .1368 .1406 .1443 .1480 .1517
0.4 .1554 .1591 .1628 .1664 .1700 .1736 .1772 .1808 .1844 .1879
0.5 .1915 .1950 .1985 .2019 .2054 .2088 .2123 .2157 .2190 .2224
0.6 .2257 .2291 .2324 .2357 .2389 .2422 .2454 .2486 .2517 .2549
0.7 .2580 .2611 .2642 .2673 .2704 .2734 .2764 .2794 .2823 .2852
0.8 .2881 .2910 .2939 .2967 .2995 .3023 .3051 .3078 .3106 .3133
0.9 .3159 .3186 .3212 .3238 .3264 .3289 .3315 .3340 .3365 .3389
1.0 .3413 .3438 .3461 .3485 .3508 .3531 .3554 .3577 .3599 .3621
1.1 .3643 .3665 .3686 .3708 .3729 .3749 .3770 .3790 .3810 .3830
1.2 .3849 .3869 .3888 .3907 .3925 .3944 .3962 .3980 .3997 .4015
1.3 .4032 .4049 .4066 .4082 .4099 .4115 .4131 .4147 .4162 .4177
1.4 .4192 .4207 .4222 .4236 .4251 .4265 .4279 .4292 .4306 .4319
1.5 .4332 .4345 .4357 .4370 .4382 .4394 .4406 .4418 .4429 .4441
1.6 .4452 .4463 .4474 .4484 .4495 .4505 .4515 .4525 .4535 .4545
1.7 .4554 .4564 .4573 .4582 .4591 .4599 .4608 .4616 .4625 .4633
1.8 .4641 .4649 .4656 .4664 .4671 .4678 .4686 .4693 .4699 .4706
1.9 .4713 .4719 .4726 .4732 .4738 .4744 .4750 .4756 .4761 .4767
2.0 .4772 .4778 .4783 .4788 .4793 .4798 .4803 .4808 .4812 .4817
2.1 .4821 .4826 .4830 .4834 .4838 .4842 .4846 .4850 .4854 .4857
2.2 .4861 .4864 .4868 .4871 .4875 .4878 .4881 .4884 .4887 .4890
2.3 .4893 .4896 .4898 .4901 .4904 .4906 .4909 .4911 .4913 .4916
2.4 .4918 .4920 .4922 .4925 .4927 .4929 .4931 .4932 .4934 .4936
2.5 .4938 .4940 .4941 .4943 .4945 .4946 .4948 .4949 .4951 .4952
2.6 .4953 .4955 .4956 .4957 .4959 .4960 .4961 .4962 .4963 .4964
2.7 .4965 .4966 .4967 .4968 .4969 .4970 .4971 .4972 .4973 .4974
2.8 .4974 .4975 .4976 .4977 .4977 .4978 .4979 .4979 .4980 .4981
2.9 .4981 .4982 .4982 .4983 .4984 .4984 .4985 .4985 .4986 .4986
3.0 .4987 .4987 .4987 .4988 .4988 .4989 .4989 .4989 .4990 .4990
Jhon E. Freund y Gary A. Simon. Estadstica elemental. 8. Edicin. Edit. Prentice may 1992.
Tambin para z= 4.0, 5.0 y 6.0 las reas son 0.49997, 0.4999997 y 0.499999999.
SIGUE PRACTICANDO
CON OTROS VALORES, TU SOLO(A)
23
0
z
Los valores de la tabla, son las probabilidades de que
una variable aleatoria que tiene la distribucin normal
estndar, tome un valor de entre 0 y z.
Matemticas aplicadas Estadstica Inferencial
ACTIVIDADES DE APRENDIZAJE
Te recomendamos que utilices una curva normal por cada ejercicio, y apoyndote en la tabla de
la pgina 21, encuentres las respuestas correctas. Sigue los ejemplos de las pginas 18 y 19.
a) ENTRE 0 Y 1.68
P(0 Z < 1.68)
b) A LA DERECHA DE 0.69
P(Z 0.69)
c) ENTRE 1.07 y 1.46
P(1.07 Z < 1.46)
d) ENTRE -2.36 y 0
P(-2.36 Z < 0)
e) ENTRE -0.91 y 0.45
P(-0.91 Z < 0.45)
f) ENTRE -2.12 y -1.18
P(-2.12 Z < -1.18)
g) A LA IZQUIERDA DE 0.35
P(Z < -0.35)
24
Matemticas aplicadas Estadstica Inferencial
TEOREMA DEL LMITE CENTRAL
a relacin entre la forma de la distribucin de la poblacin y la forma de la distribucin de
muestreo se denomina teorema del lmite central, que es tal vez, el teorema ms
importante de toda la inferencia estadstica; su importancia radica en que nos permite
usar los estadsticos de la muestra, para hacer inferencias con respecto a los parmetros de
poblacin, sin saber nada sobre la forma de la distribucin de frecuencias de esa poblacin,
ms que lo que podamos obtener de la muestra.
L
El teorema del lmite central, nos permite el empleo de la distribucin normal en una amplia
variedad de problemas; an, cuando la variable en estudio no tenga distribucin normal, o su
distribucin sea desconocida. Si el nmero de elementos de la muestra es suficientemente
grande, por aplicacin del Teorema del Lmite Central, la media aritmtica igualmente va a tener
aproximadamente distribucin normal.
Aun cuando no especifica que tan grande debe ser el tamao de la muestra n, para poder
aproximar la distribucin muestral
x
por una distribucin normal, una buena regla es que basta
que n sea mayor o igual a 30, o sea, n 30
Otro aspecto importante, es que para convertir cualquier variable aleatoria normal, en una
variable aleatoria normal estndar, debemos sustraer la media de la variable que se est
estandarizando y dividir el resultado entre el error estndar (la desviacin estndar de dicha
variable), segn la siguiente frmula, donde z = son las unidades estndar.
Anlogamente, tambin podemos utilizar la frmula
1
x x
z
s

Siguiendo el mismo ejercicio de la pgina 16, de los 3000 estudiantes universitarios que se
distribuyen normalmente con una media

68.0 pulg y desviacin estndar

3.0 pulg y
donde calculamos un error estndar de la media
x

0.6 pulg. Ahora las preguntas sern
En cuntas muestras de las 80 del anterior problema, esperaramos encontrar la media
a) entre 66.8 y 68.3 pulg y tambin
25
TEOREMA DEL LMITE CENTRAL:
Si n es grande, la distribucin muestral de las medias puede aproximarse a
una distribucin normal, sin importar la forma de la distribucin de la
poblacin.
Ahora si,
practiquemos esta
formula con el
ejemplo anterior
sale?
Matemticas aplicadas Estadstica Inferencial
b) menor que 66.4 pulg.?
La media
x
de una muestra en UNIDADES ESTANDAR est dada aqu por:
68.0
0.6
x
x x
z



a) Cuntas muestras hay entre 66.8 y 68.3 pulgadas? o P (66.8 Z < 68.3)
66.8 en unidades estndar =
68.3 en unidades estndar =
La proporcin de muestras con medias entre 66.8
y 68.3 pulg es igual al rea bajo la curva normal
entre z= -2.0 y z= 0.5, esto es igual al (rea entre
z= -2.0 y z= 0) + mas (rea entre z= 0 y z = 0.5)
Buscamos los valores en la tabla reas bajo la
curva normal estndar y encontramos que para 2 = 0.4772 y para 0.5 = 0.1915 Sumamos los
dos valores = 0.6687 = 66.87% y entonces finalmente, el nmero esperado de muestras es (80)
(0.6687) = 53.496 o 53 muestras
b) Cuntas muestras son menor que 66.4 pulg .?o P (Z < 66.4)
66.4 en unidades estndar =
La proporcin de muestras con medias
menores que 66.4 pulg. = (rea bajo la curva
normal a la izquierda de z = -2.67) = (rea a la
derecha de z = 0) menos (rea entre z=
-2.67 y z = 0) = 0.5 0.4962 = 0.0038 =
0.38%-
Por lo tanto, el nmero esperado de muestras
es (80) (0.0038) = 0.304 o cero muestras.
26
z = 0.5
= 68.0
z = -2.0
= 68.0
z = 0
z = -2.67
Vamos hacer otro
problema para
aprender otra
forma de su
clculo
Sale?


66.8 68.0
2.0
0.6

68.3 68.0
0.5
0.6


66.4 68.0
2.67
0.6
Matemticas aplicadas Estadstica Inferencial
Con base en el teorema del lmite central. Cul es la probabilidad de que el error de una
variable aleatoria sea menor que 5, cuando se usa la media de una muestra aleatoria de
tamao n = 64 para estimar la media de una poblacin infinita con = 20?
Aunque el valor de es desconocida, sabemos que la distribucin muestral de las medias es
normal con la media poblacional . Por lo tanto, la probabilidad se obtiene por medio del rea
de la zona bajo la curva de normal estndar, entre
y
Dado que la entrada de la tabla corresponde a z = -2.00 es 0.4772 y z = 2.00 es 0.4772 la
probabilidad que se pide es 0.4772 + 0.4772 = 0.9544
Entonces afirmamos, la probabilidad de que
una media de una muestra aleatoria de
tamao n = 64 de la poblacin infinita con =
20, difiera de la poblacin por menos de 5 es
de 0.9544 o el 95.44%
SIGUE PRACTICANDO OTROS PROBLEMAS, Y TE RECOMENDAMOS QUE INGRESES A
LA PAGINA INTERACTIVA DE INTERNET http://descartes.cnice.mec.es/ del ministerio de
educacin y ciencia de Espaa, especficamente en la unidad didctica del bachillerato,
modalidad de humanidades y ciencias sociales, en el tema, Distribucin Normal e inferencia
estadstica.
ENTRA A ESTA PGINA E INCREMENTA TU APRENDIZAJE
NO TE VAS A ARREPENTIR !
A CONTINUACIN RESUELVE LAS SIGUIENTES ACTIVIDADES DE APRENDIZAJE
PARA QUE REAFIRMES LO APRENDIDO HASTA EL MOMENTO
27
5
2
20/ 64
z


5
2
20/ 64
z

z = 0
- 5
z = -2.0
+ 5
z = 2.0
0.4772 0.4772
Educacin humana y de
calidad
SAETA
x
x u
z

Matemticas aplicadas Estadstica Inferencial


ACTIVIDADES DE APRENDIZAJE:
Con el propsito que reafirmes lo aprendido, contesta
utilizando tus palabras y criterio las siguientes preguntas
1. Explica brevemente qu entiendes por distribucin muestral?
Respuesta: __________________________________________________________________
____________________________________________________________________________
2. Qu estudiamos cuando analizamos una distribucin muestral de medias?
Respuesta: __________________________________________________________________
____________________________________________________________________________
3. Cul es el nmero de muestras de tamao 5, que podran obtenerse de un grupo de 200
estudiantes, con reemplazo y sin reemplazo? Realiza tus clculos aqu. Por favor.
Con reemplazo: _________
Sin reemplazo: __________
4. Cul es el nmero de muestras de tamao 4, que podran obtenerse de un grupo de 30
personas, con reemplazo y sin reemplazo?
Con reemplazo: __________
Sin reemplazo: __________
5. Que es lo que mide el error estndar en una distribucin muestral de medias?
Respuesta: __________________________________________________________________
____________________________________________________________________________

6. Si el error estndar es bajo o alto que nos sugiere?
Si es bajo indica: ___ Si es alto indica: ___
7. Que nos indica el teorema del lmite central?
Respuesta:
A UN LADO DE STA HOJA, O EN TU CUADERNO DE ESTADSTICA,
RESUELVE ADECUADAMENTE LOS SIGUIENTES PROBLEMAS.
28
Matemticas aplicadas Estadstica Inferencial
8. Una poblacin consiste de cinco nmeros 2, 3, 6, 8 y 11. Considere todas las muestras de
tamao igual a 2 que pueden obtenerse, con reemplazamiento y sin reemplazamiento, a partir
de estas poblaciones. Calcule a) la media de la poblacin, b) la desviacin estndar de la
poblacin, c) la media de la distribucin muestral de medias, y d) la desviacin estndar
de la distribucin de medias, es decir, el error estndar de medias.
9. Quinientos baleros de rodamiento tienen un peso medio de = 5.02 g y una desviacin
estndar de = 0.30 g., de una muestra aleatoria de n = 100 baleros de rodamiento elegida de
este grupo. Calcula la probabilidad de que, el peso combinado est entre 496 y 500 g, si el peso
medio de los 100 baleros, est entre 4.96 y 5.00 g y la probabilidad de que el peso combinado
exceder 510 g, si el peso medio de los 100 baleros excede 5.10 g.
10. Una regin agrcola consta de 200 000 hectreas donde se siembra trigo. Para estimar la
produccin media por hectrea, se realiza una muestra de 900 hectreas que tuvieron en
promedio una productividad de = 3.4 toneladas. La SAGARPA estima que la que la desviacin
estndar de la productividad del trigo en la regin es de = 0.8 Toneladas. Cul es la
probabilidad de que nuestra estimacin de la produccin media en la regin, tenga un
error de a lo ms 0.05 toneladas?
11. La media de una muestra aleatoria de tamao n = 300 es usada para estimar la media del
ingreso familiar de una poblacin de 20,000 familias de una regin. Si el INEGI estima que la
desviacin estndar del ingreso familiar en la regin es = $ 1500. Determina la probabilidad
de que el error de estimar la media sea a) menor que $200 y b) menor que 250
12. La media de una muestra aleatoria de tamao n = 50 barricas, es empleada para estimar el
contenido de alcohol de la produccin tequilera en una bodega de 20000 barricas. Si la
desviacin estndar del contenido alcohlico del tequila es de = 0.5%. Determina la
probabilidad de que el error de estimar la media sea a) menor al 0.01% y b) menor al
0.02%
29
Matemticas aplicadas Estadstica Inferencial
SECUENCIA DIDCTICA Estimando la confianza
Autor: Alejandro Acebo Gutirrez
Contenido temtico Teora de estimacin estadstica
Propsito del contenido temtico:
Analizar los conceptos de la teora de la estimacin estadstica, para
que el estudiante los utilice durante el desarrollo de trabajos
estadsticos inferenciales.
Conceptos fundamentales: Intervalos de confianza
Conceptos subsidiarios: Intervalos de confianza de parmetros poblacionales: Intervalos de
confianza para medias e Intervalos de confianza para proporciones.
Tema integrador Relaciones humanas (convivencia)
Nmero de sesiones 2 (semanas ) con alto porcentaje de estudio independiente
Valores y actitudes Solidaridad, Tolerancia, Libertad y Justicia,
Categoras Diversidad y espacio.
BLOQUE: ACTIVIDADES DE APERTURA Observaciones
Te invitamos a que reflexiones un momento sobre el tema de las RELACIONES
HUMANAS y la difcil tarea de tomar decisiones. Contesta honestamente
@ Cules son las personas que ms respetas y por que?
@ Cules son las personas que menos toleras y por que?
@ Por qu son importantes las relaciones humanas en la toma decisiones?
A continuacin se presenta un problema. Por favor, aydale al director a resolverlo:
El director de un CBTA no sabe que hacer; segn el, es urgente incrementar las
inscripciones porque la infraestructura de la escuela est en psimas condiciones, pero
tambin sabe que los alumnos son de escasos recursos econmicos y no quiere daar su
buena imagen ante ellos, por lo que decide obtener una muestra aleatoria de 200 alumnos
del CBTA, de los cuales, 144 se oponen a un incremento de la inscripcin y 56 estn a
favor de dicho incremento.
a) Construye un intervalo de confianza del 95%, para la proporcin de la poblacin de
estudiantes que se oponen al incremento de la inscripcin. Interpreta su resultado
b) Construye un intervalo de confianza del 95%, para la proporcin de la poblacin
que est a favor del incremento de la inscripcin. Interpreta su resultado
Es conveniente un
tiempo aceptable
para desarrollar
esta importante
introduccin.
Integrarse en
equipos de 3
estudiantes.
BLOQUE: ACTIVIDADES DE DESARROLLO
1.- Consultar la presente gua didctica, en los temas correspondientes a:
Estimacin de parmetros; Estimacin sin sesgo; Estimacin puntual y estimacin por
intervalos; Estimacin por intervalos de confianza de los parmetros poblacionales: para
medias y de proporciones. Error probable o error mximo y Tamao de la muestra.
2. Investigar de manera personal, otras fuentes de informacin a tu alcance para
enriquecer tus conocimientos de los temas antes mencionados.
3.- Integrado en equipos de tres compaeros, comenten las estrategias para la solucin
de las preguntas antes sealadas.
3. Realicen esquemas, lminas, o presentaciones para su exposicin grupal en el aula.
Consultar la
presente gua
didctica para
argumentar su
solucin y otras
bibliografas.
BLOQUE: ACTIVIDADES DE CIERRE
En reunin plenaria, expondrn ya sea con rotafolio, lminas, o presentaciones
PowerPoint; las vas de solucin que se hayan encontrado a dichos preguntas.
En la plenaria, encontraras la solucin ms idnea entre todo el grupo.
De manera respetuosa podrs solicitar a todo el grupo, te disipen algunas dudas
que tengas respecto al tema y a la solucin del problema en general.
El facilitador propiciar la exposicin libre de las emociones y sentimientos
generados durante el desarrollo del tema.
El cierre se har en
dos fases
1ra. Sobre las
relaciones humanas
2da. Sobre el
problema
estadstico
30
Matemticas aplicadas Estadstica Inferencial
TEMA -----------------
ay dos tipos de inferencia estadstica; la estimacin y la verificacin de hiptesis; en este
tema (teora de la estimacin estadstica) vamos a estudiar los conceptos y tcnicas
fundamentales de la estimacin de intervalos y en el apartado siguiente (teora de la
decisin estadstica), analizaremos los principios indispensables para la verificacin o prueba de
hiptesis.
H
ESTIMACIN DE PARMETROS
En el tema anterior, se revis la manera en que la teora de muestreo puede emplearse para
obtener informacin acerca de las muestras obtenidas aleatoriamente de una poblacin
conocida. Tambin observamos, cmo la desviacin estndar de la poblacin y el tamao de la
muestra, determinan la variabilidad de la distribucin muestral de la medias, ya que entre menor
sea el error estndar de la media, mejor ser nuestra estimacin. Un problema que
consideraremos en este tema, es el de la estimacin de parmetros poblacionales o
simplemente parmetros, como la media y la desviacin estndar, a partir de los estadsticos
muestrales correspondientes o tambin llamados estadsticos, como la media y la desviacin
estndar muestrales.
ESTIMADOS SIN SESGO Y EFICIENTE
Si la media de la distribucin muestral de un estadstico, es igual al parmetro poblacional
correspondiente, el estadstico se denomina estimador sin sesgo (insesgado) del parmetro;
de otra manera, es denominado estimador sesgado. La media de la distribucin muestral de
las medias es
x

, la media poblacional. Por lo tanto, la media muestral
X
es un
estimado sin sesgo de la media poblacional . Si las distribuciones muestrales de dos
estadsticos tienen la misma media, entonces el estadstico con la MENOR varianza o
desviacin estndar, se denomina estimador eficiente de la media, mientras que el otro
estadstico, se llama estimador ineficiente. Si se consideran todos los estadsticos posibles,
cuyas distribuciones muestrales tienen la misma media; aqul con la menor varianza o
desviacin estndar, suele denominarse el mejor o ms eficiente estimador de dicha media.
ESTIMACIN PUNTUAL Y ESTIMACIN POR INTERVALO
El estimado de un parmetro poblacional dado por un solo nmero, se denomina estimado
puntual del parmetro. El estimado de un parmetro poblacional dado por dos nmeros, entre
los cuales, se considera que, est el parmetro, se denomina estimado por intervalo del
parmetro. Los estimados por intervalo, indican la precisin de un estimado y son, por lo tanto,
preferibles al estimado puntual. Si se dice que una distancia es de 5.28 metros, se est dando
un estimado puntual. Si por otro lado, la distancia es de 5.28 0.03 metros, es decir, la
distancia est entre 5.25m y 5.31m, se est dando un estimado por intervalo. La informacin
sobre el error (o precisin) de un estimado, se conoce como su confiabilidad.
ESTIMACIN POR INTERVALOS DE CONFIANZA
DE PARMETROS POBLACIONALES
En este apartado nicamente vamos a analizar dos parmetros poblaciones, los intervalos de
confianza para medias y los intervalos de confianza de proporciones.
31
TEORIA DE ESTIMACIN ESTADSTICA
Matemticas aplicadas Estadstica Inferencial
Sean s y s la media y la desviacin estndar (error estndar), en ese orden, de la distribucin
muestral de un estadstico. Entonces, si la distribucin muestral es en forma aproximada a la
normal (lo cual es verdadero para muchos estadsticos, si el tamao de la muestra es N 30), se puede
esperar encontrar un estadstico muestral, real que caiga en los intervalos
s s a s + s cerca de 68.26%,
de las veces.
s 2s a s + 2s cerca de 95.44%
de las veces.
y s 3s a s + 3s cerca de99.74%
de las veces.
en probabilidad ser
Debido a lo anterior, se llaman intervalos de confianza a 68.26%, 95.44% y 99.74% de
estimacin para s. Los nmeros extremos de estos intervalos, se denominan lmites de
confianza. De forma similar, S 1.96s y S 2.58s son los lmites de confianza a 95% y 99%
(o 0.95 y 0.99) de S. El porcentaje de confianza suele denominarse nivel de confianza. Las
cifras 1.96, 2.58, etctera, en los lmites de confianza; se llaman coeficientes de confianza o
valores crticos y se denotan por zc. A partir de los niveles de confianza se pueden calcular los
coeficientes de confianza y viceversa.
En la tabla siguiente se muestran algunos de los valores crticos de zc, correspondientes a
diversos niveles de confianza. Los valores de zc, para los niveles de confianza, no incluidos en
la tabla, pueden obtenerse en la tabla reas bajo la curva normal estndar de la pgina 22.
Completa la tabla, ejemplo: 95%/2 = 47.5 / 100 = 0.475 en la tabla Zc = 1.96
Nivel de
confianz
a
99.73% 99% 98% 96% 95.45% 95% 90% 80% 68.27% 50%
zc
2.575 1.96 1.645
Si queremos un intervalo de 90% de
confianza, tenemos 1 = 0.90, y el valor
correspondiente a un rea central de 0.90
en la distribucin normal estndar es de zc
= 1.645 segn se indica en la tabla y la
figura siguiente.
Denotamos con la letra griega (alfa) a la
probabilidad con la que estamos dispuestos
a cometer error (=0.10); entonces, no
cometer el error o confiabilidad ser: 1-
(0.90), recordando que la probabilidad de un
evento ms la probabilidad de su complemento, es igual a 1; dicho de otra manera, como se
ha definido como la probabilidad de cometer el error y la probabilidad del evento
complementario a este, es la probabilidad de NO cometer error, esto es, la confiabilidad,
entonces se tiene que la suma de estos eventos complementarios es 1.
32
x

+ + 2 + 3 - - 2 - 3
Escala x
95.44%
68.26%
99.74%
/2 = 0.05
z
c
= 1.645
1- = 0.90
= 0.10
z
c
= - 1.645
/2 = 0.05
% 74 . 99 ) 3 3 (
% 44 . 95 ) 2 2 (
% 26 . 68 ) (
+
+
+



X P
X P
X P
x
x
Matemticas aplicadas Estadstica Inferencial
Resolvamos un problema para analizar y resumir lo dicho hasta el momento
INTERVALOS DE CONFIANZA
PARA MEDIAS
E
n la zona metropolitana de la ciudad de Mxico, se tom una muestra de 30 lecturas del nivel
de ozono durante cierto periodo invernal. En la tabla siguiente tenemos estas lecturas:
178 190 228 211 187 165 172 244 229 208
193 203 215 226 231 209 220 258 278 235
246 227 211 195 202 212 219 216 204 193
La media de esta muestra es = 213.5 inmecas Si sta es la nica informacin que
tenemos, podemos emplear este valor como una estimacin de la media del nivel de ozono en
la zona durante la poca invernal. Una estimacin as es llamada una estimacin puntual pues
consiste de un nico nmero o punto de la recta real. Este tipo de estimacin puntual no brinda
informacin sobre el tamao del error. Una alternativa que brinda ms informacin, consiste en
estimar la media por medio de un intervalo o aquellos nmeros reales que se encuentran entre
dos valores o lmites del intervalo.
El teorema del lmite central nos permite entonces asociar a un intervalo alrededor de nuestro
valor de = 213.5, una probabilidad o grado de certidumbre de que la media que estimamos
se encuentre efectivamente entre estos lmites.
Cuando no se tiene mayor informacin acerca de la desviacin estndar de la poblacin , y n
es grande ( n 30 ) podemos sustituir por la desviacin estndar de la muestra s. En nuestro
problema tenemos que la desviacin estndar, como se trata de una muestra, est dada por
Tambin podramos haber utilizado la frmula:
( ) ( )
2
2
( 1)
n x x
s
n n


para calcular este valor.
Una estimacin por intervalos o un intervalo de confianza consta de 3 partes (primera
ecuacin); que es el estimador; t Zc es el factor de confiabilidad y que es el error tpico
del estimador y en la segunda ecuacin incluye, el factor de correccin finita
33
2
2 2
( )
(178 213.5) ... (193 213.5)
24.87
1 29
x x
s
n

+ +

Si la poblacin es grande en relacin al tamao de la muestra (N > 20n), el tamao de la


muestra es mayor o igual que 30 y si el muestreo se lleva acabo a partir de una poblacin
infinita o de una poblacin finita con reemplazamiento, el intervalo de confianza para de
grado de confianza es :

si el muestreo se realiz sin reemplazamiento de una poblacin finita.
Donde el rea de la curva normal estndar entre 0 y Z
c
es / 2, esto es, con un grado de
confianza el error al estimar la media ( ) por es menor a
Si la poblacin es grande en relacin al tamao de la muestra (N > 20n), el tamao de la
muestra es mayor o igual que 30 y si el muestreo se lleva acabo a partir de una poblacin
infinita o de una poblacin finita con reemplazamiento, el intervalo de confianza para de
grado de confianza es :

si el muestreo se realiz sin reemplazamiento de una poblacin finita.
Donde el rea de la curva normal estndar entre 0 y Z
c
es / 2, esto es, con un grado de
confianza el error al estimar la media ( ) por es menor a
1
c
N n
X Z
N n

t

c
X Z
n

t
x
n

N
n N
x
x
Matemticas aplicadas Estadstica Inferencial
Los grados de confianza que ms emplearemos son 0.95 y 0.99 y sus correspondientes
coeficientes de confianza o valores crticos Zc que son 1.96 y 2.575, respectivamente. A estos
intervalos, tambin se les conoce, como los intervalos de confianza del 95% y 99%.
Para encontrar los intervalos de confianza al 95 % de confianza, en el caso del nivel de
contaminacin de ozono tenemos:
213.5 1.96. (4.54) = 213.5 8.90 = 204.60 y 213.5 + 1.96. (4.54) = 213.5 + 8.90 = 222.40
por lo que el intervalo de confianza del 95% es 204.60 < < 222.40 por lo tanto
Con una probabilidad de 0.95 la media poblacional se encuentra entre 204.60 y 222.4 o
bien, que con un grado de confianza del 95% el error al estimar la media como 213.5 es
menor a 8.9. Analicemos ms detenidamente esto ltimo
ERROR PROBABLE Y TAMAO DE LA MUESTRA
a expresin
.
c
Z
n

representa el error probable o mximo al estimar la media


poblacional ( ) con grado de confianza , y puede ser usada para determinar el
tamao de la muestra, cuando se desea cierto grado de precisin; esto lo analizaremos un poco
ms adelante.
L
Por lo tanto, el Error mximo del nivel de contaminacin de ozono al 95% de confianza es:
Si se aumenta el grado de confianza, aumentar el error mximo al estimar la media.
SEGUIMOS PRACTICANDO CON LOS INTERVALOS DE CONFIANZA
Si deseamos aumentar el grado de certeza al 99% Cul ser el intervalo de confianza y su
error probable?
213.5 2.575.(4.54) =213.5 11.69 = 201.81 y 213.5 + 2.575.(4.54)=213.5 + 11.69 = 225.19
El error probable o mximo al estimar la media con 99% de confianza, es de 11.69
Los intervalos de confianza a un 99% es de 201.81< < 225.19.
Observamos, que entre mayor sea la certidumbre (grado de confianza), mayor es tambin el
intervalo. Por lo tanto, podemos afirmar que con una probabilidad de 0.99, la media poblacional
se encuentra entre 201.81 y 225.19. y con un grado de confianza del 99%, el error al estimar la
media como 213.5 es menor a 11.69.
Resolvamos otro problema para comprender y aprender mejor este tema
Consideremos de nuevo el ejemplo del capitulo anterior de la regin agrcola de 200,000
hectreas, donde se siembra trigo. Se realiz una muestra de 900 hectreas, con una
productividad media de = 3.4 toneladas y donde la desviacin estndar de la
productividad del trigo, es de = 0.8 toneladas.
Obtengamos los intervalos de confianza de 90%, 95% y 99% y sus errores mximos
34
24.87
213.5 1.96.
30
c
X Z
n

t t
24.87
213.5 2.575.
30
c
X Z
n

t t
24.87
. 1.96. 1.96(4.54) 8.90
30
c
Z
n


x
x
Matemticas aplicadas Estadstica Inferencial
Como el nmero total de hectreas (200,000, N > 20n) es muy grande podemos emplear la
frmula
Para obtener el intervalo de confianza del 90%, debemos encontrar el valor de Zc (de la tabla
reas bajo la curva normal estndar de la pgina 22), que corresponde a 90/2 (dos colas)= 0.45 que es
Zc = 1.645 debido a que 0.4495 = 1.64 y 0.4505 = 1.65 la parte media ser 0.45 =1.645. Por lo
tanto, los intervalos al 90 % de confianza sern
3.4 1.645.(0.0267) = 3.4 0.0439 = 3.36 y 3.4 + 1.645. (0.0267) = 3.4 + 0.0439 = 3.44
El intervalo de confianza al 90% es 3.36 < < 3.44 y su error mximo de 0.0439
Como ya sabemos el valor de Zc = 1.96 para el nivel de confianza de 95 %, por lo tanto, sus
intervalos de confianza sern
3.4 1.96.(0.0267) = 3.4 0.0523 = 3.35 y 3.4 + 1.96. (0.0267) = 3.4 + 0.0523 = 3.45
El intervalo de confianza al 95% es 3.36 < < 3.44 y su error mximo de 0.0523
Finalmente y como ya sabemos, el valor de Zc = 2.575 para el nivel de confianza de 99 %, por lo
tanto, sus intervalos de confianza sern
3.4 2.575.(0.0267) = 3.4 0.0688 = 3.33 y 3.4 + 2.575. (0.0267) = 3.4 + 0.0688 = 3.47
El intervalo de confianza al 99% es 3.33 < < 3.47 y su error probable de 0.0688
TAMAO DE LA MUESTRA
Como se indic anteriormente, la expresin
.
c
Z
n

representa el error mximo al estimar la


media poblacional (), por con un grado de confianza y puede ser usada, para
determinar el tamao de la muestra, cuando se desea cierto grado de precisin.
Para comprender mejor, resolvamos un problema de un fabricante de llantas.
Un Fabricante de llantas, desea determinar la vida promedio de cierto tipo de llantas, con un
grado de certeza del 99% y con un error menor a 1000 Km. Por estudios previos, el fabricante
sabe, que la desviacin estndar para este tipo de llantas es de 3000 Km. Qu tan grande
debe ser la muestra?
Si E, es el error mximo o error probable, entonces
3000
. 2.575.
c
E Z
n n


y como deseamos
que E sea menor de 1000, obtenemos la ecuacin
3000
1000 2.575.
n

, que al resolver da
1000 3000
2.575 n

se despeja
(2.575)(3000)
7.725
1000
n . Para obtener el valor de n, elevamos al
cuadrado para llegar a n = 59.67, y como este nmero, no es entero debemos redondear hacia
arriba para tener n = 60 llantas.
35
c
X Z
n

t
0.8
3.4
900
c
Z t
0.8
3.4 1.96
900
t
0.8
3.4 2.575
900
t
Ahora si, vamos
a obtener el
tamao de la
muestra Animo!
x
x
Matemticas aplicadas Estadstica Inferencial
Con un 99% de certeza, el fabricante de llantas, debe obtener una muestra de 60 llantas para
tener un error menor de 1000 Km.
Tambin se puede utilizar la siguiente frmula para calcular el tamao de la muestra, para
estimar a como sigue
ltimo ejemplo para reflexionar;
Un investigador a cuyo cargo est un departamento de educacin fsica, desea hacer una
estimacin del consumo de oxgeno (en litros por minuto), de los estudiantes normales que
estn entre los 17 y los 21 aos de edad, despus de haber hecho un tipo especial de ejercicio.
El investigador, desea que su estimacin se encuentre por lo menos a 0.10 litros de la media
verdadera, con una confianza del 95%. Los estudios que se han hecho, indican que la varianza
del consumo de oxgeno de este tipo de sujetos, bajo las condiciones especificadas, es
aproximadamente igual a 0.09 litros por minuto cuadrado.
Qu tamao debe tener la muestra que necesita este investigador?
Con base en la informacin dada, tenemos que E = 0.10, z = 1.96 y = =0.30.
La sustitucin de estos valores se efectan en la siguiente ecuacin:
57 . 34
10 . 0
) 3 . 0 )( 96 . 1 (
2

1
]
1

n Como el tamao de la muestra tiene que ser un entero, el


investigador necesitar tomar una muestra de tamao 35, para lograr la confianza y la amplitud
de intervalo deseadas.
Es importante sealar lo siguiente en este tema:
Si hay que sacar la muestra de una poblacin finita, puede resultar conveniente incorporar el
factor de correccin poblacional finita (cpf), a la frmula para n, en este caso la frmula se
transforma en
) 1 (
2 2 2
2 2
+

N E z
Nz
n

A CONTINUACIN, RESUELVE LAS SIGUIENTES


ACTIVIDADES DE APRENDIZAJE, PARA QUE REAFIRMES
LO APRENDIDO, HASTA EL MOMENTO
ACTIVIDADES DE APRENDIZAJE.
A un lado de sta hoja, resuelve adecuadamente los siguientes problemas.
1) Un centro de verificacin vehicular, efecta una muestra aleatoria de 50 vehculos para
estimar el tiempo promedio, que se requiere para efectuar la prueba obteniendo una media
36
2
/ 2
( ) Z
n
E

1
]
[ ]
2 2
2 2.575(3000) 7725
7.725 59.67
1000 1000
n
1 1

1 1
] ]
2
/ 2
( ) Z
n
E

1
]
Aceboman, yo
tambin le echar
muchas ganas
he
p
x
x
Matemticas aplicadas Estadstica Inferencial
de 7.2 minutos y una desviacin estndar s = 0.8 minutos. Determina los intervalos de
confianza de la media del 95% y del 99%, as como los errores mximos de estos grados
de confianza.
Al 95%: Al 99%:
2) Se desea estimar las horas que un amplificador de msica puede ser usado antes de
necesitar alguna reparacin. Si por estudios previos se sabe que = 500 horas, Qu tan
grande debe ser el tamao de la muestra, si necesitamos tener un grado de confianza del
95% y un error de 100 horas?
RESPUESTAS CORRECTA: ______________
3) Una compaa de reparto de paquetera, efecta una muestra tamao n = 60 del nmero de
paquetes que entrega por da una camioneta. Si se obtuvo una media de = 26.8 paquetes
y una desviacin estndar de s = 1.4 paquetes, construye los intervalos de confianza del
90% y del 95%, para el promedio de paquetes que entrega una camioneta.
Al 95%: Al 90%:
4) Una compaa de seguros efecta una muestra de tamao n = 80 reclamaciones
hospitalarias, obteniendo un periodo promedio de hospitalizacin de 4.5 das y una desviacin
estndar de 0.81 das. Si = 4.5 das se emplea como la estimacin del periodo promedio
de hospitalizacin de sus asegurados
a) Cul es el error mximo en esta estimacin, si se desea tener un grado de confianza
del 95% y cul es el correspondiente intervalo de confianza?
RESPUESTAS CORRECTA: ________________
5) Cul es el error mximo en esta estimacin, si se desea tener un grado de confianza
del 99% y cul es el correspondiente intervalo de confianza?
RESPUESTAS CORRECTA: ___________________
37
x
x
Matemticas aplicadas Estadstica Inferencial
6) Una empresa publicitaria, desea investigar el tiempo promedio semanal que las amas de
casa, de cierta regin dedican a ver telenovelas. Si saben que es razonable tomar =2.8 horas
para estos estudios. Qu tan grande debe ser la muestra, si desean tener un grado de
confianza del 99% y un error mximo de media hora?
RESPUESTAS CORRECTA: ____________________
7) El dimetro promedio de una muestra aleatoria de 40 balines, fue de = 0.998 pulgadas
y su desviacin estndar fue s = 0.002 pulgadas. Cul es el mximo error al estimar el
dimetro promedio del lote de balines en 0.998 pulgadas, si deseamos tener un grado de
confianza del 95%?
RESPUESTAS CORRECTA: _____________________
8) Unos diseadores industriales, desean determinar el tiempo promedio que un adulto requiere
para ensamblar un juguete fcil de ensamblar, para lo cual obtuvieron una muestra de n = 36
= 19.9 y s = 5.73 Encuentre un intervalo de confianza del 95% para el tiempo
promedio que un adulto, requiere ensamblar dicho juguete?.
RESPUESTAS CORRECTA: _____________________
9) Un profesor, quiere calcular el tamao de la muestra del tiempo promedio que los estudiantes
necesitan para pasar de una clase a otra, y quiere afirmar con una probabilidad de 0.95, que su
error ser a lo sumo de 0.25 minutos.Cul es el tamao de la muestra que necesita, si sabe
que en estudios similares = 1.50 minutos?
RESPUESTAS CORRECTA: _____________________
INTERVALOS DE CONFIANZA
HPARA PROPORCIONES
asta aqu hemos analizado, que a partir de la informacin contenida en una muestra aleatoria y
con una confiabilidad preestablecida (1 ), podemos determinar los extremos de un intervalo
de confianza para parmetros de inters, como la media poblacional ( ) . Ya se ha comentado
que el valor de los parmetros poblacionales en general se desconocen, por lo que, podemos
38
p
Matemticas aplicadas Estadstica Inferencial
hacer una estimacin puntual de P, por medio de la proporcin p con la que ocurre la
categora bajo estudio, en una muestra aleatoria de la poblacin. Cabe sealar, que la
probabilidad de ocurrencia (llamado xito) de un evento es p, mientras que la probabilidad de la
NO ocurrencia (llamado fracaso) del evento es q = 1 p
El teorema central del lmite para variables categricas, nos dice que una variable categrica,
cuyas categoras ocurren con una proporcin P en la poblacin correspondiente. Si se extraen
de la poblacin muestras aleatorias de tamao n, entonces:
1) Los valores p calculados en cada una de las muestras, se distribuyen en forma
normal si el valor de n es grande.
2) El promedio poblacional de los valores p, al que llamaremos p, es igual a la
proporcin poblacional P: p = p
3) La desviacin estndar poblacional de los valores p , a la que llamaremos p, es tal
que:
( ) 1
p
P p
n

Lo que dice el teorema anterior, es que si llamamos distribucin muestral de p a la


distribucin de los valores de p, calculados en las muestras de tamao n extradas de una
misma poblacin, entonces esta distribucin muestral de p, es aproximadamente normal. La
media de esta distribucin es P, la proporcin poblacional y su desviacin estndar es igual a
( ) 1
p
P p
n

. Este valor recibe el nombre de error estndar de la proporcin estimada


p.
Recordemos que en el caso de la distribucin muestral de medias, se mencion que el teorema
central del lmite se puede considerar vlido si n 30. En este caso, consideraremos que si el
tamao de la muestra, n, es tal que np > 5 y n (1 p) > 5, entonces la distribucin muestral de
p es prcticamente normal. Es decir, podremos considerar que n es grande si np > 5 .
El teorema anterior, nos permitir encontrar el intervalo de confianza para P con una
confiabilidad predeterminada (1 - ) y siguiendo un proceso similar al establecido en el tema
anterior, cuando se encontr el intervalo de confianza para con conocida o estimada por s.
ahora tenemos
Si n/N 0.05 el coeficiente de poblacin finita (cpf) no se usa.
Si n/N > 0.05 el coeficiente de poblacin finita (cpf) si se usa.
Resolvamos el primer problema para comprender y aprender mejor este tema
39
Si P, es la proporcin en la que ocurre una categora de una variable categrica en una poblacin, y si
se extrae de sta una muestra de tamao n en la que la categora ocurre con proporcin p, entonces
un intervalo de (1 ) 100% de confianza para P, si np > 5 y n(1- p) es > 5 y si el muestreo se efectu
de una poblacin infinita o una finita con reemplazamiento es:

si el muestreo se realiz sin reemplazamiento de una poblacin finita.


Donde Z
c
es el valor de la distribucin normal estndar que corresponde a 1 en rea central o a
en dos colas.
Si P, es la proporcin en la que ocurre una categora de una variable categrica en una poblacin, y si
se extrae de sta una muestra de tamao n en la que la categora ocurre con proporcin p, entonces
un intervalo de (1 ) 100% de confianza para P, si np > 5 y n(1- p) es > 5 y si el muestreo se efectu
de una poblacin infinita o una finita con reemplazamiento es:

si el muestreo se realiz sin reemplazamiento de una poblacin finita.


Donde Z
c
es el valor de la distribucin normal estndar que corresponde a 1 en rea central o a
en dos colas.
'(1 ')
'
1
c
p p Np n
p Z
n Np

t

'(1 ')
'
c
p p
p Z
n

t
Matemticas aplicadas Estadstica Inferencial
En una agrupacin de profesionista con 10 000 miembros, se ha tomado una muestra aleatoria
de 392 miembros. A la pregunta Los problemas gremiales que no le conciernen
directamente, son de inters para usted?, 97 miembros dieron respuestas: no, para nada o
bien no se. Estimar con 95% de confianza, la proporcin de los miembros que hubiesen dado
respuestas semejantes, si se hubiera tomado un censo completo, preguntando a todos los
miembros de la agrupacin.
Primer paso: se procede a realizar la prueba np > 5 y n (1- p ) > 5
n = 392 p = 97/ 392 = 0.2474
np = (392) (0.2474) = 96.8 y n ( 1 - p ) = (392) (0.7526) = 295.2 Por lo tanto
Como ambos np y n ( 1 - p ) son mayores que 5, podemos continuar con la prueba.
Segunda prueba: la relacin n/N, para saber si se utiliza el coeficiente de poblacin finita (cpf)
392 / 10,000 = 0.0392 < 0,05 por lo tanto no se usa el cpf
Como se requiere una confiabilidad de 95% Zc = 1.96, y por lo tanto tenemos:
(0.2474)(0.7526)
0.2474 1.96 0.2474 0.0427 0.2047
392

(0.2474)(0.7526)
0.2476 1.96 0.2476 0.0427 0.2903
392
+ +
El intervalo de confianza al 95% es 0.2047 p 0.2903 o tambin < 0.2047, 0.2903 >
Entonces podemos afirmar con 95% de confianza, que la proporcin de miembros de la
agrupacin gremial que contestarn no, para nada o no se a la pregunta planteada, est
entre 0.2047 y 0.2903. En otros trminos, podemos decir, con una confianza de 95%, que el
porcentaje de miembros del gremio a quienes no les interesan los problemas, que no les
conciernen directamente est entre 20.47% y 29.03 %.
Analicemos otro problema para confirmar lo aprendido
En un estudio sobre las razones que dan los alumnos suspendidos en el CBTA; un profesor
tom una muestra de 200 estudiantes en una poblacin de 1500 que haban sido suspendidos.
De los 200 estudiantes suspendidos que fueron entrevistados, 140 dijeron que haban fallado
debido a dificultades econmicas en su familia. El profesor quera construir una estimacin del
intervalo de confianza del 95%, para la verdadera proporcin de jvenes que haban fallado por
esta razn.
Primer paso: se procede a realizar la prueba np > 5 y n (1- p ) > 5
n = 200 p = 140/ 200 = 0.70 Por lo tanto
np = (200) (0.70) = 140 y n ( 1 - p ) = (200) (0.30) = 60
Como ambos np y n ( 1 - p ) son mayores que 5, podemos continuar con la prueba.
Segunda prueba: la relacin n/N, para saber si se utiliza el coeficiente de poblacin finita (cpf)
200/ 1,500 = 0.1333 > 0,05 por lo tanto si se usa el cpf
Si sustituimos los valores en la frmula, tendremos:
06 . 0 70 . 0 ) 9312 . 0 )( 0324 . 0 ( 96 , 1 70 . 0
1499
200 1500
200
) 30 . 0 )( 70 . 0 (
96 . 1 70 . 0 t t

t
Finalmente tenemos que 0.70 + 0.06 = 0.76 y 0.70 0.06 = 0.64
40
p
'(1 ')
'
1
c
p p Np n
p Z
n Np

t

'(1 ')
'
c
p p
p Z
n

t
Matemticas aplicadas Estadstica Inferencial
El intervalo de confianza al 95% es 0.76 p 0.64 o tambin < 0.76, 0.64 >
Tenemos el 95% de confianza de que este intervalo contenga a p, puesto que, en un muestreo
repetido, aproximadamente el 95% de los intervalos construidos en esta forma a partir de todas
las muestras de tamao 200 que se pueden hacer en la poblacin de 1500 suspendidos,
incluira a p.
ACTIVIDADES DE APRENDIZAJE.
En tu cuaderno de estadstica, resuelve adecuadamente los siguientes problemas.
Recuerda, antes de calcular el intervalo, debes verificar que el tamao de la
muestra sea lo suficientemente grande, es decir, que np>5 y n(1-P) >5
y n/N, para saber si se va utilizar el factor (cpf).
1. Un profesor se interesa por saber qu proporcin P de alumnos de la escuela donde trabaja,
participan en actividades culturales. Para ello, elige aleatoriamente a 50 estudiantes y
encuentra que 37 de ellos participan en actividades culturales. Calcule un intervalo de 95% de
confianza para P. Interpreta el resultado.
2. En una muestra aleatoria, 136 de 400 personas a quienes se les administr una vacuna
contra la gripe, experimentaron alguna molestia. La poblacin total de pacientes es de 5500.
Elabore un intervalo de confianza del 95% para la proporcin real de personas, que
experimentarn esta molestia como resultado de la vacuna.
Interpreta el resultado.
3. Una muestra aleatoria de 200 delincuentes juveniles, sacada de 3000 internos de una
escuela correccional, revel que para 40 de ellos, el delito por el cual haban sido detenidos era
el de robo de automviles. Construir un intervalo de confianza de 90 %, para la proporcin
poblacional de los que haban sido detenidos por robos de automviles. Interpreta el resultado
4. De una poblacin de 1540 personas, se obtuvo una muestra aleatoria de 140 supuestos
contactos con OVNIS, 119 se podran explicar fcilmente en trminos de fenmenos naturales.
Elabore un intervalo de confianza del 99% para la probabilidad de que un supuesto contacto
con un OVNI, se puede explicar fcilmente en trminos de fenmenos naturales. Interpreta el
resultado
5. Entre 180 pescados de un lago grande, 24 no eran comestibles como resultado de la
contaminacin. a) Elabore un intervalo de confianza del 99% para la proporcin real
correspondiente. B) Qu podemos decir, con una confianza del 99% acerca del error mximo
si usamos la proporcin de la muestra, como una estimacin de la proporcin de la poblacin?
Interpreta el resultado
41
p
Matemticas aplicadas Estadstica Inferencial
6. En un anuncio publicitario se afirma que 8 de cada 10 mdicos utilizan cierto producto.
Supongamos que un estudiante desconfiado elige aleatoriamente a 100 mdicos y encuentra
que 30 de ellos utiliza o recomienda el citado producto. Encuentre un intervalo de 99% de
confianza para la proporcin de mdicos que utilizan o recomiendan el producto. Interpreta el
resultado. Cree usted que sea muy probable que lo que afirma en el anuncio sea correcto?
7. En una encuesta aplicada a 16 nios seleccionados aleatoriamente en una ciudad, se
encontr que el 25% de los nios no tenan una alimentacin adecuada. Calcule un intervalo de
95% de confianza para la proporcin de nios de toda la ciudad que no reciben alimentacin
adecuada. Interpreta el resultado
8. En todo el CBTA-XALISCO existen 850 alumnos, se est planteando la construccin de
espacios para practicar deporte y se detect que, de 48 alumnos elegidos al azar, 33 preferan
el bsquetbol. Con un 95% de confianza calcula un intervalo de confianza para estimar la
proporcin de alumnos de toda la escuela, que prefieren el bsquetbol. Interpreta el resultado
9. En el mismo CBTA se desea estimar la proporcin de jvenes, cuyos padres asisten
regularmente a las juntas de padres de familia citados por la escuela. Para ello, se toma una
muestra aleatoria de 130 alumnos de la escuela y se encuentra que los padres de 44 de ellos
asisten regularmente a juntas de padres de familia. Encuentre un intervalo de 90% de confianza
para la proporcin poblacional. Interpreta el resultado
SECUENCIA DIDCTICA: Probando la hiptesis
Autor: Alejandro Acebo Gutirrez
Contenido temtico Teora de decisin estadstica
42
Matemticas aplicadas Estadstica Inferencial
Propsito del contenido temtico:
Reflexionar y ejecutar las decisiones estadsticas, sobre poblaciones
con base en la informacin de muestras, para poner a prueba las
hiptesis planteadas.
Conceptos fundamentales: Prueba de hiptesis sobre una media y una proporcin poblacional
Conceptos subsidiarios:
Decisiones estadsticas, Hiptesis estadsticas, Estrategia de prueba,
Dos tipos de errores, Esquema general de la prueba de hiptesis,
prueba de hiptesis para una media y de una proporcin poblacional.
Tema integrador La Salud
Nmero de sesiones 3 (semanas ) con alto porcentaje de estudio independiente
Valores y actitudes Persistencia, responsabilidad, Solidaridad, y Libertad.
Categoras Diversidad y espacio.
BLOQUE: ACTIVIDADES DE APERTURA Observaciones
Para contextualizar la presente secuencia didctica, se sugiere reflexionar sobre los
avances tecnolgicos en la salud humana; especficamente, en la importancia de la
estadstica inferencial en la longevidad de la vida humana. Algunas preguntas podran
ser; Por qu el promedio de vida es ms largo hoy, que en siglos pasados? Cmo ha
influido la estadstica inferencial, en ste importante fenmeno?
A continuacin se presenta un problema.
Un fabricante de una medicina, dice que el tiempo promedio para que se disuelva el
contenido de cierta cpsula es de 50 minutos; el equipo de investigadores de una empresa
de la competencia NO cree en esto. Por eso, hace una prueba con una muestra al azar de
20 cpsulas y calcula una media muestral de 54 minutos y desviacin estndar de 15. El
equipo de investigadores puede concluir, que el tiempo promedio que se requiere para que
se disuelva el contenido, es mayor que 50 minutos?
Plantea, desarrolla y verifica la prueba de hiptesis con un 95% de confianza.
Proyectar videos,
audio, o
presentaciones
estadsticas
Integrarse en
equipos de 3
estudiantes para su
anlisis.
BLOQUE: ACTIVIDADES DE DESARROLLO
1.- Integrado en equipos de 3 estudiantes, realizar una lectura comentada y analtica de
los contenidos de la presente gua didctica, correspondientes a los temas:
Decisiones estadsticas, hiptesis estadsticas, estrategia de prueba, errores que se
cometen y el esquema general de la prueba de hiptesis.
2. Reflexionar y discutir los ejemplos del apartado referente a las pruebas de hiptesis
sobre una media poblacional de sta gua.
3. Consultar de manera personal, otras fuentes de informacin a tu alcance, para
enriquecer los conocimientos de los temas antes mencionados. Mnimo dos citas.
4.- Integrado en equipos, desarrollar las estrategias para la solucin de las preguntas
antes sealadas.
5. Realicen esquemas, lminas, o presentaciones para su exposicin grupal en el aula.
Consultar la
presente gua
didctica y otras
bibliografas, para
argumentar la
solucin.
BLOQUE: ACTIVIDADES DE CIERRE
El facilitador propiciar la exposicin libre de las emociones, y sentimientos
generados durante el desarrollo del tema.
En reunin plenaria, expondrn ya sea con rotafolio, lminas, o presentaciones
PowerPoint; las vas de solucin que hallan encontrado a dichos preguntas.
En la plenaria, encontraras la solucin ms idnea entre todo el grupo.
De manera respetuosa podrs solicitar a todo el grupo, te disipen algunas dudas
que tengas respecto al tema y a la solucin del problema en general.
El cierre se har en
dos fases
1ra. Sobre las
relaciones humanas
2da. Sobre el
problema
estadstico
TEMA -----------------
43
TEORIA DE DECISIN ESTADSTICA
Matemticas aplicadas Estadstica Inferencial
EDECISIONES ESTADSTICAS
n la prctica, con frecuencia se est obligado a tomar decisiones sobre poblaciones con base
en la informacin de muestras. stas se denominan decisiones estadsticas. Por ejemplo,
quizs se quiera decidir, apoyado en datos muestrales, si un procedimiento educativo es mejor
que otro; si un nuevo suero es realmente efectivo para curar una enfermedad; si un material
didctico (libro o apuntes) es mejor que otro; si un fertilizante es mejor que la materia orgnica,
para el desarrollo de algunas plantas, etctera.
En el tema anterior, estudiamos los conceptos y las tcnicas de la estimacin por intervalos de
una media y de una proporcin poblacional; esto ha servido para empezar a familiarizarse con
la inferencia estadstica, que consiste en ver si se puede considerar, a travs de la informacin
contenida en una muestra representativa de la poblacin bajo estudio, como verdadera una
conjetura planteada acerca de la poblacin. En el presente tema, vamos a analizar otro
problema tpico de la inferencia estadstica: LA PRUEBA DE HIPOTESIS.
Los mtodos estadsticos que permiten poner a prueba una hiptesis; conforman una
importante rama de la estadstica; dichos mtodos siguen una estrategia general; nosotros
abordaremos el camino que sigue del planteamiento de una hiptesis de investigacin hasta su
manejo estadstico, comentaremos los tipos de errores que se pueden cometer, as como los
conceptos y la estrategia bsica para la prueba de hiptesis.
Con el propsito de abordar de manera diferente ste tema, y esperando que sea ameno y
sobre todo, ms lgica su comprensin, abordaremos con un ejemplo sencillo, los distintos
subtemas en donde iremos realizando actividades de aprendizaje y cuando sea
conveniente, generalizaremos el concepto que estemos analizando (hiptesis estadsticas,
estrategia de prueba, dos tipos de errores, regla de decisin, esquema general de la prueba de hiptesis),
para despus, regresar nuevamente a nuestro ejemplo.
En el estado de Nayarit, un grupo de profesores realizan una investigacin acerca del
aprendizaje de las matemticas, en las escuelas secundarias. Uno de los objetivos de la
investigacin es comparar el nivel de conocimientos, que tienen los jvenes de las zonas
rurales, con el que tienen, los de las zonas urbanas del estado. Para
ello, disean un examen de conocimientos en matemticas, cuyas
caractersticas permiten considerar, que la calificacin que obtenga
cada joven, es un indicador de su nivel, as como que las
calificaciones se distribuyen normalmente. Este examen es aplicado a
todos los jvenes que asisten a las escuelas secundarias de las
zonas urbanas del estado, y se encuentra
que el promedio de calificaciones es de 7.5.
Los profesores sospechan que los jvenes de las
zonas rurales tienen un nivel de conocimientos en
matemticas diferentes del de los de zonas urbanas,
por lo que plantean que, de aplicarse el examen en
zonas rurales, se obtendra un promedio de
calificaciones, distinto de 7.5. Sin embargo, las zonas rurales del estado de Nayarit, son de
difcil acceso, por lo que resulta imprctico aplicar el examen en todas las escuelas de dichas
zonas. Por ello, los profesores deciden trabajar con una muestra representativa de 30 jvenes
de las zonas rurales, dicha muestra es elegida con base en tcnicas de muestreo que ya
analizamos en el primer tema, por lo que el promedio de las calificaciones obtenidas por los 30
44
x
Matemticas aplicadas Estadstica Inferencial
jvenes, ser un estimador del promedio de las calificaciones de todos los jvenes de las zonas
rurales, del estado de Nayarit.
Hagamos un breve anlisis de algunos elementos de este problema. La variable con la que
trabajaremos es la calificacin, obtenida en el examen de matemticas y la denotamos con x.
La poblacin que nos interesa es la coleccin de las calificaciones que obtendran en los
exmenes, todos los jvenes de las zonas rurales del estado y la caracterstica que nos
interesa es el promedio de estas calificaciones; es decir, el valor del parmetro . El valor de
es desconocido, pero podemos estimarlo puntualmente, mediante la media de las calificaciones
obtenidas por los 30 jvenes.
SUPONGAMOS que esta media muestral es de 7.86, es decir = 7.86
Se podra afirmar que, como
x
7.5, el promedio de calificaciones en zonas rurales difiere del
de zonas urbanas? SI_________ o NO __________
Claro que no! Recuerde que la media ( ), vara de muestra a muestra, por ello, no es
evidente que a partir del valor de obtenido en una muestra, podamos inferir que el promedio
poblacional, , difiere del promedio de calificaciones en zonas rurales.
HIPTESIS ESTADSTICAS
a palabra hiptesis se define como: (1) Una afirmacin que est sujeta a verificacin o
comprobacin. (2) Una suposicin que se utiliza como base para una accin. (3) Una
conjetura que se hace sobre algo, para sacar una conclusin. El punto clave de estas
definiciones est, en que una hiptesis es una afirmacin o suposicin y no un hecho
establecido.
L
Al intentar tomar una decisin, es til hacer suposiciones o conjeturas acerca de las
poblaciones implicadas. Dichas suposiciones, que pueden o no ser verdaderas, se
denominan hiptesis estadsticas. En general las hiptesis, son afirmaciones acerca de las
distribuciones de probabilidad de las poblaciones.
Podemos expresar, en trminos estadsticos la conjetura del grupo de profesores de nuestro
ejemplo como sigue: El promedio poblacional , de las calificaciones que obtendran en el
examen de matemticas los jvenes de las zonas rurales del estado de Nayarit, difieren del
promedio poblacional de las calificaciones, obtenidas por los jvenes de las zonas urbanas
Denotemos con u (mu u de urbana) al promedio de las zonas urbanas, entonces sabemos, u =
7.5 y la conjetura de los profesores se puede expresar:
7.5 o bien u
En adelante nos referimos a la conjetura de los profesores como hiptesis de investigacin y la
expresamos como sigue:
Hinv : 7.5 o bien Hinv : u
(Prueba Bilateral por corresponder a ambos lados de la media o en ambas colas de la distribucin, 2
colas)
Es importante sealar que los profesores de nuestro ejemplo, podran haberse planteado
alguna de las siguientes hiptesis:
45
Pero con calma primero analicemos
los diferentes tipos de hiptesis, Sale?
x
x
Matemticas aplicadas Estadstica Inferencial
El nivel promedio de conocimientos en matemticas, de los jvenes de las zonas
rurales es mayor que el de los jvenes de las zonas urbanas. En este caso se
conjetura que > u y la hiptesis de investigacin es Hinv : > u.
(Prueba Unilateral, una cola de la distribucin)
El nivel promedio de conocimientos en matemticas de los jvenes de las zonas
rurales es menor que el de los jvenes de las zonas urbanas. En este caso se
conjetura que < u y la hiptesis de investigacin es Hinv : < u .
(Prueba Unilateral, una cola de la distribucin)
El nivel promedio de conocimientos en matemticas de los jvenes de las zonas
rurales no difiere al de los jvenes de las zonas urbanas. Hinv : = u
(Prueba Bilateral o de 2 colas)
Nosotros nos limitaremos a estudiar los casos en los que las hiptesis de investigacin plantea
la existencia de alguna diferencia, como en las tres posibilidades sealadas en nuestro ejemplo:
Hinv : u , Hinv : > u , Hinv : < u .
Como se indic anteriormente, al tomar una decisin, es til hacer suposiciones o conjeturas
acerca de las poblaciones implicadas. Dichas suposiciones, pueden o no ser verdaderas, a
stas se les denominan hiptesis estadsticas. Esto nos conduce a considerar DOS
POSIBILIDADES; una coincide con la hiptesis de investigacin y la otra la contradice.
La hiptesis que contradice a la hiptesis de investigacin se llama
HIPTESIS NULA y se denota H0

La hiptesis que coincide con la hiptesis de investigacin se llama


HIPTESIS ALTERNATIVA y se denota H1

Ahondaremos ms en este aspecto, para ver cmo se generan las hiptesis estadsticas. Para
ello, consideremos las distintas modalidades que, segn se mencion anteriormente, puede
adoptar la hiptesis de investigacin.
CASO 1. En nuestro ejemplo se postul:
Hinv : 7.5 o bien (Hinv : u ).
La hiptesis nula, que niega a la hiptesis de investigacin, es:
H0: = 7.5 o bien (H0: = u)
Y la hiptesis alternativa, que afirma lo mismo que la de investigacin, es:
H1: 7.5 o bien (H1: u).
(Prueba Bilateral o de 2 colas)
CASO 2. Si se hubiera postulado que el nivel de conocimientos en promedio de matemticas
es ms alto en las zonas rurales que en las urbanas, se tendra:
Hinv : > 7.5 o bien (Hinv : > u ).
Como la hiptesis nula contradice a la de investigacin, sera de la siguiente manera:
H0: 7.5 o bien (H0: u ).
La hiptesis alternativa sera:
46
Ja,ja,ja
Que fcil!
aceboman
Matemticas aplicadas Estadstica Inferencial
H1: > 7.5 o bien (H1: > u ).
(Prueba Unilateral o de 1 colas)
CASO 3. Si se hubiera postulado que el nivel de conocimientos en promedio de matemticas
es ms bajo en zonas rurales que en las urbanas, se tendra:
Hinv: < 7.5 o bien (Hinv: < u).
La hiptesis nula tendra la forma:
H0: 7.5 o bien (H0: u).
La hiptesis alternativa sera:
H1: < 7.5 o bien (H1: < u).
(Prueba Unilateral o de 1 colas)
La siguiente tabla, resume la relacin de smbolos que aparecen en las hiptesis en los tres
casos considerados:
En la hiptesis de
investigacin
(Hinv) aparece el smbolo
En la hiptesis Nula
(H0) aparece el
smbolo
En al hiptesis
alternativa (H1)
aparece el smbolo
La prueba se
llama
Caso 1
=
Bilateral o de
dos colas
Caso 2
> >
Unilateral o de
una cola
Caso 3
< <
Unilateral o de
una cola
Gracias aceboman HURRA
ES MOMENTO DE RESOLVER LAS SIGUIENTES, ACTIVIDADES DE APRENDIZAJE
PARA QUE REAFIRMES LO APRENDIDO HASTA EL MOMENTO
ACTIVIDADES DE APRENDIZAJE:
47
Educacin humana y de
calidad
SAETA
Matemticas aplicadas Estadstica Inferencial
1. Establezca las hiptesis nula (H0) y las hiptesis alternativa (H1) en cada uno de los
siguientes casos:
a) Hinv: > 0 H0 : _______________ H1 :______________
b) Hinv: 9.43 H0 : _______________ H1 :______________
c) Hinv: < -3.28 H0 : _______________ H1 :______________
d) Hinv: -10.11< 0 H0 : _______________ H1 :______________
e) Hinv: + 4.01 > 0 H0 : _______________ H1 :______________
Si se est trabajando con una variable categrica y el parmetro de la poblacin, que nos
interesa, es la proporcin poblacional P, con la que ocurre cierta categora, se puede hacer una
hiptesis de investigacin sobre P. En seguida te damos una lista de hiptesis de investigacin
Hinv. Establezca la hiptesis nula H0 y la hiptesis alternativa H1 en cada uno de los casos:
a) Hinv: p .37 H0 : _______________ H1 :______________
b) Hinv: p < .5 H0 : _______________ H1 :______________
c) Hinv: p - .48 0 H0 : _______________ H1 :______________
d) Hinv: p - .93 > 0 H0 : _______________ H1 :______________
ESTRATEGIA DE PRUEBA
48
x
x
x
Matemticas aplicadas Estadstica Inferencial
R
egresemos a nuestro ejemplo
La hiptesis de investigacin Hinv: 7.5 gener la pareja siguiente de hiptesis estadsticas
Hiptesis nula H0: = 7.5 y la Hiptesis alternativa H1: 7.5
Con estas hiptesis, nos estamos haciendo preguntas acerca del parmetro ,. Estas preguntas
pueden ser:
Hiptesis nula H0: Podemos considerar que es igual al promedio (u = 7.5) obtenido en
zonas urbanas?
Hiptesis alternativa H1: Podemos considerar que es distinto de u?
Como no conocemos el valor de , la respuesta a estas preguntas se obtendr de una
inferencia a partir del valor del estimador de , que es . Para esto, le daremos a priori,
mayor credibilidad a la hiptesis nula que a la hiptesis alternativa, es decir, seremos
estrictos con nuestra hiptesis de investigacin: para que la aceptemos, NO bastar que la
informacin de la muestra, proporcione evidencia a su favor, sino que exigiremos tambin que
dicha informacin, proporcione evidencia en contra de la hiptesis nula H0, que es su negacin.
Para ello, consideraremos provisionalmente que la hiptesis nula es verdadera y luego,
veremos si la informacin contenida en la muestra, contradice este supuesto o no.
a) Si lo contradice , nuestra conclusin estadstica, ser rechazar la hiptesis nula, con
lo que podremos considerar, que la hiptesis de investigacin, es verdadera.
b) Si no lo contradice , la conclusin ser no rechazar la hiptesis nula, por lo que no
podremos considerar, que la hiptesis de investigacin, sea verdadera.
Recordemos que el estimador de la media poblacional (), la media muestral de las 30
calificaciones es = 7.86, por lo tanto
Si esta media muestral difiere MUCHO de 7.5, podemos considerar que es distinto de 7.5 y
la informacin contenida en la muestra contradice, en este caso, a la hiptesis nula.
Si la media muestral difiere POCO de 7.5, estaremos inclinados a pensar que es igual a 7.5
por lo que la informacin contenida en la muestra no contradice, en este caso, a la hiptesis
nula. Pero
Qu tanto es MUCHO y qu tanto es POCO?. Necesitamos un criterio que nos
aclare estos trminos y que nos indique si la diferencia u= 7.86 7.5 = 0.36 puede ser
considerada GRANDE o PEQUEA.
Este criterio, que veremos ms adelante, recibe el nombre de regla de decisin y es el que nos
permite llegar a la conclusin de rechazar o no la hiptesis nula.
DOS TIPOS DE ERRORES
1) Si la media muestral difiere MUCHO de 7.5, la conclusin estadstica ser rechazar H0.
Ahora bien, en realidad puede ocurrir una de dos situaciones:
a) H0 es verdadera:en este caso estaremos cometiendo un error, al rechazar una
hiptesis nula, que es verdadera;
b) H0 es falsa: en cuyo caso nuestra conclusin ser acertada.
2) Si la media muestral difiere POCO de 7.5, la conclusin ser no rechazar H0. Ahora bien,
tambin aqu puede ocurrir en realidad, una de las dos situaciones mencionadas.
49
Matemticas aplicadas Estadstica Inferencial
a) H0 es verdadera: en este caso nuestra conclusin ser acertada
b) H0 es falsa: en este caso estaremos cometiendo un error, al no rechazar una
hiptesis nula, que es falsa.
Es decir, en cada posibilidad de conclusin estadstica podemos estar cometiendo un error.
Estos errores reciben los siguientes nombres:
1) El error que cometemos en caso de rechazar una hiptesis nula, que es
verdadera se llama ERROR TIPO I
2) El error que cometemos en caso de no rechazar una hiptesis nula, que es
falsa se llama ERROR TIPO II.
En la siguiente tabla se resume lo anteriormente sealado:
Antes de seguir adelante, veamos en qu consiste cada uno de estos dos errores, en los
trminos de nuestro ejemplo inicial. Hinv: 7.5 H0: = 7.5 H1: 7.5
Como vimos anteriormente, la estrategia de prueba ser considerar como verdadera, la
hiptesis de investigacin Hinv,, slo si podemos rechazar la hiptesis nula H0. Entonces:
1) El error tipo I consiste en rechazar la hiptesis H0: =7.5 cuando en realidad es
verdadera. Dicho en otras palabras, si en nuestro problema se cometiera el error de tipo I, esto
equivaldra a considerar que el nivel en matemticas, que tienen los jvenes de las zonas
rurales del estado de Nayarit, difiere del que tienen los de las zonas urbanas del estado, cuando
en realidad, no difieren.
2) El error tipo II consiste en no rechazar la hiptesis H0: =7.5 cuando en realidad es
falsa. O sea, si en nuestro problema se cometiera el error tipo II, esto equivaldra a no
considerar que el nivel en matemticas, que tienen los jvenes de las zonas rurales, del estado
de Nayarit, difiera del que tienen los de las zonas urbanas, cuando en realidad, si difieren.
SITUACIN REAL
( desconocida)
H0 es verdadera H0 es falsa
S
I
T
U
A
C
I

N

E
S
T
A
D

S
T
I
C
A
Se rechaza
H0
Se comete el
error tipo I con una
probabilidad
No se comete
Error La probabilidad de
que esto ocurra es 1 -
NO se rechaza
H0
No se comete
Error. La probabilidad de
que esto ocurra es 1 -
Se comete el
error tipo II con una
probabilidad
50
Matemticas aplicadas Estadstica Inferencial
La probabilidad de cometer el error de tipo I, lo llamaremos P(EI) y la probabilidad de cometer el
error tipo II, lo llamaremos, P(EII). Ahora, si deseamos tener el mnimo riesgo posible de
cometer error, en caso de que consideremos la hiptesis de investigacin como verdadera,
entonces, lo que queremos es tener el mnimo riesgo posible de cometer el error tipo I, por lo
tanto, deseamos que P(EI) sea un nmero pequeo.
Los valores de P(EI) que se usan ms comnmente son: 0.10, 0.05, 0.01. Al decidir qu
probabilidad de cometer el error tipo I permitimos; estamos diciendo qu confianza queremos
tener, en caso de considerar la hiptesis de investigacin verdadera. Los valores de P(EI) que
acabamos de dar ,corresponden a confiabilidades de 90%, 95% y 99% respectivamente.
ACTIVIDAD DE APRENDIZAJE
La siguiente tabla es similar a la de la pgina 46, en donde est expresada en trminos de H0.
Ahora t exprsala en trminos de la hiptesis alternativa, H1.

SITUACIN REAL
( desconocida)
S
I
T
U
A
C
I

N

E
S
T
A
D

S
T
I
C
A
REGLAS DE DECISIN O SIGNIFICANCIA
os procedimientos que permiten determinar si las muestras observadas, difieren
significativamente de los resultados esperados y que, por lo tanto, ayudan a decidir si se
aceptan o rechazan las hiptesis, se denominan pruebas de decisin o significancia. L
Regresemos a nuestro ejemplo, para esto, los profesores cuentan con una muestra de 30
calificaciones, en la que se obtuvo un promedio muestral de 7.86, es decir: n = 30 y
x
= 7.86.
La regla de decisin que queremos, nos debe indicar si la diferencia
x
u = 7.86 7.5 = 0.36
puede ser considerada lo suficientemente GRANDE, como para rechazar la hiptesis nula, o
si, por el contrario, debe ser considerada los suficientemente PEQUEA, como para no
rechazar H0. Tambin, que los valores de la media de distintas muestras tienen una distribucin
muestral, cuya dispersin estimamos mediante el error estndar muestral,
x
s
n

, si esta
dispersin es grande, el promedio de cada muestra, puede alejarse bastante del promedio
poblacional , y si es pequea se espera que cada promedio est cercano a . Esto hace que
evaluemos la diferencia x u , con respecto al error estndar muestral
x
s
n

; diremos que
el promedio muestral
x
difiere mucho o poco de u con respecto al error muestral
s
n
.Para
51
Matemticas aplicadas Estadstica Inferencial
ver cmo es la regla de decisin que nos permitir decir una cosa u otra, nuestro punto de
partida ser, el intervalo de confianza para que ya estudiamos en el tema anterior. Como
sabemos, para hacer una estimacin por intervalo de , decidiremos con qu probabilidad
estamos dispuestos a cometer el error en la estimacin.
Por ejemplo si decidimos que = 0.05, sabemos que podemos encontrar un intervalo de (1- )
100% = 95% confianza para . Debido a que no conocemos el valor de (desviacin estndar
poblacional), tendremos que calcular de la muestra, el valor de s (desviacin estndar muestral) y
hacer uso de la distribucin t de Student para construir el intervalo de confianza;
( 1) n
s
x t
n

t
donde t (n -1) es el valor de la distribucin t de Student con n -1 grados de
libertad** y en dos colas.
En nuestro ejemplo, t (n 1) es el valor de la distribucin t de Student con 30 1 = 29 grados de
libertad y = 0.05 en dos colas. Entonces (ver la tablat de Student de la pgina 52), t (n 1) = t (29) =
2.045, y tenemos que, con una probabilidad 1 = 0.95, est en el intervalo.
2.045 2.045
s s
x x
n n
< < +
de donde se deduce que, con una probabilidad de 0.95:
2.045 2.045
/
x
s n

< <
Observemos que esta regla de decisin es precisamente la que desebamos obtener, ya que:
1) Si el valor de
/
u
x
s n

no est en el intervalo < -2.045, 2.045>, podemos decir que
7.5
/
x
s n


difiere mucho de cero y que es porque la diferencia
x
- 7.5 (que puede ser negativa o
positiva) difiere mucho de cero con respecto al error estndar muestral
/ s n
. Este es
el caso en el que
x
difiere mucho de 7.5 y que nos dice cundo podemos rechazar la
hiptesis nula.
2) Si el valor de
/
u
x
s n

s est en el intervalo < -2.045, 2.045>, podemos decir que
7.5
/
x
s n


difiere poco de cero y que es porque la diferencia
x
- 7.5 difiere poco de cero con
respecto al error estndar muestral / s n . Este es el caso en el que
x
difiere poco de
7.5 y que nos dice cundo no podemos rechazar la hiptesis nula.
52
Matemticas aplicadas Estadstica Inferencial
** Grados de libertad: Es un parmetro de la distribucin t. para determinar un estimado de intervalo de una media
de poblacin, tiene n 1 grados de libertad, siendo n el tamao de la muestra aleatoria. (ver glosario de conceptos al
final de la gua didctica.
TABLA DE DISTRIBUCIN t de Student
Valores de t para algunas probabilidades
en rea central .10 .30 .50 .60 .70 .80 .90 .95 .98 .99 .995 .998 .999
en dos colas .90 .70 .50 .40 .30 .20 .10 .05 .02 .01 .005 .002 .001
en una cola .45 .35 .25 .20 .15 .10 .05 .025 .01 .005 .0025 .001 .0005
Grados de
libertad
Valores de t
1 .158 .510
1.000 1.376 1.963 3.078 6.314 12.706 31.821 63.657 127.32 318.31 636.62
2 .142 .445 .816
1.061 1.386 1.886 2.920 4.303 6.965 9.925 14.089 22.327 31.598
3 .137 .424 .765 .978
1.250 1.638 2.353 3.182 4.541 5.841 7.453 10.214 12.924
4 .134 .414 .741 .941
1.190 1.533 2.132 2.776 3.747 4.604 5.598 7.173 8.610
5 .132 .408 .727 .920
1.156 1.476 2.015 2.571 3.365 4.032 4.773 5.893 6.869
6 .131 .404 .718 .906
1.134 1.440 1.943 2.447 3.143 3.707 4.317 5.208 5.959
7 .130 .402 .711 .896
1.119 1.415 1.895 2.365 2.998 4.490 4.029 4.785 5.408
8 .130 .399 .706 .889
1.108 1.397 1.860 2.306 2.896 3.355 3.833 4.501 5.041
9 .129 .398 .703 .883
1.100 1.383 1.833 2.262 2.821 3.250 3.690 4.297 4.781
10 .129 .397 .700 .879
1.093 1.372 1.812 2.228 2.764 3.169 3.581 4.144 4.587
11 .129 .396 .697 .876
1.088 1.363 1.796 2.201 2.718 3.106 3.497 4.025 4.437
12 .128 .395 .695 .873
1.083 1.356 1.782 2.179 2.681 3.055 3.428 3.930 4.318
13 .128 .394 .694 .870
1.079 1.350 1.771 2.160 2.650 3.012 3.372 3.852 4.221
14 .128 .393 .692 .868
1.076 1.345 1.761 2.145 2.624 2.977 3.326 3.787 4.140
15 .128 .393 .691 .866
1.074 1.341 1.753 2.131 2.602 2.947 3.286 3.733 4.073
16 .128 .392 .690 .865
1.071 1.337 1.746 2.120 2.583 2.921 3.252 3.686 4.015
17 .128 .392 .689 .863
1.069 1.333 1.740 2.110 2.567 2.898 3.222 3.646 3.965
18 .127 .392 .688 .862
1.067 1.330 1.734 2.101 2.552 2.878 3.197 3.610 3.922
19 .127 .391 .688 .861
1.066 1.328 1.729 2.093 2.539 2.861 3.174 3.579 3.883
20 .127 .391 .687 .860
1.064 1.325 1.725 2.086 2.528 2.845 3.153 3.552 3.850
21 .127 .391 .686 .859
1.063 1.323 1.721 2.080 2.518 2.831 3.135 3.527 3.819
22 .127 .390 .686 .858
1.061 1.321 1.717 2.074 2.508 2.819 3.119 3.505 3.792
23 .127 .390 .685 .858
1.060 1.319 1.714 2.069 2.500 2.807 3.104 3.485 3.767
24 .127 .390 .685 .857
1.059 1.318 1.711 2.064 2.492 2.797 3.091 3.467 3.745
25 .127 .390 .684 .856
1.058 1.316 1.708 2.060 2.485 2.787 3.078 3.450 3.725
26 .127 .390 .684 .856
1.058 1.315 1.706 2.056 2.479 2.779 3.067 3.435 3.707
27 .127 .389 .684 .855
1.057 1.314 1.703 2.052 2.473 2.771 3.057 3.421 3.690
28 .127 .389 .683 .855
1.056 1.313 1.701 2.048 2.467 2.763 3.047 3.408 3.674
29 .127 .389 .683 .854
1.055 1.311 1.699 2.045 2.462 2.756 3.038 3.396 3.659
30 .127 .389 .683 .854
1.055 1.310 1.697 2.042 2.457 2.750 3.030 3.385 3.646
40 .126 .388 .681 .851
1.050 1.303 1.684 2.021 2.423 2.704 2.971 3.307 3.551
60 .126 .387 .679 .848
1.046 1.296 1.671 2.000 2.390 2.660 2.915 3.232 3.460
120 .126 .386 .677 .845
1.041 1.289 1.658 1.980 2.358 2.617 2.860 3.160 3.373
.126 .385 .674 .842
1.036 1.282 1.645 1.960 2.326 2.576 2.807 3.090 3.291
53
Matemticas aplicadas Estadstica Inferencial
UPN-SEP. Introduccin a los mtodos estadsticos. Sistema de Educacin a Distancia. Volumen 2. 1982.
Grados de libertad: Nmero de valores de una muestra que podemos especificar libremente, una vez que separamos algo de ella.
A la expresin
/
u
x
s n

la llamaremos estadstico de prueba y la denotamos por tc. Si este
valor de tc es tal que tc si est en el intervalo <-2.045, 2.045>, no se rechaza H0, por lo que al
intervalo <-2.045,2.045> se le denomina la regin de no rechazo de H0. Si el valor de tc es tal
que tc no est en el intervalo <-2.045, 2.045>,se rechaza H0
Grficamente, se tiene:
Sabemos que si rechazamos H0 , podemos estar cometiendo el error tipo I. Por lo tanto, se tiene
que es la probabilidad de que siendo H0 verdadera, tc no est en el intervalo y rechacemos H0.
ESQUEMA GENERAL DE LA PRUEBA DE HIPTESIS.
a mayora de los conceptos que hemos estudiado hasta el momento, son comunes a todos
los procesos estadsticos de prueba de hiptesis. Enseguida se propone por parte del
Sistema de Educacin a Distancia UPN-SEP en el libro, Introduccin a los mtodos estadsticos
1982., un esquema general para probar hiptesis en el cual se consideran en forma
sistematizada y secuencial las partes que se deben considerar en cada prueba de hiptesis.
L
Los pasos que consideraremos al probar una hiptesis son los siguientes:
1. Planteamiento de las hiptesis
2. Estadstico de prueba y condiciones para su uso.
3. Regla de decisin
4. Clculos
5. Decisin estadstica
6. Interpretacin de los resultados.
A continuacin se detallan cada uno de ellos de manera somera.
1) Planteamiento de las hiptesis.
Se plantear en trminos del problema a tratar la hiptesis de investigacin, la que se traducir
a trminos estadsticos. Se plantearn tambin las hiptesis nula y alternativa.
2) Estadstico de prueba y condiciones para su uso.
54
-2.045
2.045
Regin de NO rechazo de H
0
Regin de
rechazo de H
0
Regin de
rechazo de H
0
0
t
(29)
= .05
Matemticas aplicadas Estadstica Inferencial
Se indicar el estadstico de prueba, que es una variable aleatoria que relaciona el
planteamiento de la hiptesis nula con la informacin contenida en la muestra. Se identificar la
distribucin que tiene el estadstico de prueba bajo el supuesto de que la hiptesis nula es
cierta. Adems, se enunciarn las condiciones para el uso del estadstico de prueba y en
algunos casos, deberemos suponer que se cumplen las condiciones.
3) Regla de decisin
Se especificar el valor de ,esto es, la probabilidad con la que se est dispuesto a cometer el
error de tipo I, y se indicar, de acuerdo con el planteamiento de la hiptesis alternativa, si se
localiza en una o dos colas de la distribucin que tiene el estadstico de prueba bajo el supuesto
que de que la hiptesis nula es verdadera. Se consultar la tabla de probabilidades
correspondiente a dicha distribucin y se encontrar el valor (que suele llamarse valor crtico) que
permita definir las regiones de rechazo de H0 y de no rechazo de H0.
4) Clculos
Se encontrar el valor del estadstico de prueba correspondiente a la muestra obtenida,
sustituyendo en la expresin algebraica del estadstico de prueba, los nmeros que
corresponden a los estimadores y dems datos muestrales y los que corresponden al
planteamiento de la hiptesis nula.
5) Decisin estadstica
Se identificar en cules de las regiones definidas en el paso 3, se encuentra el valor del
estadstico de prueba calculado en el paso 4. Si este valor est en la regin de rechazo de H0
se tomar la decisin de rechazar H0, y si est en la regin de no rechazo de H0 , se tomar la
decisin de no rechazar H0.
6) Interpretacin de los resultados
Se expresar la decisin tomada en el paso 5 en trminos de la hiptesis de investigacin. Esto
es, se traducirn las conclusiones que se obtuvieron en trminos estadsticos a los trminos del
problema original.
Ahora Terminemos el ejemplo haciendo un resumen y
sometmos a prueba la hiptesis inicial .
1) Planteamiento de las hiptesis.
El nivel de conocimientos que tienen los jvenes de las escuelas secundarias de las zonas
rurales del estado de Nayarit, es diferente del de los jvenes de las escuelas secundarias de
las zonas urbanas del estado. Hinv: 7.5
Las hiptesis estadsticas son: H0 : = 7.5
H1 : 7.5
Recordando que es el promedio de calificaciones que se obtendran en las zonas rurales y u es el
promedio de calificaciones que se obtuvo en las zonas urbanas (u = 7.5). Conocemos el valor de u,
pero no el de .
2) Estadstico de prueba y condiciones para su uso .
El estadstico de prueba que usaremos es:
7.5
/
c
x
t
s n

el cual se distribuye en forma t de Student con n 1 grados de libertad bajo el supuesto de


que H0 es cierta. La condicin para usar este estadstico de prueba es que la variable bajo
estudio se distribuye normalmente. Como el examen se construyo de tal forma que la
calificacin fuera una variable que se distribuyera normalmente, esta condicin se cumple.
55
Matemticas aplicadas Estadstica Inferencial
3) Regla de decisin
Como se desea probar H1: 7.5 ( u) con un nivel de significancia de 5%, se tienen que
=0.05 en dos colas. El valor en la tabla de la distribucin t de Student con 30 1= 29 grados
de libertad es t (29) = 2.045. A partir de este valor se definen las regiones de rechazo y no
rechazo de H0 , como sigue
No se rechaza H0
si tc est en el intervalo <-2.045, 2.045>
Se rechaza H0 si Se rechaza H0 si
tc est < ,2.045] tc est [2.045,>

4) Clculos
Como n = 30,
x
=7.86, s = 0.71 y u = 7.5, tenemos:
5) Decisin estadstica
Como tc = 2.778 no est en el intervalo < -2.045,2.045>, se decide rechazar H0.
6) Interpretacin de los resultados
Como se rechaz la hiptesis nula, H0 : = 7.5 con = 0.05 se puede sealar:
La muestra proporciona evidencia suficiente para considerar, con 95% de confianza, que la
hiptesis de investigacin es verdadera, o sea que los jvenes de las escuelas secundarias
ubicadas en las zonas rurales del estado de Nayarit, tienen un nivel de conocimientos en
matemticas que es distinto del que tienen los jvenes de las secundarias urbanas del mismo
estado. Dicho de otra forma, podemos decir que hay diferencias significativas del nivel de
conocimientos en matemticas entre los jvenes de las escuelas secundarias de las zonas
rurales y los de las zonas urbanas del estado de Nayarit.
Si reflexionas y analizas detenidamente lo anterior, observaras que para llegar a stas conclusiones
estadsticas, intervinieron adems del valor de u (postulado por la hiptesis nula H0 : = u ), los
siguientes nmeros;
El promedio muestral (
x
);
La desviacin estndar muestral(s);
El tamao de la muestra (n ); y
La probabilidad con la que se est dispuesto a cometer el error tipo I ().
En las siguientes actividades de aprendizaje te permitir reflexionar cmo influye cada uno de estos
nmeros en la conclusin estadstica de rechazar o no rechazar la hiptesis nula.
56
2.045
2.045
Regin de NO rechazo de H
0
Regin de
rechazo de H
0
Regin de
rechazo de H
0
0
t
(29)
= .05
7.86 7.5 0.36
2.778
0.1296 / 0.71/ 30
u
c
x
t
s n


Matemticas aplicadas Estadstica Inferencial
ANIMO, CORRE HACIA TU
AUTOAPRENDIZAJE
ACTIVIDADES DE APRENDIZAJE: Realiza tus clculos an lado de la hoja, por favor.
1) En el ejercicio se trabaj con s = 0.71, n = 30 y = 0.05. Obtenga la conclusin estadstica si
x
hubiera sido cada uno de los indicados en la columna de la izquierda en la siguiente tabla:
x
tc
Regin de NO rechazo de H0
< -tc (n-1) , tc (n-1)>
Conclusin estadstica:
Se rechaza H0 y se
acepta H1?
7.00
17.14
7.35
7.50
7.65
7.86 2.778 < -2.045, 2.045> SI
8.00
Qu relacin guarda la distancia entre
x
y u=7.5 con la distancia entre tc y cero? Que relacin guarda
la distancia entre
x
y u con la conclusin estadstica?, analiza tus conclusiones
____________________________________________________________________________
____________________________________________________________________________
____________________________________________________________________________
____________________________________________________________________________
2) En el ejercicio se trabaj con
x
= 7.86, n = 30 y = 0.05. Obtenga la conclusin estadstica si
s hubiera sido cada uno de los indicados en la columna de la izquierda en la siguiente tabla:
s
tc
Regin de NO rechazo de H0
< -tc (n-1) , tc (n-1)>
Conclusin estadstica:
Se rechaza H0 y se
acepta H1?
0.30
0.50
0.71 2.778 < -2.045, 2.045> SI
0.90
1.10
1.30
1.50
Qu relacin hay entre la dispersin de los datos de la muestra (s) y el valor tc del estadstico de
prueba? Qu relacin hay entre la dispersin de los datos de la muestra y la conclusin estadstica?
____________________________________________________________________________
____________________________________________________________________________
____________________________________________________________________________
3) En el ejercicio se trabaj con
x
= 7.86, s = 0.71 y = 0.05. Obtenga la conclusin estadstica
si n hubiera sido cada uno de los indicados en la columna de la izquierda en la siguiente tabla:
57
Matemticas aplicadas Estadstica Inferencial
n
tc
Regin de NO rechazo de H0
< -tc (n-1) , tc (n-1)>
Conclusin estadstica:
Se rechaza H0 y se
acepta H1?
5
10
15
20
25
30 2.778 < -2.045, 2.045> SI
40
Qu relacin hay entre n y el intervalo; n con tc ; n y la conclusin estadstica?, analiza tus conclusiones
____________________________________________________________________________
____________________________________________________________________________
____________________________________________________________________________
____________________________________________________________________________
3) En el ejercicio se trabaj con
x
= 7.86, s = 0.71 y n = 30. Obtenga la conclusin
estadstica si n hubiera sido cada uno de los indicados en la columna de la izquierda en
la siguiente tabla:

tc
Regin de NO rechazo de H0
< -tc (n-1) , tc (n-1)>
Conclusin estadstica:
Se rechaza H0 y se
acepta H1?
0.10
0.05 2.778 < -2.045, 2.045> SI
0.02
0.01
0.005
0.002
0.001
Qu relacin hay entre y la amplitud de la regin de no rechazo de H0? Con cuanta confianza
podemos aceptar H1?, analiza tus conclusiones
____________________________________________________________________________
____________________________________________________________________________
____________________________________________________________________________
PRUEBA DE HIPTESIS SOBRE UNA MEDIA POBLACIONAL
edicaremos este espacio para plantear en forma general, el mtodo que sirve para
probar hiptesis del tipo que ya sealamos en el tema de decisin estadstica , esto es,
la prueba para hiptesis estadsticas de la forma: D
H0: = 0 H0: 0 H0: 0
o bien o bien
58
Matemticas aplicadas Estadstica Inferencial
H1 : 0 H1: > 0 H1: < 0
Una observacin importante es que si la variable en estudio es continua, un estadstico de
prueba para estos casos es,
0
/
c
x
t
s n

, cuya distribucin, bajo el supuesto de que H0 es cierta,
es la t de Student con n-1 grados de libertad; adems que los resultados que se obtienen son
vlidos tanto para muestras grandes como para muestras pequeas. Para realizar dicha
prueba de hiptesis seguirn siendo vlidos los seis pasos del esquema general para la
prueba de hiptesis propuesto en el tema anterior.
El siguiente cuadro resume este mtodo:
Primer ejemplo, para a n a l i z a r detenidamente
El gerente de compras de una tienda de autoservicio analiza la cantidad de azcar
de un lote de naranjas procedentes de Veracruz para determinar su precio de venta.
De acuerdo con el productor, el contenido de azcar de las frutas es en promedio
12.5%. El gerente enva a analizar una muestra aleatoria de n = 20 naranjas y los
resultados del laboratorio arroja una media en
x
= 11.9% de azcar y una desviacin estndar s
= 0.9%. Debe el gerente aceptar la afirmacin del producto de que el promedio de azcar es
del 12.5% si el nivel de significancia es de 0.05?
59
Si X es una variable que se distribuye normalmente como media , y si se tiene una de
las siguientes hiptesis nulas:
H
0
: =
0
H
0
:
0
H
0
:
0
Donde
0
es un valor conocido, entonces un estadstico de prueba es
Donde y s son la media y la desviacin estndar de una muestra de tamao n
representativa de la poblacin. Si H
0
es cierta, la distribucin de t
c
es la distribucin t
de Student con n 1 grados de libertad.
Para una determinada, la regla de decisin se plantea de acuerdo a la siguiente
tabla:
Forma de H
1
Regin de rechazo de H
0
t
(n1)
es el valor de t con en,
H
1
:
0

H
1
: >
0
H
1
: <
0

< , t
(n1)
] U [ t
(n1)
, >
[ t
(n1)
, >
< , t
(n1)
]
Dos colas
Una cola
Una cola
Si X es una variable que se distribuye normalmente como media , y si se tiene una de
las siguientes hiptesis nulas:
H
0
: =
0
H
0
:
0
H
0
:
0
Donde
0
es un valor conocido, entonces un estadstico de prueba es
Donde y s son la media y la desviacin estndar de una muestra de tamao n
representativa de la poblacin. Si H
0
es cierta, la distribucin de t
c
es la distribucin t
de Student con n 1 grados de libertad.
Para una determinada, la regla de decisin se plantea de acuerdo a la siguiente
tabla:
Forma de H
1
Regin de rechazo de H
0
t
(n1)
es el valor de t con en,
H
1
:
0

H
1
: >
0
H
1
: <
0

< , t
(n1)
] U [ t
(n1)
, >
[ t
(n1)
, >
< , t
(n1)
]
Dos colas
Una cola
Una cola
0
/
c
x
t
s n

Matemticas aplicadas Estadstica Inferencial


1) Planteamiento de las hiptesis:
Hinv : El promedio del contenido de azcar del lote de naranjas procedentes de Veracruz es
diferente al promedio afirmado por el productor del 12.5%.
Hinv : 12.5 Hiptesis estadsticas H0: = 12.5 H1 : 12.5
2) Estadstico de prueba y condiciones para su uso:
El estadstico de prueba que usaremos es:
0
/
c
x
t
s n

Cuya distribucin es la de t de Student con n 1 grados de libertad, bajo el supuesto de que


H0 es cierta. La condicin para usar este estadstico de prueba, es que la variable bajo estudio
se distribuya normalmente y suponemos que el contenido de azcar de las naranjas se
distribuye normalmente por lo que sta condicin se cumple.
3) Regla de decisin:
Como se desea probar H1: 12.5 con un nivel de significancia de 0.05 o 5%, se tiene = 0.05
en dos colas. El valor en la tabla (ver pgina 53) de la distribucin t de Student con 20 1 = 19
grados de libertad es = 2.093. Apartir de este valor se definen las regiones de rechazo y no
rechazo de H0, como sigue
No se rechaza H0
si tc est en el intervalo <-2.093, 2.093>
Se rechaza H0 si Se rechaza H0 si
tc est < ,2.093] tc est [2.093,>

4) Clculos:
Como n = 20, la media muestral es
x
= 11.9, la desviacin estndar muestral es s = 0.9
tenemos
0
11.9 12.5
2.98
/ 0.9/ 20
c
x
t
s n


5) Decisin estadstica:
como tc = - 2.98 no se encuentra en el intervalo <-2.093, 2.093>, se debe rechazar la H0 ( =
12.5%) dicho de otra manera, t c < -2.093 ya que -2.98 se encuentra a la izquierda de -2.093 en
la recta real, por lo tanto se debe rechazar la hiptesis nula.
6) Interpretacin de resultados:
Como se rechaz la hiptesis nula nos indica lo siguiente:
Hay evidencia suficiente para considerar, con una confianza de 95% que el promedio del
contenido de azcar de las naranjas de las muestras (
x
= 11.9%) es significativamente
diferente respecto al promedio del contenido de azcar de las frutas que aseguraba el productor
( = 12.5%). Por lo tanto, en respuesta a la pregunta inicial, el gerente no debe aceptar la
afirmacin del producto de que el promedio de azcar es del 12.5%; o lo que es lo mismo, la
diferencia en el porcentaje de azcar entre 12.5 y 11.9 es muy grande para deberse a la
variabilidad de las diferentes muestras.
60
Regin de
Rechazo de H0
Regin de
Rechazo de H0
2.093 2.093
Regin de NO rechazo de H
0
0
t
(19)
= .05
Matemticas aplicadas Estadstica Inferencial
Otro problema para confirmar aprendizajes
Un especialista en lectura hace una investigacin acerca de las repercusiones que
puede tener el uso de textos programados en los estudiantes preuniversitarios. Una de
sus hiptesis es que el uso de textos programados no fomenta la comprensin en
lectura. Una investigacin reciente reporta que se aplic una prueba de comprensin
de lectura, cuyos puntajes se distribuyen normalmente, a estudiantes que usaron textos
programados en sus estudios preuniversitarios, y se obtuvo un promedio de puntaje de 4.25.
El especialista plantea que si esta prueba se aplicara a estudiantes que no usaron textos
programados en sus estudios preuniversitarios el promedio de puntaje sera mayor, pero
como en la investigacin citada no se reportan informes acerca de estos ltimos elige
aleatoriamente a 125 de ellos y les aplica la prueba de comprensin de lectura antes
mencionada. Obtiene un promedio de 5.30 y una desviacin estndar de 1.8. Con = 0.05
proporcionan estos datos evidencia suficiente para apoyar el planteamiento del especialista?
1) Planteamiento de las hiptesis:
La hiptesis de investigacin: El puntaje promedio obtenido en la prueba de comprensin de
lectura es mayor para los estudiantes que no usaron textos programados que para los
estudiantes que usaron textos programados en sus estudios preuniversitarios.
O sea, Hinv.= > 4.25
Las hiptesis estadsticas son: H0: 4.25 y H1 = > 4.25
2) Estadstico de prueba y condiciones para su uso:
El estadstico de prueba que usaremos es:
0
/
c
x
t
s n


Cuya distribucin es la de t de Student con n 1 grados de libertad, bajo el supuesto de que
H0 es cierta. La condicin para usar este estadstico de prueba es que la variable bajo estudio
se distribuya normalmente, como se sabe que los puntajes se distribuyen normalmente, esta
condicin se cumple.
3) Regla de decisin:
Como se desea probar H1 : > 0 con un nivel de significancia de 5% se tiene = 0.05 en una
cola. El valor en la tabla de la distribucin t de Student con 125 1 grados de libertad es t ( 124)
t (120) = 1.658 (en un caso as se puede usar el valor ms prximo, que este caso es de t(120)) A partir de este
valor se definen las regiones de rechazo y no rechazo de H0, como sigue:
No se rechaza H0
si tc est en el intervalo <-, 1.658>
Se rechaza H0 si
tc est [1.658,>

61
1.658
Regin de NO rechazo de H
0
Regin de
Rechazo de H
0
0
t
(124)
= .05
Matemticas aplicadas Estadstica Inferencial
4) Clculos:
Como n = 125,
x
= 5.30, s = 1.8 y 0 = 4.25, tenemos:
0
5.30 4.25
6.522
/ 1.8/ 125
c
x
t
s n


5) Decisin estadstica:
Como tc = 6.522 y est en [1.658,> , se rechaza H0 .
6) Interpretacin de los resultados
:
Como se rechaz H0 : 4.25 con = 0.05, hay suficiente evidencia para considerar que el
puntaje promedio en la prueba de comprensin de lectura es ms alto para los estudiantes que
no usaron textos programados que para los estudiantes que usaron textos programados en sus
estudios preuniversitarios con una confiabilidad de 95%.
PRUEBA DE HIPTESIS SOBRE UNA PROPORCIN POBLACIONAL
asta el momento hemos analizado como probar hiptesis sobre una media poblacional.
En este ltimo apartado vamos a pensar y comprender, cmo probar hiptesis similares
al tema anterior, con la salvedad que ahora tendremos variables categricas y nos
plantearemos preguntas acerca de la proporcin con la que ocurre, en la poblacin,
determinada categora. Esto es, estudiaremos la prueba de hiptesis sobre una proporcin
poblacional.
H
62
Educacin humana y de
calidad
SAETA
Matemticas aplicadas Estadstica Inferencial
El esquema de seis pasos para la prueba de hiptesis, que planteamos anteriormente, y que
utilizamos en la prueba de hiptesis sobre la media poblacional, nos servir aqu tambin.
Supongamos que estamos estudiando un fenmeno que tiene asociada una variable
categrica, y que estamos interesados en comparar la proporcin poblacional p con la que
ocurre cierta categora de la variable, con un determinado valor p0 que es conocido o que se
supone como dado. Entonces, las hiptesis estadsticas sern de la forma:
H0: p = p0 H0: p p0 H0: p p0
o bien o bien
H1: p p0 H1: p > p0 H1: p < p0
El mtodo general para probar hiptesis sobre una proporcin poblacional es el siguiente:
Procedamos a realizar dos problemas para estar listos para las actividades de autoaprendizaje
Problema para reflexionar
Se sospecha que menos del 60% de los profesores ayudan a los nios dislxicos (dificultad de la
lectura) a mejorar sus habilidades. Se realiz una investigacin para saber si esto es verdad en
cierta zona escolar. Para ello, se eligieron aleatoriamente a 230 maestros y se realiz una
entrevista con ellos para detectar si, al desarrollar su labor docente, ayudan a los nios
dislxicos a mejorar sus habilidades; se encontr que 134 de ellos s ayudan a los nios
dislxicos. Supongamos que se desea someter a prueba la hiptesis con = 0.05
63
Si p es la proporcin con la que ocurre cierta categora de una variable categrica en
una poblacin, y si se tiene una de las siguientes hiptesis nulas:
H
0
: p = p
0
H
0
: p p
0
H
0
: p p
0
Donde p
0
es un valor conocido, entonces un estadstico de prueba es
Donde p es la proporcin con la que ocurre la categora en una muestra representativa
de tamao n de la poblacin.
Si np
0
> 5 y n (1- p
0
) > 5, y si H
0
es cierta, la distribucin de z
c
es la normal estndar.
Para una determinada, la regla de decisin se plantea de acuerdo a la siguiente
tabla:
Forma de H
1
Regin de rechazo de H
0
z

es el valor de Z con en,
H
1
: p p
0

H
1
: p > p
0
H
1
: p < p
0

< , z

] U [ z, >
[ z, >
< ,z

]
Dos colas
Una cola
Una cola
Si p es la proporcin con la que ocurre cierta categora de una variable categrica en
una poblacin, y si se tiene una de las siguientes hiptesis nulas:
H
0
: p = p
0
H
0
: p p
0
H
0
: p p
0
Donde p
0
es un valor conocido, entonces un estadstico de prueba es
Donde p es la proporcin con la que ocurre la categora en una muestra representativa
de tamao n de la poblacin.
Si np
0
> 5 y n (1- p
0
) > 5, y si H
0
es cierta, la distribucin de z
c
es la normal estndar.
Para una determinada, la regla de decisin se plantea de acuerdo a la siguiente
tabla:
Forma de H
1
Regin de rechazo de H
0
z

es el valor de Z con en,
H
1
: p p
0

H
1
: p > p
0
H
1
: p < p
0

< , z

] U [ z, >
[ z, >
< ,z

]
Dos colas
Una cola
Una cola
Matemticas aplicadas Estadstica Inferencial
1) Planteamiento de la hiptesis:
La hiptesis de investigacin es: Menos de 60% de los profesores ayudan a los nios dislxicos
a mejorar sus habilidades. O sea, Hinv: p < 0.60
Las hiptesis estadsticas son: H0: p 0.60
H1: p < 0.60
2) Estadstico de prueba y condiciones para su uso:
El estadstico de prueba que usaremos es:
La distribucin de este estadstico, bajo el supuesto de que H0 es cierta, es la distribucin
normal estndar.
La condicin para usar este estadstico de prueba, es que np0 > 5 y n (1-p0) > 5.
Como 230 (0.60) = 138 y es > 5 y adems 230 ( 1- 0.60) = 92, tambin > 5, esta condicin se
cumple.
3) Regla de decisin:
Tenemos un = 0.05, y como H1: p < 0.60, entonces quedar en la cola izquierda de la
distribucin normal estndar. El valor en la tabla de la distribucin normal estndar es z = 1.645.
A partir de este valor se definen las regiones de rechazo y no rechazo de H0 como sigue
No se rechaza H0
si zc est en el intervalo <- 1.645, >
4) Clculos:
Como n = 230, p = 134 / 230 = 0.5826 (proporcin de los que si ayudan a los nios) y p0 = 0.60,
tenemos:
5) Decisin estadstica:
Como zc = -0.5387, se encuentra en la regin de no rechazo, en el intervalo < -1.645, >, por lo
tanto, la H0 no se rechaza.
6) Interpretacin de los resultados
Como no se rechaz H0: p 0.60, no hay evidencia suficiente para considerar, con una
confianza de 95%, que el porcentaje de los maestros que ayudan a los nios dislxicos a
mejorar sus habilidades sea menor de 60%.
64
( )
n
p p
p p
z
c
0 0
0
1

1.645
Regin de NO rechazo de H
0
0
= .05
Regin de rechazo
de H
0
( )
5387 . 0
0323 . 0
0174 . 0
230
) 40 . 0 )( 60 . 0 (
60 . 0 5826 . 0
1
0 0
0

n
p p
p p
z
c
Matemticas aplicadas Estadstica Inferencial
Otro ltimo problema para confirmar aprendizajes
Un Psiclogo opina que ms de 30% de los jvenes cuyas edades fluctan entre 16 y 19 aos
tienen inters en conocer aspectos de educacin sexual. Para someter a prueba su hiptesis,
elige aleatoriamente 150 jvenes y por medio de una entrevista y una prueba detecta que 63 de
ellos estn interesados en temas de educacin sexual. Supongamos que el psiclogo desea
una confiabilidad en su prueba de 99% ( por lo que = 0.01).
1) Planteamiento de la hiptesis:
La hiptesis de investigacin es: Ms de 30% de los jvenes cuyas edades fluctan entre 16 y
19 aos tienen inters en conocer aspectos de ecuacin sexual, O sea, Hinv: p > 0.30
Las hiptesis estadsticas son : H0 : p 0.30
H1 : p > 0.30
2) Estadstico de prueba y condiciones para su uso:
El estadstico de prueba que usaremos es:
La distribucin de este estadstico, bajo el supuesto de que H0 es cierta, es la distribucin
normal estndar.
La condicin para usar este estadstico de prueba, es que np0 > 5 y n (1-p0) > 5.
Como 150 (0.30) = 45 > 5 y 150 (1- 0.30) = 105 > 5, esta condicin se cumple.
3) Regla de decisin:
Tenemos = 0.01. Como H1: p > 0.30, entonces quedar en la cola derecha de la distribucin
normal estndar. El valor en la tabla de la distribucin estndar es z = 2.326. A partir de este
valor se definen las regiones de rechazo y no rechazo de H0 como sigue:
No se rechaza H0
si zc est en el intervalo <-, 2.326>
Se rechaza H0 si
zc est [2.326,>

4) Clculos:
Como n = 150, p = 63 / 150 = 0.42 (proporcin interesada en temas de educacin sexual) y p0 : 0.30,
tenemos:
65
( )
n
p p
p p
z
c
0 0
0
1

2.326
Regin de NO rechazo de H
0
Regin de
Rechazo de H
0
0
= .01
( )
21 . 3
0374 . 0
12 . 0
150
) 70 . 0 )( 30 . 0 (
30 . 0 42 . 0
1
0 0
0

n
p p
p p
z
c
Matemticas aplicadas Estadstica Inferencial
5) Decisin estadstica:
Como 3.21 est [2.326,> , se rechaza H0
6) Interpretacin de los resultados:
Como se rechaz H0: p 0.30 con = 0.01, hay suficiente evidencia para considerar, con 99%
de confianza, que ms de 30% de los jvenes cuyas edades fluctan entre 16 y 19 aos, tienen
inters en conocer aspectos de educacin sexual.

Terminamos nuestra primera parte BRAVO POR FIN !!!
ES MOMENTO DE RESOLVER LAS PRUEBAS DE HIPTESIS
PARA QUE REAFIRMES LO APRENDIDO,
REALIZA LAS SIGUIENTES ACTIVIDADES
MUY BIEN POR TU ESFUERZO
DEDICACIN Y ENTUSIASMO MUCHAS FELICIDADES!!
ACTIVIDADES DE APRENDIZAJE
Resuelve las siguientes pruebas de hiptesis para una media y proporcin poblacional y
Realiza tus operaciones en tu cuaderno y aqu escribe tus respuestas correctas
1) La productividad de Maz de 5 hectreas elegidas aleatoriamente en la regin sur del Estado
de Nayarit fue de 4.1, 3.7, 3.2, 3.3, y 3.5 toneladas.
a) Determina la productividad media y la desviacin estndar de esta muestra.
66
Educacin humana y de
calidad
SAETA
Gracias
aceboman
quiero y
merezco mi
10
Matemticas aplicadas Estadstica Inferencial
b) De acuerdo con el INEGI, la productividad media de la regin es de 3.5 toneladas por
hectrea. Debemos rechazar la hiptesis nula H0: = 3.5 y aceptar la hiptesis
alternativa 3.5 a un nivel de significancia de 0.05? realiza los 6 pasos para comprobar
dicha hiptesis.
2) Un inspector de Hacienda sospecha que las ventas semanales promedio de una empresa
superan los $ 36 750.00 que indic la empresa en su declaracin anual. El inspector selecciona
aleatoriamente 9 semanas y al estudiarlas detalladamente obtiene que durante estas 9
semanas las ventas semanales tuvieron una media de
x
= $ 40 500.00 y una desviacin
estndar de s = $ 2 850.00. El inspector decide continuar con la auditoria en caso de que deba
rechazar la hiptesis nula = 36 750.00 y aceptar la hiptesis alternativa > 36 750.00 a un
nivel de significancia de 0.05. Continuar la auditoria el inspector? Realiza los 6 pasos
3) Una empresa entrevista a una muestra de 18 secretarias provenientes de una escuela que
afirma que sus egresadas escriben en la computadora 70 palabras por minuto. La media de
esta muestra fue
x
= 67.3 palabras por minuto y la desviacin estndar fue de s = 4.4 palabras
por minuto. Usa el nivel de significancia de 0.05 para decidir si la empresa debe rechazar la
hiptesis nula H0 : = 70 y aceptar la hiptesis alternativa < 70. Realiza los 6 pasos

4) En un informe acerca de la desercin, se menciona que en los CBTAs del estado de Nayarit,
el 40% de los alumnos abandonan sus estudios porque carecen de recursos econmicos. Un
profesor piensa que en su CBTa esto no coincide con la realidad; para someter a prueba su
hiptesis, obtiene una muestra aleatoria de 70 estudiantes desertores, y encuentra que 30 de
ellos carecen de recursos econmicos. Puede el profesor, con un nivel de significancia =
0.05, considerar que, entre los alumnos desertores, los que carecen de recursos econmicos
son un porcentaje distinto de 40%?. Realiza los 6 pasos
5) Un trabajador social cree que menos del 25% de las parejas de cierta regin, han utilizado
por lo menos una vez, alguna forma de control natal. Con el fin de ver si esta suposicin es
razonable, el trabajador social selecciona una muestra aleatoria de 120 parejas de la regin, de
las cuales 20 dijeron que haban empleado algn mtodo de control natal. Realiza los 6 pasos para
verificar la hiptesis planteada.
67

You might also like