You are on page 1of 67

CAPTULO 15 PROCEDIMIENTOS MS COMPLEJOS DE MUESTREO

1.

Cmo se selecciona una muestra estratificada?


El muestreo estratificado es un proceso de dos fases. Primero, la poblacin definida se
divide en subgrupos o estratos mutuamente excluyentes y colectivamente exhaustivos
usando alguna variable de estratificacin como el sexo. Luego, se extrae una muestra
aleatoria simple e independiente de cada estrato.

Pregunta del instructor para sondeo: La estratificacin debe aplicarse siempre antes de
que se tome la muestra?
Respuesta sugerida al sondeo: No, la estratificacin puede aplicarse despus de que se han
tomado los datos; sin embargo, debido al control disponible en la planeacin y organizacin
de la estratificacin antes de que se tome la muestra, aplicar la estratificacin antes de tomar
la muestra es el mtodo preferido.
2.

Cul es el objetivo del muestreo estratificado?


El muestreo estratificado puede producir errores estndar ms pequeos de los
estimados que el muestreo aleatorio simple. Por tanto, puede ganarse precisin sin
incrementar el tamao de la muestra, o de manera equivalente, puede obtenerse el
mismo nivel de precisin con un tamao de muestra ms pequeo.

Pregunta del instructor para sondeo: Qu es necesario para que la estratificacin sea
efectiva en la minimizacin del error?
Respuesta sugerida al sondeo: A fin de que la estratificacin sea efectiva, los estratos
deben correlacionarse en gran medida con la o las caractersticas que se estn estimando.
Adems, las medias y la varianza deben diferir en forma amplia por estratos para que la
estratificacin sea efectiva.
175

3.

Qu es muestreo estratificado proporcional?


El muestreo estratificado proporcional implica elegir elementos de la muestra de cada
estrato de tal manera que la proporcin (1) del nmero de elementos de la muestra
extrados del estrato j con el tamao total de la muestra sea igual a la proporcin (2)
del nmero de elementos de la poblacin dentro del estrato j con el nmero total de
elementos de la poblacin. En la notacin del captulo 9:
nj
n

Nj
N

Pregunta del instructor para sondeo: Cul es el propsito de usar una proporcin para el
muestreo estratificado?
Respuesta sugerida al sondeo: La naturaleza de algunos experimentos requiere que se
hagan slo comparaciones relativas (proporciones) y puede ser que no se puedan especificar
los nmeros absolutos o ni siquiera se desee hacerlo.
4.

Qu es muestreo estratificado no proporcional?

Aqu

nj
n

Los estratos estn submuestreados o sobremuestreados con relacin al tamao de su


poblacin.
Pregunta del instructor para sondeo: Cmo se relaciona la variabilidad con el muestreo
estratificado no proporcional?

176

Respuesta sugerida al sondeo: Cuando los estratos tienen diferente variabilidad entre s,
entonces los tamaos de la muestra requerida varan de un estrato a otro, lo que produce un
muestreo estratificado no proporcional. Entre mayor es la variabilidad, ms grande es el
tamao necesario de la muestra. Del mismo modo, entre menor es la variabilidad, es menor
el tamao necesario de la muestra.
5.

Cmo se calcula la media de una muestra total y el error estndar de una muestra
estratificada?
La media de la muestra total tan slo es un promedio ponderado de la media del
estrato.

X =

Nj

j =1 N
A

w
j =1

El error estndar es la raz cuadrada de la combinacin ponderada del cuadrado del


error estndar dentro de cada estrato
sX =

sX

donde

sX

N
= j
j =1 N
A

2
s X j =

w s
j =1

2
2
j X j

Pregunta del instructor para sondeo: Cmo se representan los valores de los estratos en
los clculos que implican estratificacin?

177

Respuesta sugerida al sondeo: Por lo general, se usa el subndice ST para denotar un


estrato, y un punto decimal y un nmero que siguen a ST indican a cul estrato
corresponde ese valor.
6.

Bajo qu circunstancias el muestreo estratificado reduce el error estndar?


Las variables que se correlacionan altamente con la medicin de inters son
candidatas a variables de estratificacin. Tales variables producen estratos que son
relativamente homogneas al interior, y por tanto reducen el error estndar.

Pregunta del instructor para sondeo: Si deseamos obtener los mismos resultados con una
muestra no estratificada de los que podramos obtener con una muestra estratificada, qu
modificaciones sera necesario hacerle a la muestra no estratificada para obtener la misma
precisin?
Respuesta sugerida al sondeo: La muestra no estratificada necesitara de una muestra ms
pequea.
7.

Por qu el muestreo estratificado reduce el error estndar?


Slo se usa la variabilidad interna de los estratos para calcular el error estndar, y
estas variabilidades son ms pequeas que la variabilidad global. Esto se debe a que
no son posibles ciertas medias de valores extremos en la distribucin muestral de las
medias.

Pregunta del instructor para sondeo: D algunos ejemplos de varios tipos de


caractersticas de estratificacin que puede usar un estudio de mercados para establecer un
estudio de muestra estratificada.
Respuesta sugerida al sondeo: Algunos ejemplos de caractersticas de estratificacin
incluyen tipo, modelo, sexo, edad, ocupacin y ubicacin geogrfica, como estado.
178

8.

Qu es muestreo por conglomerados?


El muestreo en el cual los conglomerados o grupos de elementos son muestreados al
mismo tiempo se llama muestreo por conglomerados.

Pregunta del instructor para sondeo: D algunos ejemplos de unidades de conglomerados.


Respuesta sugerida al sondeo: Algunos ejemplos de unidades de conglomerados incluyen
hogares con relacin a los miembros individuales, una escuela con relacin a los estudiantes
y un contenedor para embarque de un producto con relacin a cada producto individual.
9.

Qu son eficiencia estadstica y eficiencia global?


La eficiencia global (o eficiencia total) es una medicin de la eficiencia estadstica y
el costo de un procedimiento de muestreo. Es el tamao del error estndar por dlar.
La eficiencia estadstica se relaciona con el tamao del error estndar para un tamao
de la muestra dado.

Pregunta del instructor para sondeo: Cmo se relaciona el muestreo por conglomerados
con otros procedimientos de muestreo desde el punto de vista de la eficiencia global?
Respuesta sugerida al sondeo: Con frecuencia el muestreo por conglomerados es el
procedimiento global con ms eficiencia.
10.

Cmo se selecciona una muestra sistemtica?


El investigador selecciona cada k-simo elemento del marco, despus de un inicio
aleatorio en alguna parte dentro de los primeros k elementos donde k = N/n.

179

Pregunta del instructor para sondeo: Cul es el procedimiento de muestreo por


conglomerados de una etapa?
Respuesta sugerida al sondeo: Cuando se usan todos los elementos en el conglomerado
generado por muestreo sistemtico, se llama procedimiento de muestreo por conglomerados
de una etapa.
11.

Qu significa periodicidad? Cmo se genera y soluciona?


La periodicidad ocurre cuando la lista de elementos que conforman el marco forma un
patrn cclico que coincide con un mltiplo del tamao del intervalo muestral.
Es causada por tener un marco que tiene un ciclo especfico. Se soluciona al reordenar
el marco.

Pregunta del instructor para sondeo: Qu significa reordenar el marco?


Respuesta sugerida al sondeo: Reordenar el marco implica reacomodar los elementos de la
muestra en un orden diferente a fin de evitar la periodicidad.
12.

Cmo se presenta la estratificacin implcita?


Si el marco est ordenado con base en lo que podra utilizarse como una variable de
estratificacin, entonces la seleccin de una muestra sistemtica suministrar en forma
automtica una muestra estratificada.

Pregunta del instructor para sondeo: Por qu es ventajosa la estratificacin implcita


para el investigador?

180

Respuesta sugerida al sondeo: En vista de que los marcos ordenados ocurren en el


muestreo sistemtico, es muy fcil y conveniente si el marco ordenado se ordena con base en
lo que se usa como una muestra de estratificacin. De esta manera, no se requiere trabajo
adicional para estratificar la muestra.
13.

Qu es muestreo por reas?


La muestra por reas es un tipo de muestra por conglomerados en la cual se
seleccionan regiones geogrficas.

Pregunta del instructor para sondeo: Por qu los investigadores usan muestras por reas?
Respuesta sugerida al sondeo: En vista de que el listado preciso de los residentes y sus
patrones de compra y otros datos no estn disponibles, es importante encuestar una regin
geogrfica. Sin embargo, en vista de que los investigadores no pueden encuestar todas las
reas bajo investigacin, debe tomarse una muestra (por reas).
14.

Qu es muestreo por reas de mltiples etapas?


Aqu el proceso de enumerar unidades muestrales y la seleccin aleatoria de esta lista
ocurre repetidas veces. El nmero de veces que se enumera y selecciona es igual al
nmero de etapas en el proceso muestral.

Pregunta del instructor para sondeo: Exponga el potencial de error en el muestreo por
reas de mltiples etapas.
Respuesta sugerida al sondeo: El muestreo por reas de mltiples etapas es mucho menos
eficiente desde el punto de vista estadstico que el muestreo aleatorio simple. Un muestreo
de mltiples etapas de n etapas est sujeto a n errores de muestreo. Adems, es bastante
complejo calcular el error estndar para este tipo de muestreo.

181

15.

Cmo se obtiene una probabilidad igual de seleccin de elementos utilizando un


procedimiento de muestreo por reas de mltiples etapas?
1)

Una oportunidad igual de seleccin de unidades muestrales en cada etapa del


proceso sin importar qu tan grandes sean los conglomerados con relacin a los
otros.

2)

Seleccionar los conglomerados de la primera etapa con probabilidad proporcional


al tamao (PPT) y seleccionar el mismo nmero de unidades muestrales de cada
conglomerado seleccionado de la primera etapa. Para etapas ms all de la
segunda, seleccionar por mtodos de oportunidad iguales.

Pregunta del instructor para sondeo: Cul es una aplicacin comn de la tcnica PPT?
Respuesta sugerida al sondeo: Como sugiere el texto, es comn el uso de investigacin de
mercados que implica regiones geogrficas.
16.

Por qu algunas veces se obtienen probabilidades desiguales de la seleccin de


elementos?
1)

El investigador quiere hacer un anlisis de subgrupos detallado y por tanto toma


de manera intencional una muestra excesiva de este grupo.

2)

El investigador est realizando un muestreo estratificado no proporcional.

3)

Una muestra genera una proporcin ms pequea de un subgrupo particular que


la proporcin de la poblacin.

4)

En un diseo PPT, no se realiz el tamao esperado del conglomerado.

Pregunta del instructor para sondeo: Las probabilidades desiguales de la seleccin de


elementos pueden obstaculizar los esfuerzos del investigador para obtener datos lo ms
precisos posible?

182

Respuesta sugerida al sondeo: Las probabilidades desiguales no presentan problemas en


tanto el investigador est interesado en hacer slo anlisis intrasubgrupo.
17.

Cmo se hacen estimativos de una muestra total cuando los elementos tienen
probabilidades desiguales de seleccin?
Los elementos se asignan a un factor ponderado en proporcin al inverso de su
probabilidad de ser seleccionado.

Pregunta del instructor para sondeo: Demuestre cmo se calcula este factor de
ponderacin.
Respuesta sugerida al sondeo: Tomamos la probabilidad de seleccin, luego tomamos el
inverso matemtico y multiplicamos ese nmero por los valores de los subgrupos. Luego
tomamos la suma de los valores de los subgrupos y llegamos al tamao muestral ponderado.
18.

Describa los pasos en la marcacin aleatoria de dgitos.


1)

Usar procedimientos de muestreo por reas tan abajo hasta la ciudad o pueblo de
inters.

2)

Obtener los directorios telefnicos de las ciudades o pueblos seleccionados y


seleccionar en forma sistemtica una muestra de los nmeros telefnicos de los
directorios.

3)

Reemplazar el ltimo o los dos ltimos dgitos de estos nmeros seleccionados


por nmeros aleatorios.

4)

Llamar a los nmeros obtenidos.

Pregunta del instructor para sondeo: Cules son algunas desventajas del procedimiento
de marcacin aleatoria de dgitos?

183

Respuesta sugerida al sondeo: Algunas desventajas posibles incluyen: llegar al mismo


hogar debido a lneas mltiples y la posibilidad de llegar a computadoras, faxes u otros
dispositivos de comunicacin electrnicos en lugar de a una lnea de voz.
Para las preguntas 19 a la 21 prepare un diseo muestral. Asegrese de que su diseo
incluya una descripcin de cada uno de los siguientes aspectos y un enunciado de su
razonamiento.
a. La poblacin
b. El marco muestral
c. El tamao de la muestra
d. El procedimiento muestral (asegrese de incluir una descripcin paso por paso sobre
cmo se obtendr en realidad la muestra)
e. Un mtodo para determinar la exactitud de los resultados de la muestra
Note que para la parte c) los estudiantes deben abordar alguno de los problemas
cualitativos que surgieron al determinar la exactitud de los resultados de la muestra.
19.

Frank Jackson era el director de servicios estudiantiles en la escuela de administracin


de una importante universidad. Frank quera realizar una encuesta de estudiantes con
grado de Licenciado en Administracin de Empresas y Mster en Administracin de
Empresas, a fin de determinar sus actitudes hacia las propuestas de los cursos,
servicios de consejera disponibles y oportunidades de empleo. Haba un total de
3,000 estudiantes con grado de Licenciado en Administracin de Empresas y 700 con
Mster en Administracin de Empresas en la escuela de administracin. Como no era
posible un censo, Frank necesitaba desarrollar un diseo muestral.

184

a)

Poblacin

El principal problema relacionado con la definicin de la poblacin es si los


Licenciados en Administracin de Empresas y los Mster en Administracin de
Empresas son considerados como dos poblaciones diferentes o no. El argumento para
tratarlos como separados es que pueden sostener actitudes muy diferentes acerca de
los cursos, consejera, oportunidades y empleos. Estn en diferentes programas con
diferentes cursos, oportunidades, etc. Combinar sus actitudes puede slo formar un
punto medio entre dos segmentos distintos de actitud.
El argumento para tratar a los dos como una sola poblacin es que el inters puede
estar en la actitud global. Para nosotros esto parece un argumento ms dbil. Dos
poblaciones parece una mejor forma de proceder.
Las poblaciones pueden ser:
I.

A. Elementos estudiantes con grado de Licenciado en Administracin de


Empresas
B.

Unidades muestrales estudiantes con grado de Licenciado en


Administracin de Empresas

C.

Extensin la escuela en cuestin

D. Tiempo el semestre actual


II.

A. Elementos estudiantes con grado de Mster en Administracin de


Empresas
B.

Unidades muestrales estudiantes


Administracin de Empresas

C.

Extensin la escuela en cuestin

con

grado

de

Mster

en

D. Tiempo el semestre actual

185

Por supuesto que es posible combinar las dos poblaciones y slo tratar a los
estudiantes con grado de Licenciado en Administracin de Empresas y Mster en
Administracin de Empresas como dos subgrupos o estratos. A condicin de que los
resultados de los diferentes subgrupos no se combinen para dar estimados de muestra
total, sta es una forma apropiada de pensar.
b)

Marco muestral

Lo ms probable es que aqu se disponga de un marco ya hecho para ambas


poblaciones. Se trata de la lista de registro de: 1) estudiantes con grado de Licenciado
en Administracin de Empresas y 2) estudiantes con grado de Mster en
Administracin de Empresas.
c)

Tamao de la muestra

Es difcil ser definitivos acerca de la pregunta sobre el tamao de la muestra. Sin


embargo, los estudiantes deben estar preparados para dar una, y defenderla. Para
hacerlo, deben discutir: 1) el error muestral, 2) el error no muestral, 3) los objetivos de
estudio, 4) las restricciones de tiempo, 5) las restricciones de costos y 6) los planes de
anlisis de datos. Todos estos aspectos no se esbozan en el ejercicio. Sin embargo,
deben declarar sus suposiciones y ser claros acerca de ciertos aspectos; de manera
especfica: es probable que las restricciones de tiempo y costos sean severas, y es
probable que el anlisis de datos sea de la clase de una forma simple (por ejemplo, el
informe de la media de las puntuaciones de actitud).
Uno puede examinar la pregunta del tamao de la muestra desde un punto de vista
estadstico. Suponga una designada: 1) precisin absoluta de .25 (asumiendo que
estaremos usando una escala de clasificacin de 7 puntos, la cual se supone que
provee datos de intervalo), 2) al nivel de confianza de 95% y 3) la desviacin
estndar, s, es .75.

186

Entonces resolvemos la siguiente ecuacin para n, el tamao de la muestra requerido.


.25 = 2
.25 =

(.75)
n

1.50
n

.25 n = 1.50
n = 1.50/.25
n =6

n = 36
Los estudiantes que usen este tipo de procedimiento deben reconocer que tienen que
especificar una precisin y un nivel de confianza adems de asumir un valor de s.
Adems, deben discutirse el costo y otros factores junto con el hecho de que n = 36 no
permitira un anlisis de tabulacin cruzada, si se deseara.
d)

Procedimiento muestral

Aqu es posible el muestreo aleatorio simple dada la existencia de listas de


estudiantes. Sin embargo, este procedimiento es ineficiente desde el punto de vista del
esfuerzo de trabajo. La persona que seleccione los elementos estara saltando por toda
la lista mientras se seleccionan los nmeros aleatorios. Un mejor procedimiento sera
seleccionar una muestra sistemtica, ya que no hay razn para esperar un problema
con periodicidad en la lista. Adems, si se desea un anlisis de muestra combinada
(tanto con grados de Licenciado en Administracin de Empresas como con grados de
Mster en Administracin de Empresas), una muestra sistemtica producira una
muestra estratificada proporcionada, ya que no hay razn para esperar un problema
con periodicidad en la lista.

187

e)

Exactitud

La nica medicin de exactitud disponible es la del tamao del error muestral. El error
muestral puede medirse usando la frmula de intervalo de confianza:

s
para el intervalo de confianza de 95%.
n

En el flujo de la clase, algunos estudiantes pueden sugerir el uso de un procedimiento


de muestreo no probabilstico, por lo general una muestra por prorrateo. Debe quedar
claro que tiene poco sentido dada la facilidad con que se puede seleccionar una
muestra de probabilidad aqu, y el problema de la medicin del error con una muestra
por prorrateo.
20.

Sara Ranski es consultora de World Church Council. Una necesidad de informacin


del consejo consiste en desarrollar un perfil demogrfico de los miembros de las
iglesias en Estados Unidos. A Ranski se le ha pedido que desarrolle un diseo
muestral para facilitar la recoleccin de esta informacin.
a)

Poblacin

Una posible definicin de poblacin es como sigue:


A. Elementos adultos en listas de la iglesia
B. Unidades muestrales regiones del condado; ciudades y pueblos; secciones de
ciudades y pueblo; iglesias; adultos en listas de la iglesia
C. Extensin la parte continental de Estados Unidos
D. Tiempo algn periodo especfico.

188

Se plantearan preguntas acerca de la definicin de los elementos. Los adultos en listas


de la iglesia no necesariamente asisten a la iglesia y por consiguiente pueden no
desear ser incluidos. Sin embargo, cmo puede obtenerse una lista de aquellos que
asisten en realidad? Esto puede agregar una etapa en el procedimiento muestral donde
tendra que calificarse a aquellos que aparecen en listas de iglesia como asistentes y
luego seleccionarlos.
Las unidades muestrales especficas tambin pueden variar. El instructor debe estar
abierto a otras secuencias razonables.
b)

Marco muestral

En cada etapa de la muestra de mltiples etapas debe obtenerse una lista de las
unidades muestrales disponibles. Por tanto, debe obtenerse una lista de regiones, luego
una lista de ciudades y pueblos en las regiones seleccionadas, luego secciones de las
ciudades y pueblos seleccionados, luego iglesias dentro de las secciones seleccionadas
y, por ltimo, los adultos en las listas de las iglesias seleccionadas.
c)

Tamao de la muestra

Los factores a considerar en el tamao de la muestra son de nuevo: 1) error muestral,


2) error no muestral, 3) objetivos de estudio, 4) restricciones de tiempo, 5)
restricciones de costos y 6) planes de anlisis de datos. Algunos de estos puntos son
ambiguos en la situacin y por tanto deben ser claras las suposiciones del estudiante.
Hay dos puntos que deben considerarse. Primero, las frmulas estadsticas presentadas
en el texto no ayudan, ya que no se present ninguna para un problema de mltiples
etapas. En teora, uno puede derivar el error estndar para este proceso muestral y
resolver para un tamao de la muestra. Tendrn que designarse los niveles de
precisin e intervalo de confianza, la media y las desviaciones estndar esperadas en
las escalas de actitud.

189

Segundo, es probable que aqu el anlisis de datos no sera slo un anlisis univariado
simple. Son probables las tabulaciones cruzadas entre datos demogrficos y cosas
como denominacin, regin del pas, etc. Por tanto, el tamao de la muestra tendr
que ser lo bastante grande para acomodar este proceso, digamos entre 400 y 500
personas. Si las diferencias de denominacin detalladas son de inters, entonces el
tamao de la muestra tendr que ser an ms grande.
d)

Procedimiento muestral

Es claro que, con base en la exposicin hecha hasta ahora, este problema se presta
para un procedimiento de muestreo por rea de mltiples etapas. El ciclo de repeticin
de listar las unidades muestrales y seleccionarlas usando un procedimiento de
probabilidad continuar a travs de tantas etapas como sea necesario. El tiempo y
costo de desarrollar una lista completa de elementos de poblacin imposibilita un
procedimiento que no sea de mltiples etapas.
Algunos estudiantes pueden argumentar a favor de una muestra no probabilstica
debido a consideraciones de costo. El costo de obtener las listas requeridas puede ser
bastante alto en esta situacin. La prdida de entendimiento del error muestral es, por
supuesto, importante y debe discutirse. Podra plantearse aqu un buen argumento para
una muestra por prorrateo hecha con cuidado que controle la denominacin y la
regin del pas. La gran ventaja sera en el costo. Los estudiantes que sugieran una
muestra de reas de mltiples etapas debern estar preparados para declarar cmo
asegurarn una probabilidad igual en la seleccin de elementos. Seleccionar una
proporcin igual de unidades muestrales disponibles en cada etapa puede excluir
algunas regiones o ciudades grandes consideradas importantes desde el punto de vista
del perfil religioso. Por tanto, puede argumentarse a favor de usar la probabilidad
proporcional al tamao (PPT) en la primera etapa de la seleccin.

190

e)

Exactitud

Podra calcularse un intervalo de confianza en las mediciones demogrficas si se usa


un procedimiento muestral probabilstico. Para hacer esto tendran que usarse las
frmulas relevantes disponibles en libros de muestreo ms avanzados. Adems, el
anlisis ji cuadrado de tabulacin cruzada sera posible para probar asociaciones
significativas entre variables. Ningn procedimiento estara disponible si se usara un
procedimiento no probabilstico.
21.

Roy Lena era el gerente de producto para una nueva marca de cereal, llamado MultiVit, que actualmente estaba en desarrollo por una importante empresa de bienes
empacados, localizada en la ciudad de Nueva York. El producto contena vitaminas y
otros nutrientes no disponibles en otros cereales. Lena se encontraba en el proceso de
diseo de una prueba de uso del producto en los hogares. El objetivo de la prueba era
medir la reaccin de los adultos al sabor del producto. Los resultados de esta prueba
se utilizaran para perfeccionar an ms el producto, antes de ser sometido a pruebas
adicionales de mercado y en los hogares. El problema que enfrentaba Lena era disear
la muestra para la prueba de colocacin en los hogares.
a)

Poblacin

Es probable que aqu estar bien una poblacin local o regional cerca de las oficinas
de la compaa, ya que no hay razn para creer que las reacciones al gusto variarn
por regin. Por consiguiente, una definicin de poblacin sera:
A.

Elementos usuarios de cereal listo para comer

B.

Unidades muestrales hogares, usuarios de cereal listo para comer

C.

Extensin rea metropolitana de Minneapolis

D.

Tiempo algn periodo especfico

191

b)

Marco muestral

Un directorio de hogares en el rea metropolitana de Minneapolis formara el marco


en la primera etapa, luego los hogares seran calificados respecto a si est presente un
usuario de cereal listo para comer o no para formar la segunda etapa del marco.
c)

Tamao de la muestra

Dado el objetivo del estudio, se usara una muestra muy pequea, digamos entre 50150 personas. Slo se est probando el producto, no prediciendo su participacin en el
mercado.
d)

Procedimiento muestral

Todo lo que se present hasta ahora sostiene una muestra por conveniencia de dos
etapas. Se contactar a las familias, se determinar si est presente un usuario de
cereal listo para comer y se intentar solicitar cooperacin. Alguien podra argumentar
que sera mejor una muestra por prorrateo que controlara los aspectos demogrficos
de la audiencia objetivo (no especificadas en el ejercicio). Para hacer esto la familia
sera cuestionada sobre estas dimensiones antes de solicitar la cooperacin.
Aqu parece haber poca necesidad de procedimientos muestrales de probabilidad
complejos, dados los intercambios de costo y beneficio.
e)

Exactitud

Dados los procedimientos sugeridos, no puede determinarse la exactitud.


22.

De acuerdo con la seccin Investigacin de mercados en accin sobre STP/Lou


Harris, responda las siguientes preguntas:

192

a. Qu unidades muestrales se definieron a travs de este procedimiento? Cules


eran los marcos muestrales?
Las unidades muestrales eran residentes de Estados Unidos (sin incluir residentes
de Alaska y Hawai, prisioneros, estudiantes ni clrigos), estados, regiones y reas
metropolitanas, condados, divisiones/pueblos/ciudades civiles menores y nmeros
telefnicos. Los marcos muestrales fueron listas de cada tipo de unidad.
b. Por qu se utiliz la estratificacin?
La estratificacin de Estados Unidos sobre una base geogrfica les permite
asegurarse de tomar una muestra geogrficamente representativa de la poblacin
de Estados Unidos, y para correlacionar las diferencias entre los consumidores con
informacin geogrfica/demogrfica contenida en el censo.
c. Qu propsito haba al seleccionar ciudades o pueblos con probabilidad
proporcional a los estimativos de censos de sus respectivas poblaciones de
familias? Cmo se podra lograr esto?
El propsito era obtener una muestra de personas representativas del censo de
poblacin, al dar a reas metropolitanas grandes una probabilidad mayor de ser
seleccionadas. El procedimiento para seleccionar una muestra PPT se presenta en
forma clara en el texto.
d. Qu procedimientos muestrales alternativos se podran utilizar en este caso?
Para este tipo de investigacin, por lo comn se usa el prorrateo, e incluso el
muestreo por conveniencia. Son menos costosas que el procedimiento Harris/STP.
23.

Para la seccin Investigacin de mercados en accin sobre AT&T al comienzo de este


captulo:
193

a. Por qu la muestra se seleccion a partir de una poblacin estratificada?


Para controlar cualquier impacto en los pronsticos de ventas de los efectos
debidos al segmento del mercado y la exposicin a la variacin de niveles por
precio, promocin y distribucin. Esto habilita a AT&T para experimentar con la
variacin del precio, promocin y distribucin, para ver cul combinacin de
mezcla de variables de marketing funcionarn mejor para cada segmento de
consumidor.
b. Por qu el tamao de la muestra era superior a 2,600? Es ste el tamao de
muestra apropiado para este estudio?
S, el tamao de la muestra era apropiado. Con 16 grupos y 2,600 observaciones,
hay un promedio de 162 observaciones por grupo. Para hacer comparaciones
vlidas entre grupos, a la mayora de los estadsticos le gusta ver al menos 100
observaciones por grupo.
24.

MINICASO
Para el caso 4-1 titulado Milan Food Cooperative (A), la media de la poblacin para
gastos semanales en alimentos es US$43.20. Seleccione las muestras que se enumeran
a continuacin de estos datos y estime los gastos medios semanales en alimentos y el
intervalo de confianza de 95% asociado. Utilice la tabla A-1 en el apndice, al final
del libro, para obtener nmeros aleatorios.
a. Muestra aleatoria simple, n = 10
b. Muestra aleatoria simple, n = 30
c. Muestra estratificada, n = 10
d. Muestra sistemtica, n = 10
e. Muestra por conveniencia, n = 10
f. Muestra por prorrateo, n = 10
Qu conclusiones puede sacar acerca de cada uno de estos mtodos muestrales?

194

PROPSITO
Los propsitos de esta pregunta son 1) mejorar la comprensin de los estudiantes del
proceso de muestreo y 2) mejorar su capacidad para extraer muestras. Siguiendo los
procedimientos delineados en las clases, el estudiante extrae muestras de una poblacin y
compara sus resultados con los de otros estudiantes.
ANTECEDENTES
La pregunta presenta una poblacin de estudio completa (N = 500) organizada en un marco
muestral. El elemento de la poblacin es una familia. Cada familia se describe con referencia
a seis variables: 1) gastos semanales en alimentos, 2) nmero de personas en la familia, 3)
ingreso anual familiar, 4) educacin del jefe de familia, 5) edad del jefe de familia y 6) edad
de los hijos.
Los ejemplos ilustran la extraccin de muestras probabilsticas (muestreo aleatorio simple,
estratificado y sistemtico) y no probabilsticas (por conveniencia y prorrateo) de la
poblacin de estudio. Se us un programa de cmputo para calcular los estadsticos para un
nmero mayor de muestras extradas por estudiantes de la Universidad de Michigan usando
cada uno de los procedimientos de seleccin de muestras probabilsticos y no probabilsticas.
La seccin Resultados de computadora de la seleccin de muestras presenta la salida de
estos clculos. Usando esta salida de computadora, el instructor puede comparar los
estadsticos calculados a partir de cada una de sus muestras con los de un grupo grande de
estudiantes, y puede comparar tambin cada uno de los procedimientos de seleccin de
muestras basados en los resultados de computadora.
ESTRATEGIA DE ENSEANZA
Los clculos de muestra, hojas de trabajo y salida de computadora se encuentran en este
manual para usarse con este problema. El instructor puede copiar y repartir las hojas de
trabajo y hacer que los estudiantes completen los ejercicios de muestreo en su casa,
registrando los estadsticos de cada muestra en la seccin Resumen de clculos al final de la
hoja de trabajo. En clase, haga que varios estudiantes expongan sus resultados para cada tipo
de muestra, para ilustrar la variacin posible entre muestras seleccionadas con el mismo
mtodo de muestreo. Luego use los resultados de computadora para hacer generalizaciones
sobre las diferencias producidas por la eleccin del mtodo de muestreo.
195

Acerca de la salida de computadora


Para cada uno de los seis problemas de muestreo, se dispone de salida de computadora para
utilizarse en la exposicin en clase. La salida fue generada tomando 60 o ms muestras
usando cada procedimiento de seleccin y tabulando los resultados.
La tabla 1 contiene un resumen de los resultados (nmero de muestras, media, error estndar
y porcentaje en el intervalo de confianza) para cada uno de los procedimientos de muestreo.
Las figuras 1 a 10 presentan la distribucin de las medias muestrales para cada
procedimiento.
Las tablas 2 y 3 presentan una salida de computadora ms detallada producida por muestreo
aleatorio simple y por muestreo por conveniencia.
a)

Muestra aleatoria simple, n = 10


1.

Procedimiento: Seleccione de manera sistemtica 10 nmeros de tres dgitos en el


rango de 001 a 500 de la tabla de dgitos aleatorios proporcionada en el texto. La
siguiente ilustracin le muestra cmo calcular la media, la desviacin estndar y
el intervalo de confianza para los datos de gastos semanales en alimentos.

196

2.

Muestra de 10 familias:
Gasto ($)

100

75

5,625.00

375

37.5

1,406.25

084

30

900.00

128

20

400.00

310

86

7,396.00

118

20

400.00

099

40

1,600.00

441

30

900.00

125

22.5

506.25

154

75

X = 436
3.

X2

Nmero
aleatorio de
familia

5,625.00
X2 = 24,758.5

Media muestral:

X =

436
= 43.6
10

(media poblacional = $43.2)


4.

Desviacin estndar muestral:

( X )

s=

n 1

24,758.5
9

190,096
10
=

24,758.5 19,009.6
9
197

s=

5,748.9
= 638.8 = 25.27
9

(desviacin estndar poblacional = $20.9)


5.

Estimacin muestral de s X (desviacin estndar de la media muestral o error


estndar de la media):

sX =

s
n

25.27 25.27
=
3.16
10

= 8.0
6.

Estimacin del intervalo de (coeficiente de confianza del 95%; Z = 2):


X Z (s X ) X + Z (s X )

43.6 2(8) 43.6 + 2(8)


43.6 16 43.6 + 16
27.6 59.6
Nota: (43.2) aparece en este intervalo.

198

7.

Interpretacin del intervalo de confianza:


Si uno toma una gran cantidad de muestras aleatorias simples de esta poblacin y
construye un intervalo de confianza de 95% para cada una, alrededor de 95% de
estos enunciados ser correcto.

b)

Muestra aleatoria simple, n = 30


1.

Procedimiento: Seleccione de manera sistemtica 30 nmeros de tres dgitos en el


rango de 001 a 500 de la tabla de dgitos aleatorios que se proporciona en el
texto. Para este ejemplo, continuamos con la misma cadena de nmeros
aleatorios utilizada para la muestra anterior. Esto se hizo para resaltar las
diferencias en las medias, desviaciones estndar, errores estndar de la media e
intervalos de confianza producidos por diferentes tamaos de muestra.

2.

Muestra de 30 familias:
X2

Nmero
aleatorio de
familia

Gasto ($)

100

75

5,625.00

375

37.5

1,406.25

084

30

900.00

128

20

400.00

310

86

7,396.00

118

20

400.00

099

40

1,600.00

441

30

900.00

125

22.5

506.25

154

75

5,625.00

199

3.

424

75

5,625.00

235

37.5

1,406.25

044

12

005

46.5

2,162.25

359

45

2,025.00

460

81.00

321

30

900.00

195

40

1,600.00

451

75

5,625.00

331

35

1,225.00

186

60

3,600.00

116

15

225.00

483

37.5

1,406.25

196

45

2,025.00

093

50

2,500.00

340

22.5

455

45

2,025.00

020

32

1,024.00

053

15

225.00

035

34.5

1,190.00

X = 1,197.5

X2 = 60,278.75

144.00

506.25

Media muestral:

X =

X
n

1,197.5
= 39.91
30

200

4.

Desviacin estndar muestral:

( X )

s=
s=

n 1

60,278.5
29

1,197.5
30 =

60,278.5 47,800.2
29

12,748
29

s = 20.97
5.

Estimacin muestral de s X (desviacin estndar de la media muestral o error


estndar de la media):

sX =

s
n

20.97 20.97
=
5.48
30

= 3.83
6.

Estimacin del intervalo de (coeficiente de confianza del 95%; Z = 2):


X Z (s X ) X + Z (s X )

39.51 2(3.83) 39.51 + 2(3.83)

201

39.51 7.66 39.51 + 7.66


31.85 47.17
7.

Interpretacin del intervalo de confianza:


Si uno toma una gran cantidad de muestras aleatorias de esta poblacin y
construye un intervalo de confianza de 95% para cada una, alrededor de 95% de
estos enunciados sern correctos.
Al comparar este ejemplo con el anterior, note que la muestra mayor gener una
desviacin estndar ms pequea, un error estndar de la media ms pequeo y
un intervalo de confianza de 95% ms estrecho.

c)

Muestra estratificada (n = 10)


1.

Procedimiento:
a.

La poblacin de familias que se va a muestrear se subdivide (o estratifica) en


grupos que son mutuamente excluyentes pero que juntos incluyen todos los
elementos en la poblacin.

b.

Luego se elige una muestra aleatoria simple independiente de cada grupo o


estrato.

202

2.

Estratos y pesos:
Peso relativo del estrato

3.

Grupo de
educacin

104

20.8

102

3
4y5

Estrato

W1

20.4

W2

180

36.0

W3

114

22.8

W4

500

100.0

10

Nmero de familias por estrato:

Estrato

Nmero de familias

W1

001-104

W2

105-206

W3

207-386

W4

387-500

203

4.

Muestreo aleatorio de diez familias:


W1

W2

Nmero
aleatorio de
familias

Xst.1

Nmero
aleatorio de
familias

Xst.2

(1)

023

37.50

(1)

146

40.00

(2)

086

60.00

(2)

190

37.50
Xst.2 = 77.50

Xst.1 = 97.50

W3

W4

Nmero
aleatorio de
familias

Xst.3

Nmero
aleatorio de
familias

Xst.4

(1)

269

50.00

(1)

437

30.00

(2)

251

37.50

(2)

450

57.00

(3)

291

45.00

(4)

314

60.00

Xst.4 = 87.00

Xst.3 = 192.50
5.

Media del estrato muestral:

st.1

97.50
= 48.75
2

st.3

192.50
= 48.13
4

st.2

77.50
= 38.75
2

st.4

87.00
= 43.50
2

204

6.

Media muestral ( X st):


Media muestral en
el estrato
Estrato

Peso relativo del


estrato

st.j

(Wj)

Wj X st.j

48.8

.208

10.15

38.7

.204

7.89

48.1

.360

17.32

43.5

.228

9.91

1.000

d)

st

= 45.27

Sistemtico (n = 10)
1.

Procedimiento:
a.

Determine el nmero total de elementos en la poblacin (N = 500).

b.

Divida esta cifra entre el tamao de muestra deseado (500 10 = 50).

c.

El resultado se llama intervalo muestral (50).

d.

Seleccione un nmero aleatorio de 1 hasta el intervalo muestral de 50.

e.

Esto identifica al primer elemento en la lista que se va a incluir en la


muestra.

f.

Sume a este nmero aleatorio el intervalo muestral.

g.

El resultado identifica al segundo elemento que se va a incluir en la muestra.

h.

Contine sumando el intervalo y tomando los elementos identificados de


esta manera hasta que se extraiga la muestra (n = 10).

205

2.

Muestreo sistemtico de diez familias:


a.

Nmero aleatorio = 23

b.

Muestra
Nmero aleatorio
de familia

Gasto

(1)

23

37.50

(2)

73

24.00

(3)

123

45.00

(4)

173

27.00

(5)

223

30.00

(6)

273

50.00

(7)

323

22.50

(8)

373

52.50

(9)

423

75.00

(10)

473

60.00

X = 423.50
3.

Media muestral:
X =

423.5
= 42.4
10

206

e)

Muestra por conveniencia (n = 10)


1.

Procedimiento: Seleccione 10 nmeros de familias en una manera conveniente


para usted. En la siguiente ilustracin, la seleccin implic ir a la tercera pgina
del conjunto de datos adjunto y seleccionar de manera arbitraria 10 familias (119
a 128).

2.

Muestra por conveniencia de 10 familias:


Nmero de
familia

Gasto
X

(1)

119

50

(2)

120

57

(3)

121

47

(4)

122

48

(5)

123

45

(6)

124

15

(7)

125

22.5

(8)

126

52.5

(9)

127

15

(10)

128

20
X = 372

3.

Media muestral:
X =

372
= 37.2
10

207

f)

Muestra por prorrateo (n = 10)


1.

Muestra por prorrateo variable de dos controles: Distribucin de la poblacin por


ingreso y nmero de personas en la familia
Nmero de personas en la familia
Ingreso anual ($)

1o2

3o4

5 o ms

Menos de
6,000

84

43

25

6,000 a
14,999

59

107

81

15,000 y
ms

26

44

31
N = 500

2.

Asignacin de la muestra entre celdas (n = 10)


Para n = 10, una familia por celda y las familias restantes asignadas a la celda
mayor.

3.

Procedimiento:
a.

Escoja un punto de partida arbitrario y busque familias que cumplan con los
requisitos del prorrateo.

208

4.

Muestra por prorrateo de 10 familias:


Nmero de
familia

Gasto
X

(1)

119

50.0

(2)

181

45.0

(3)

282

69.0

(4)

144

40.0

(5)

171

55.0

(6)

187

37.5

(7)

154

75.0

(8)

218

30.0

(9)

257

45.0

(10)

383

54.0
X = 500.5

3.

Media muestral:
X =

500.5
= 50.0
10

Uso de nmeros aleatorios


Los procedimientos de seleccin de muestras probabilsticas usan un conjunto de nmeros
aleatorios para seleccionar los elementos de la poblacin. Esta lista, como su nombre
implica, est compuesta por nmeros que no tienen un patrn de ocurrencia. Cualquier
nmero tiene la misma probabilidad de aparecer en cualquier punto de la tabla que cualquier
otro.

209

En el Conjunto de datos de poblaciones, cada familia es identificada por un nmero de


identificacin de familias de tres dgitos que van de 001 a 500. Por tanto, podemos usar la
tabla de dgitos aleatorios para que nos d un nmero de tres dgitos en el rango de 001 a 500
para seleccionar un elemento para la muestra. Usaramos tantos de estos nmeros de tres
dgitos como deseemos en la muestra.
Un ejemplo ayudar a aclarar esto. Suponga que deseamos seleccionar una muestra con n =
5. Si comenzamos en la tabla de dgitos aleatorios en un punto arbitrario en la fila 11,
columnas 16 y 17 (primeros dos dgitos de la columna 16 y el primer dgito de la columna
17) y nos movemos en forma vertical hacia abajo de las columnas, seleccionaramos una
muestra consistente de los elementos 294, 184, 211, 455 y 436. stos son los primeros cinco
nmeros de tres dgitos en el rango de 001 a 500 que encontramos. En consecuencia, hemos
seleccionado en forma aleatoria un tamao de muestra de 5 de una poblacin de tamao 500.

210

Nombre _____________________________________
HOJAS DE TRABAJO PARA LA SELECCIN DE MUESTRAS
Mtodo de muestreo probabilstico
A.

Muestreo aleatorio simple


1.

Muestra de 10 familias:
Nmero
aleatorio de
familia

Gasto ($),
X

X2

(1)

__________

__________

__________

(2)

__________

__________

__________

(3)

__________

__________

__________

(4)

__________

__________

__________

(5)

__________

__________

__________

(6)

__________

__________

__________

(7)

__________

__________

__________

(8)

__________

__________

__________

(9)

__________

__________

__________

(10)

__________

__________

__________

X =

X2 =

211

Nombre _____________________________________
2.

Media muestral:

X =

X
n

(media poblacional = $43.2)


3.

Desviacin estndar muestral:

( X )

s=

n 1

(desviacin estndar de la poblacin = $20.9)

212

Nombre _____________________________________
B.

Muestreo aleatorio simple


1.

Muestra de 30 familias:
Nmero de
familia
aleatorio

Gasto ($),
X

(1)

__________

__________

__________

(2)

__________

__________

__________

(3)

__________

__________

__________

(4)

__________

__________

__________

(5)

__________

__________

__________

(6)

__________

__________

__________

(7)

__________

__________

__________

(8)

__________

__________

__________

(9)

__________

__________

__________

(10)

__________

__________

__________

(11)

__________

__________

__________

(12)

__________

__________

__________

(13)

__________

__________

__________

(14)

__________

__________

__________

(15)

__________

__________

__________

(16)

__________

__________

__________

(17)

__________

__________

__________

X2

213

Nombre _____________________________________
Nmero de
familia
aleatorio

Gasto ($),
X

(18)

__________

__________

__________

(19)

__________

__________

__________

(20)

__________

__________

__________

(21)

__________

__________

__________

(22)

__________

__________

__________

(23)

__________

__________

__________

(24)

__________

__________

__________

(25)

__________

__________

__________

(26)

__________

__________

__________

(27)

__________

__________

__________

(28)

__________

__________

__________

(29)

__________

__________

__________

(30)

__________

__________

__________

X =

2.

X2

X =

Media muestral:

X =

X
n

(media poblacional = $43.2)


214

Nombre _____________________________________
3.

Desviacin estndar muestral:

( X )
x n

s=

n 1

(desviacin estndar poblacional = $20.9)


4.

Estimacin muestral de s X (error estndar de la media):

sX =

5.

s
=
n

Estimacin del intervalo de (coeficiente de confianza del 95%; Z = 2):


X Z (s X ) X + Z (s X )

Aparece (43.2) en este intervalo?

No

(encierre una en un crculo)

215

Nombre _____________________________________
C.

Muestreo estratificado
1.

Muestra de 10 familias:
W1

W2

Nmero
aleatorio de
familias

Nmero
aleatorio de
familias

Xst.1

Xst.2

(1)

__________ __________ (1)

__________ __________

(2)

__________ __________ (2)

__________ __________

Xst.1 = __________

Xst.2 = __________

W3

W4

Nmero
aleatorio de
familias

Nmero
aleatorio de
familias

Xst.3

Xst.4

(1)

__________ __________ (1)

__________ __________

(2)

__________ __________ (2)

__________ __________

(3)

__________ __________

(4)

__________ __________

Xst.4 = __________

Xst.3 = __________

216

Nombre _____________________________________
2.

3.

Media del estrato muestral:


X

st.1

st.2

st.3

st.4

Media muestral ( X st.j):


Media muestral en
el estrato
Estrato

st.j

Peso relativo del


estrato
(Wj)

Wj X st.j

W1

__________

.208

__________

W2

__________

.204

__________

W3

__________

.360

__________

W4

__________

.228

__________

1.000

st

217

Nombre _____________________________________
D.

Muestreo por conglomerado Sistemtico


1.

Muestra de 10 familias:
a.

Nmero aleatorio = __________


Nmero aleatorio
de familia

Gasto
X

(1)

__________

__________

(2)

__________

__________

(3)

__________

__________

(4)

__________

__________

(5)

__________

__________

(6)

__________

__________

(7)

__________

__________

(8)

__________

__________

(9)

__________

__________

(10)

__________

__________
X =

2.

Media muestral:

X =

X
n

(media poblacional = $43.2)

218

Nombre _____________________________________
E.

Muestra por conveniencia


1.

Muestra de 10 familias:
Nmero aleatorio
de familia

Gasto
X

(1)

__________

__________

(2)

__________

__________

(3)

__________

__________

(4)

__________

__________

(5)

__________

__________

(6)

__________

__________

(7)

__________

__________

(8)

__________

__________

(9)

__________

__________

(10)

__________

__________
X =

2.

Media muestral:

X =

X
n

(media poblacional = $43.2)

219

Nombre _____________________________________
3.

Desviacin estndar muestral:

( X )

s=

n 1

(desviacin estndar de la poblacin = $20.9)


4.

Estimacin de la muestra de s X (error estndar de la media):

sX =

5.

s
=
n

Estimacin del intervalo de (coeficiente de confianza de 95%; Z = 2):


X Z (s X ) X + Z (s X )

Aparece (43.2) en este intervalo?

No

(encierre una en un crculo)

220

Nombre _____________________________________
F.

Muestra por prorrateo


1.

Muestra de 10 familias:
Nmero aleatorio
de familia

Gasto
X

(1)

__________

__________

(2)

__________

__________

(3)

__________

__________

(4)

__________

__________

(5)

__________

__________

(6)

__________

__________

(7)

__________

__________

(8)

__________

__________

(9)

__________

__________

(10)

__________

__________
X =

2.

Media muestral:

X =

X
n

(media poblacional = $43.2)

221

Nombre _____________________________________
Resumen de clculos
Procedimiento de muestreo
Muestreo aleatorio
simple
n = 10

n = 30

Por
Por
Estratificado Sistemtico conveniencia prorrateo
n = 10

n = 10

n = 10

n = 10

Media
muestral

Desviacin
estndar

El
intervalo
de
confianza
incluye a
?
(S

No)

222

RESULTADOS DE COMPUTADORA DE LA SELECCIN DE MUESTRAS


Tabla de contenido
1.

Tabla 1

Resumen de resultados

2.

Figura 1

Muestra aleatoria simple (n = 10)

3.

Figura 2

Muestra aleatoria simple (n = 30)

4.

Figura 3

Muestra estratificada (n = 10)

5.

Figura 4

Muestra estratificada (n = 30)

6.

Figura 5

Muestra sistemtica (n = 10)

7.

Figura 6

Muestra sistemtica (n = 30)

8.

Figura 7

Muestra por conveniencia (n = 10)

9.

Figura 8

Muestra por conveniencia (n = 30)

10.

Figura 9

Muestra por prorrateo (n = 10)

11.

Figura 10 Muestra por prorrateo (n = 30)

12.

Tabla 2

Salida de computadora: Muestra aleatoria simple (n = 30)

13.

Tabla 3

Salida de computadora: Muestra por conveniencia (n = 30)

223

Tabla 1 Resumen de resultados


Nmero de Media de las Error estndar Porcentaje de en el
muestras
muestras
de la media
intervalo de confianza
Muestra aleatoria
simple (n = 10)

64

$42.6

6.45

92.2%

Muestra aleatoria
simple (n = 30)

62

$43.7

3.61

93.5%

Muestra estratificada
(n = 10)

64

$44.0

6.43

92.2%

Muestra estratificada
(n = 30)

61

$43.7

3.79

96.7%

Muestra sistemtica
(n = 10)

65

$41.6

5.75

90.8%

Muestra sistemtica
(n = 30)

62

$43.4

3.72

100.0%

Muestra por
conveniencia
(n = 10)

65

$43.6

6.05

75.4%

Muestra por
conveniencia
(n = 30)

60

$42.9

3.60

75.0%

Muestra por
prorrateo (n = 10)

63

$44.2

6.07

90.5%

Muestra por
prorrateo (n = 30)

61

$44.0

3.68

100.0%

224

Media pob.
Nmero de muestras
Media de las muestras
Error est. de la media
en int. de confianza

=
=
=
=
=

43.2
64
42.6
6.45
92.2%

Media pob.
Nmero de muestras
Media de las muestras
Error est. de la media
en int. de confianza

=
=
=
=
=

43.2
62
43.7
3.61
93.5%

Proporcin
de
muestras

Media muestral ($)

Figura 1 Muestra aleatoria simple (n = 10)

Proporcin
de
muestras

Media muestral ($)

Figura 2 Muestra aleatoria simple (n = 30)


225

Media pob.
Nmero de muestras
Media de las muestras
Error est. de la media
en int. de confianza

=
=
=
=
=

43.2
64
44.0
6.43
92.2%

Media pob.
Nmero de muestras
Media de las muestras
Error est. de la media
en int. de confianza

=
=
=
=
=

43.2
61
43.7
3.79
96.7%

Proporcin
de
muestras

Media muestral ($)

Figura 3 Muestra estratificada (n = 10)

Proporcin
de
muestras

Media muestral ($)

Figura 4 Muestra estratificada (n = 30)


226

Media pob.
Nmero de muestras
Media de las muestras
Error est. de la media
en int. de confianza

=
=
=
=
=

43.2
65
41.6
5.75
90.8%

Media pob.
Nmero de muestras
Media de las muestras
Error est. de la media
en int. de confianza

=
=
=
=
=

43.2
62
43.4
3.72
100%

Proporcin
de
muestras

Media muestral ($)

Figura 5 Muestra sistemtica (n = 10)

Proporcin
de
muestras

Media muestral ($)

Figura 6 Muestra sistemtica (n = 30)


227

Media pob.
Nmero de muestras
Media de las muestras
Error est. de la media
en int. de confianza

=
=
=
=
=

43.2
65
43.6
6.05
75.4%

Proporcin
de
muestras

Media muestral ($)

Figura 7 Muestra por conveniencia (n = 10)


Media pob.
Nmero de muestras
Media de las muestras
Error est. de la media
en int. de confianza

=
=
=
=
=

43.2
60
42.9
3.60
75%

Proporcin
de
muestras

Media muestral ($)

Figura 8 Muestra por conveniencia (n = 30)


228

Media pob.
Nmero de muestras
Media de las muestras
Error est. de la media
en int. de confianza

=
=
=
=
=

43.2
63
44.2
6.07
90.5%

Proporcin
de
muestras

Media muestral ($)

Figura 9 Muestra por prorrateo (n = 10)


Media pob.
Nmero de muestras
Media de las muestras
Error est. de la media
en int. de confianza

=
=
=
=
=

43.2
61
44.0
3.68
100%

Media muestral ($)

Figura 10 Muestra por prorrateo (n = 30)


229

Tabla 2 Muestras aleatorias simples de 30 casos*


MEDIA

ERROR EST. DE LA MEDIA INTERVALO DE CONFIANZA

43.15

4.2099

34.73-51.57

44.90

3.2395

38.42-51.38

45.40

4.6985

36.00-54.80

49.57

3.4537

42.66-56.47

41.45

2.9575

35.53-47.37

42.23

2.6683

36.90-47.57

48.50

4.7611

38.98-58.02

45.05

3.2358

38.58-51.52

41.32

2.7417

35.83-46.80

51.95

3.6000

44.75-59.15

11111

47.53

3.8684

39.80-55.27

42.28

4.3186

33.65-50.82

37.68

2.4388

32.81-42.56

11111

45.32

4.7707

35.78-54.86

35.13

2.4171

30.30-39.97

11111

49.55

3.8031

41.94-57.16

44.17

2.9504

38.27-50.07

36.37

3.0412

30.28-42.45

11111

37.50

3.5242

30.45-44.55

43.33

3.6012

36.13-50.54

47.90

3.7679

40.36-55.44

41.38

2.9920

35.40-47.37

47.57

3.5630

40.44-54.69

40.30

4.0177

32.26-48.34

44.12

3.2108

37.70-50.54

39.17

2.6162

33.93-44.40

39.18

3.3552

32.53-45.83

41.92

2.7490

36.42-47.41

230

Tabla 2 Muestras aleatorias simples de 30 casos* (continuacin)


MEDIA

ERROR ESTNDAR. DE LA INTERVALO DE CONFIANZA


MEDIA

44.48

2.5028

39.48-49.49

46.93

3.7234

39.49-54.38

45.12

4.0732

36.97-53.26

43.88

3.9478

35.99-51.78

44.57

4.1746

36.22-52.92

44.13

3.8023

36.53-51.74

46.40

3.8566

38.69-54.11

43.03

4.6926

33.65-52.42

44.57

3.7030

37.16-51.97

42.40

3.5064

35.39-49.41

46.05

4.4272

37.20-54.90

51.83

4.7911

42.25-61.42

40.03

4.2141

31.61-48.46

45.05

3.5235

38.00-52.10

42.03

4.4319

33.17-50.90

44.12

4.5250

35.07-53.17

49.32

4.6731

39.97-58.66

46.93

3.8023

39.33-54.54

42.75

3.2364

36.28-49.22

45.48

3.5953

38.29-52.67

46.50

3.7164

39.07-53.93

41.67

2.7407

36.19-47.15

39.65

2.7068

34.24-45.06

47.00

3.7759

39.45-54.55

1 indica que la media poblacional cae dentro del intervalo; 11111 indica que la media
poblacional no cae dentro del intervalo
231

Tabla 3 Muestras por conveniencia de 30 casos


MEDIA

ERROR EST. DE LA MEDIA INTERVALO DE CONFIANZA

50.83

3.9337

42.97-58.70

52.55

3.6086

45.33-59.77

11111

51.08

3.9171

43.25-58.92

11111

36.92

2.1683

32.58-41.25

11111

50.50

3.9355

42.63-58.37

20.77

2.1184

16.53-25.00

11111

42.03

4.2657

33.50-50.56

41.62

4.0817

33.45-49.78

46.08

4.2997

37.48-54.68

35.60

3.9515

27.70-43.50

43.24

3.9458

35.35-51.13

55.97

4.0798

47.81-64.13

11111

43.53

4.2503

35.03-52.03

40.72

3.6191

33.48-47.95

46.82

4.0205

38.78-54.86

36.88

2.4927

31.90-41.87

11111

48.93

3.0886

42.76-55.11

51.77

2.9559

45.85-57.68

11111

38.68

2.4662

33.75-43.62

48.93

3.0886

42.76-55.11

45.28

3.2817

38.72-51.85

28.07

3.6801

20.71-35.43

11111

46.20

3.1253

39.95-52.45

48.37

4.7530

38.86-57.87

50.50

3.9355

42.63-58.37

39.48

3.1492

33.18-45.78

39.02

2.8358

33.35-44.69

38.62

2.9027

32.81-44.42

232

Tabla 3 Muestras por conveniencia de 30 casos (continuacin)


MEDIA

ERROR EST. DE LA MEDIA INTERVALO DE CONFIANZA

37.13

4.1017

28.93-45.34

43.63

3.9944

35.64-51.62

45.95

3.4997

38.95-52.95

36.72

2.5162

31.68-41.75

11111

44.50

5.1851

34.13-54.87

42.13

3.7422

34.65-49.62

46.13

3.2478

39.64-52.63

43.63

3.0695

37.49-49.77

41.12

3.4571

34.20-48.03

34.10

3.7280

26.64-41.56

11111

35.60

3.9515

27.70-43.50

44.63

3.3273

37.98-51.29

46.63

3.2175

40.20-53.07

52.08

3.6474

44.79-59.38

11111

43.63

4.0405

35.55-51.71

40.38

4.5304

31.32-49.44

50.42

5.6712

39.07-61.76

35.60

3.9515

27.70-43.50

44.00

5.3473

33.31-54.69

51.13

2.9852

45.16-57.10

11111

38.00

3.8845

30.23-45.77

47.42

2.8877

41.64-53.19

233

Nombre _____________________________________
HOJAS DE TRABAJO PARA LOS RESULTADOS DE COMPUTADORA
1.

Revise el resumen de resultados en la tabla 1. Las figuras 1-10 presentan la


distribucin de las medias muestrales para cada procedimiento. Qu conclusiones
pueden obtenerse de estos resultados?

2.

Bajo qu condiciones el procedimiento de muestreo estratificado no exhibira ms


eficiencia que el procedimiento de muestreo aleatorio simple?

3.

Compare los resultados de computadora para los procedimientos de muestreo


estratificado y aleatorio simple (figuras 1 a 4). Concluira que la eficiencia del
procedimiento de muestreo estratificado fue mejor que la del procedimiento de
muestreo aleatorio simple? Apoye su posicin.

234

4.

En el muestreo estratificado, la educacin se seleccion como la variable


estratificadora. Cul otra variable sera mejor? Apoye su posicin.

5.

El intervalo de confianza de 95% para el muestreo sistemtico (n = 30) inclua a


para todas las muestras (vase la tabla 1). Qu caractersticas de la poblacin
enlistada contribuye a esta exactitud?

6.

Qu condicin debe existir para que la muestra por conveniencia sea considerada una
muestra aleatoria simple?

235

7.

Compare los resultados de computadora para las muestras por conveniencia y


aleatoria simple (figuras 1, 2, 7 y 8). Concluira que esta condicin especial (vase la
pregunta 6) existe para estos datos? Apoye su posicin.

8.

Por qu result tan bien el procedimiento de muestreo por prorrateo (n = 30)? (Vase
la tabla 1.)

9.

Las tablas 2 y 3 presentan resultados de muestras individuales de un programa de


computadora que calcula las medias y los intervalos de confianza e indica si la media
poblacional () fue incluida en el intervalo de confianza. En la columna de la derecha,
un 1 indica que fue incluida en el intervalo de confianza, mientras que cinco 1
indican que no se incluy en el intervalo de confianza. Compare los resultados de
computadora para la muestra aleatoria simple (tabla 2) y la muestra por conveniencia
(tabla 3). A qu conclusin puede llegar respecto a la razn por la que algunas
muestras no incluyeron a en el intervalo de confianza?

236

Respuestas a las preguntas proporcionadas en las


hojas de trabajo para los resultados de computadora
1.

Revise el resumen de resultados en la tabla 1. Las figuras 1-10 presentan la


distribucin de las medias muestrales para cada procedimiento. Qu conclusiones
pueden obtenerse de estos resultados?
a.

Media de las muestras:


1)

b.

Error estndar de la media


1)

c.

d.

La media de las muestras para n = 30 tiende a estar ms cerca de ($43.2)


que para n = 10.

El error estndar de la media para n = 30 es considerablemente menor que


para n = 10.

Porcentaje incluido en el intervalo de confianza:


1)

El intervalo de confianza inclua a la media poblacional en un mayor grado


cuando n = 30 que cuando n = 10.

2)

Los mtodos de muestreo probabilstico funcionaron mejor que los mtodos


de muestreo no probabilstico (con la excepcin del prorrateo, n = 30).

3)

La muestra por conveniencia (n = 10, n = 30) fue el peor mtodo.

Distribucin de medias muestrales:


Tanto los procedimientos de muestreo probabilsticos como los no probabilsticos
exhiben distribuciones en forma aproximada de campana. Las muestras de n = 30
exhiben formas de campana mejores que las de n = 10.

2.

Bajo qu condiciones el procedimiento de muestreo estratificado no exhibira ms


eficiencia que el procedimiento de muestreo aleatorio simple?
a.

Donde la variable estratificadora (educacin) no se correlaciona con los gastos de


alimentos.

237

b.

3.

4.

Entre mayor es la correlacin es ms eficiente el procedimiento en comparacin


con el muestreo aleatorio simple.

Compare los resultados de computadora para los procedimientos de muestreo


estratificado y aleatorio simple (figuras 1 a 4). Concluira que la eficiencia del
procedimiento de muestreo estratificado fue mejor que la del procedimiento de
muestreo aleatorio simple? Apoye su posicin.
a.

No.

b.

Apoyo:
1)

La distribucin de las medias muestrales (error estndar de la media) es


similar para los procedimientos aleatorio y estratificado.

2)

El porcentaje de en el intervalo de confianza es similar para los


procedimientos aleatorio y estratificado.

3)

La correlacin entre la variable estratificadora (educacin) y los gastos en


alimentos parece ser baja (la correlacin real es r = .23).

En el muestreo estratificado, la educacin se seleccion como la variable


estratificadora. Cul otra variable sera mejor? Apoye su posicin.
a.

El nmero en la familia sera una mejor variable estratificadora.

b.

Apoyo:
1)

5.

Esperara una correlacin mayor con el nmero de personas en la familia


que con la educacin debido a la asociacin causal lgica entre el nmero de
personas que se tienen que alimentar, la necesidad de alimento y la cantidad
gastada en alimentos. (La correlacin para educacin es r = .23 mientras que
para el nmero de personas en la familia es r = .43.)

El intervalo de confianza de 95% para el muestreo sistemtico (n = 30) inclua a


para todas las muestras (vase la tabla 1). Qu caractersticas de la poblacin
enlistada contribuye a esta exactitud?
238

6.

a.

La poblacin enlistada contiene un ciclo til, aunque imperfecto, por el nmero


de personas en la familia, una variable de estratificacin excelente.

b.

Tomar una muestra sistemtica de una poblacin estratificada producir una


muestra ms eficiente que una muestra sistemtica tomada de un listado de
poblacin aleatorio. Esto asume que hay alguna correlacin entre la variable
estratificadora y la variable de inters.

Qu condicin debe existir para que la muestra por conveniencia sea considerada una
muestra aleatoria simple?
a.

7.

8.

El listado de la poblacin debe ser aleatorio.

Compare los resultados de computadora para las muestras por conveniencia y


aleatoria simple (figuras 1, 2, 7 y 8). Concluira que esta condicin especial (vase la
pregunta 6) existe para estos datos? Defienda su posicin.
a.

No.

b.

Apoyo:
1)

El rango de las medias muestrales es mayor para las muestras por


conveniencia (n = 10, n = 30).

2)

El porcentaje incluido en el intervalo de confianza es menor para las


muestras por conveniencia (n = 10, n = 30).

3)

El listado de poblacin agrupado por educacin y un tanto por nmero de


personas en la familia.

Por qu result tan bien el procedimiento de muestreo por prorrateo (n = 30)? (Vase
la tabla 1.)
a.

Las variables de control de ingreso y nmero de personas en la familia tienen una


asociacin lgica con la cantidad de gasto en alimentos. (Las correlaciones reales
son: ingreso r = .38, nmero de personas en la familia r = .43.)

239

b.

9.

Estas dos variables de control descartan muchas combinaciones de muestras no


representativas.

Las tablas 2 y 3 presentan resultados de muestra individuales de un programa de


computadora que calcula las medias y los intervalos de confianza e indica si la media
poblacional () fue incluida en el intervalo de confianza. En la columna de la derecha,
un 1 indica que fue incluida en el intervalo de confianza, mientras que cinco 1
indican que no se incluy en el intervalo de confianza. Compare los resultados de
computadora para la muestra aleatoria simple (tabla 2) y la muestra por conveniencia
(tabla 3). A qu conclusin puede llegar respecto a la razn por la que algunas
muestras no incluyeron a en el intervalo de confianza?
a.

La media de la muestra del valor extremo combinada con el error estndar


promedio o por debajo del promedio de la media.

b.

Media muestral razonablemente representativa combinada con un error estndar


de la media por debajo del promedio.

TCNICA DE ENSEANZA
Hemos encontrado que es til comenzar una clase sobre esta cuestin haciendo un
sondeo de la clase con respecto a si el intervalo de confianza de las muestras tomadas por los
integrantes de la clase contiene a la media poblacional o no. Haga esto para:
1)

Muestra aleatoria simple, n = 10.

2)

Muestra aleatoria simple, n = 30.

3)

Muestra por conveniencia, n = 10.

240

Luego haga notar con rapidez a la clase el porcentaje de intervalos de confianza de


cada uno de los puntos 1-3 anteriores que contienen la media poblacional verdadera. Estos
porcentajes podran compararse luego con el resumen de resultados en la tabla 1 de la
seccin Resultados de computadora para la seleccin de muestras. Es probable que sus
resultados sean muy parecidos a los de la tabla 1 con excepcin de la muestra por
conveniencia, n = 10. Nuestra experiencia indica que aqu los resultados pueden variar
mucho. Por tanto, su clase puede encontrar que menos de 50% de los intervalos de confianza
de la muestra por conveniencia (n = 10) contiene la media poblacional.
Una vez que se hace esto, la clase procedera a responder una por una las preguntas de
las Hojas de trabajo para los resultados de computadora.
Esta cuestin abarca por lo general ms de un periodo de clase completo. El instructor
puede desear reservar algn tiempo al final para un repaso breve sobre muestreo. Esto podra
ayudar a robustecer los conocimientos sobre muestreo que, hemos encontrado, siempre
surgen con el uso de este ejercicio.

241

You might also like