You are on page 1of 0

Probabilidades y Estadstica

Edmundo Pea Rozas, Juan Garcs Seguel


1
Muestreo

En general, una poblacin es un conjunto finito o infinito de personas, animales o cosas (por ejemplo historiales
clnicos) que presentan caractersticas comunes y sobre las cuales se realiza alguna investigacin. Dicho de
una manera un poco ms rigurosa, una poblacin se puede definir como la totalidad de valores posibles
(mediciones o conteos) de una caracterstica particular, de un grupo claramente especificado de personas,
animales o cosas que se desean estudiar.

El grupo especificado de objetos se llama Universo, y corresponde a la totalidad de elementos o caractersticas
que conforman el mbito de un estudio o investigacin. Obviamente, un universo puede tener varias
poblaciones asociadas con l.

En general, no se hace mayor distincin entre poblacin y universo, hablando simplemente de poblacin o
universo, de tal manera que podemos definir una poblacin como el conjunto de elementos que poseen una
o ms caractersticas bien definidas, sobre las cuales deseamos hacer alguna inferencia, donde los
elementos que componen la poblacin y sobre los cuales se toman las mediciones se denominan
unidades elementales.

Las poblaciones pueden ser finitas o infinitas, una poblacin infinita corresponde a un nmero muy grande de
unidades elementales, de tal manera que no es posible obtener informacin de la totalidad de ella, por lo que
cualquier decisin debe basarse solo en la informacin obtenida a partir de una fraccin de dicha poblacin;
una poblacin finita en cambio es aquella que no es indefinidamente grande y que por lo mismo, contiene un
nmero finito de unidades elementales.

En principio uno puede pensar que al hacer una investigacin, el ptimo es medir las caractersticas de inters
de toda la poblacin, sin embargo, en algunos casos esto es imposible o al menos muy difcil debido a la
imposibilidad prctica de efectuar mediciones sobre el total de las unidades elementales que componen cierta
poblacin, o al alto costo en tiempo, dinero y en general de recursos que ello implica. El trabajar con una
muestra sugiere ciertas ventajas respecto del censo, a saber, Menor costo, Mayor rapidez, Mayor exactitud y
mayores posibilidades.

Para conocer las caractersticas de la poblacin, existen mtodos distintos al censo cuyos costos en tiempo,
personal y dinero se reducen considerablemente. Estos mtodos consisten bsicamente en tomar una
muestra, que en un sentido amplio no es ms que considerar una fraccin o subconjunto de la poblacin y
los resultados que de ah se obtienen, extrapolarlos a la totalidad de la poblacin.

Lo que se busca al emplear una muestra es que, observando una porcin relativamente reducida de la
poblacin, se obtengan conclusiones semejantes a las que lograramos si estudiramos la poblacin total.
Cuando una muestra cumple con esta condicin, es decir, cuando nos refleja en sus unidades lo que ocurre en
la poblacin, la llamamos muestra representativa. Sus conclusiones son susceptibles de ser generalizadas a la
poblacin, aunque para ello debamos aadir un cierto margen de error a las inferencias que se hagan, debido
a que lamentablemente no hay forma de garantizar con un 100% de certeza que la muestra que se seleccione
resulte finalmente ser representativa de la poblacin.

Elegir una muestra representativa es un problema importante en las investigaciones estadsticas. Una muestra
representativa, puede proporcionar una visin til de la naturaleza de la poblacin que se estudia, mientras que
una muestra no representativa puede sugerir conclusiones incorrectas sobre la poblacin.

Probabilidades y Estadstica
Edmundo Pea Rozas, Juan Garcs Seguel
2
El trabajar con una muestra sugiere ciertas ventajas respecto del censo, estas son:
Menor costo: Al obtener datos de solo una fraccin de la poblacin, los gastos asociados a estas
mediciones son menores a los que se tendran al efectuar las mediciones sobre el total de la poblacin.
Mayor rapidez: Por tratarse de un menor volumen de datos, la recoleccin, procesamiento y resumen de
los datos puede realizarse en menos tiempo, situacin muy relevante cuando se necesita informacin con
carcter de urgente.
Mayor exactitud: Debido a que el volumen de datos a recolectar es menor, se requiere de menos personal
para que realice esta labor, por lo cual ste podr ser capacitado de mejor manera, ser posible tambin
una mejor supervisin de campo, redundando esto en que los datos obtenidos con una muestra sern de
mejor calidad respecto de los que se obtendran al censar la poblacin.
Ms posibilidades: En determinadas investigaciones, la obtencin de los datos requiere de los servicios de
personal o equipo altamente especializado, de tal manera que no es factible realizar una enumeracin
completa de la poblacin. Aquellas encuestas que estn basadas en el mtodo de muestreo tienen un
mayor alcance y flexibilidad respecto de la informacin que puede obtenerse, puesto que el personal
encargado de obtener esta informacin estar mejor capacitado por ser un grupo reducido.

El muestreo es una herramienta de la investigacin cientfica. Su funcin bsica es determinar que parte de una
realidad en estudio (poblacin) es necesaria para hacer inferencias estadsticamente vlidas sobre dicha
poblacin. El error que se comete debido al hecho de que se obtienen conclusiones sobre cierta realidad a partir
de la observacin de slo una parte de ella, corresponde a un error de estimacin que se denomina error de
muestreo o error muestral.

El error de muestreo se puede en algunos casos, controlar con un diseo cuidadoso de la muestra, sin
embargo, existe otro tipo de errores denominados errores de no muestreo cuya deteccin y control es mucho
ms difcil de llevar a cabo, siendo difciles de medir y crecientes a medida que aumenta el tamao de la
muestra. Los errores de no muestreo pueden tener su origen en:
Definicin equivocada del problema
Definicin defectuosa de la poblacin
Marco imperfecto o no actualizado (lista o mapa de las unidades elementales)
No respuesta
Sesgo en la respuesta
Diseo pobre del cuestionario

Cabe recordar que el sesgo corresponde a un error en las mediciones de la variable respuesta, que son
sistemticamente diferentes de los datos reales

Anteriormente se indic que para que las conclusiones que se obtienen a partir de una muestra puedan se
proyectadas a la poblacin, es necesario que esta muestra sea representativa de la poblacin en estudio. A
priori, es imposible saber si una muestra es representativa o no, de tal manera que es necesario recurrir a
procedimientos estadsticos capaces de indicarnos con que nivel de confianza se trabaja al escoger una
determinada muestra.


MUESTREO PROBABILSTICO

El muestreo probabilstico tiene como caracterstica principal que todo elemento de la poblacin tiene una
determinada probabilidad de integrar la muestra, y que esa probabilidad puede ser calculada matemticamente
con precisin. Este tipo de muestreo, asegura que la aparicin de cualquier unidad elemental de la poblacin
en una muestra, tiene una probabilidad conocida o al menos calculable. Este tipo de muestreo garantiza la
representatividad de la muestra respecto de su poblacin, las muestras que se van obteniendo de la poblacin
son representativas de la misma y es el nico cientficamente vlido.
Probabilidades y Estadstica
Edmundo Pea Rozas, Juan Garcs Seguel
3

Para que esto suceda as es necesario proceder a la extraccin de la muestra mediante ciertas tcnicas,
capaces de garantizarnos que cada elemento de la misma posea una probabilidad conocida de aparecer en
ella. Los procedimientos ms usuales para la obtencin de muestras aleatorias son los siguientes:
Muestreo Aleatorio Simple
Muestreo Sistemtico
Muestreo Estratificado
Muestreo por Conglomerados


Muestreo Aleatorio Simple (M.A.S.)

El muestreo aleatorio simple es un mtodo probabilstico de seleccin de n unidades obtenidas a partir de una
poblacin de tamao N, de tal manera que cada una de las posibles muestras tiene la misma probabilidad de
ser escogida, y de tal manera que en cualquier etapa del proceso de obtencin de la muestra, el procedimiento
ofrece la oportunidad de que todas las unidades poblacionales que no han sido seleccionadas previamente
tengan igual probabilidad de eleccin.

El procedimiento de muestreo consiste en enumerar las unidades de la poblacin de 1 a N. A continuacin se
sacan series de nmeros al azar entre 1 y N, ya sea por medio de una tabla de nmeros aleatorios, una
herramienta computacional o colocando los nmeros de 1 a N en una urna y mezclndolos perfectamente. Si
se usa una urna, los n nmeros se extraen en sucesin. Las unidades asociadas e estos nmeros constituyen
la muestra.

Cuando un nmero ha sido sacado de la urna, ste no es reemplazado, ya que esto dara lugar a que la misma
unidad entrara en la muestra ms de una vez. Por esta razn, el muestreo es descrito como sin reemplazo o
sin reposicin. De igual modo, si se emplea una tabla de nmeros aleatorios o un dispositivo computacional
para la generacin de nmeros aleatorios, el nmero que haya sido seleccionado previamente debe ser
ignorado.

El muestreo con reemplazo o con reposicin es tcnicamente factible pero su aplicacin debe ser
considerada solamente en aquellos casos en que se justifique la posibilidad de tener a un mismo objeto ms de
una vez en la muestra.

Este mtodo de muestreo garantiza una seleccin completamente aleatoria pero, dependiendo del tamao de la
poblacin y de la muestra, as como de las herramientas disponibles, puede resultar muy lento y costoso pues
obliga a elaborar listas completas de todas las unidades de inters, lo cual a veces resulta sencillamente
imposible. Por otra parte, este mtodo de muestreo requiere que la poblacin en estudio sea ms bien
homognea, es decir, que los sujetos tienen ms o menos de las mismas caractersticas.

Este mtodo no ser adecuado si, por ejemplo, queremos sacar una muestra de todas las personas analfabetas
que existen en un pas, pues por su nmero y por lo indeterminado de su situacin nos ser imposible
confeccionar la lista de todas las que existen. En cambio, si nuestra intencin es extraer una muestra del
universo de todos los alumnos que ingresan a una universidad en un determinado ao, resultar un mtodo
adecuado, puesto que se trata de una cantidad menor de unidades que adems estn registradas y en listas
pertinentes.

Ejemplo:
Probabilidades y Estadstica
Edmundo Pea Rozas, Juan Garcs Seguel
4
En un hospital se tienen enumerados a todos los pacientes atendidos durante un mes. Para seleccionar una
muestra se utiliza un programa para generar nmeros aleatorios o una tabla de nmeros aleatorios de donde se
seleccionan n nmeros, los que representan a los pacientes que formaran parte de la muestra.

Muestreo Sistemtico

Este procedimiento exige, como en el muestreo aleatorio simple, numerar todos los elementos de la poblacin,
pero en lugar de extraer al azar los n elementos de la muestra, slo se extrae uno. Se parte de ese nmero
aleatorio i, que es un nmero elegido al azar, y los elementos que integran la muestra son los que ocupa los
lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k, siendo k el resultado de dividir el
tamao de la poblacin por el tamao de la muestra: k= N/n. El nmero i que empleamos como punto de partida
ser un nmero al azar entre 1 y k.

El riesgo que presenta en este tipo de muestreo se encuentra en los casos en que se dan periodicidades en el
marco muestral (lista o mapa de las unidades de muestreo que conforman la poblacin) ya que al elegir los
elementos de la muestra con una periodicidad constante (k) podemos introducir una homogeneidad que no se
da en la poblacin. Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos en los
que los 5 primeros son varones y los 5 ltimos mujeres, si empleamos un muestreo aleatorio sistemtico con
k=10 siempre seleccionaramos o slo hombres o slo mujeres, no podra haber una representacin de los dos
sexos

Algunas ventajas y desventajas del muestreo sistemtico respecto del aleatorio simple son:
El muestreo sistemtico es ampliamente usado debido principalmente a que simplifica el proceso de
seleccin de la muestra.
Es ms fcil de llevar a cabo en el campo, y por lo tanto, a diferencia de MAS, est menos expuesto a los
errores de seleccin que cometen los investigadores de campo.
Es preferible al MAS, cuando la poblacin est ordenada al azar y su tamao N es grande.
La precisin que proporciona el muestreo sistemtico depende del orden de las unidades de muestreo en el
marco. Si la poblacin tiene una buena ordenacin, la muestra sistemtica se extender uniformemente
sobre toda la poblacin y, por lo tanto, puede proporcionar ms informacin acerca de la poblacin que una
cantidad equivalente de datos contenida en una muestra aleatoria simple
Puede ser aplicable en investigaciones de mercado con carencia de MARCO muestral (total o parcial). Un
entrevistador bien capacitado puede seleccionar a cada vigsimo cliente que llega a un supermercado, sin
necesidad de contar con una lista de clientes.
Si la poblacin a muestrear es peridica, es decir los elementos del MARCO tienen variacin cclica que
coincide con el mltiplo del tamao del intervalo muestral (k), esta periodicidad debe eliminarse del MARCO
cambiando el orden de los elementos o adoptando algn otro procedimiento de muestreo

El Marco muestral del que se a hecho mencin no es ms que una lista o mapa de las unidades de muestreo
que conforman la poblacin.. El marco muestral debe contener todas las unidades que conforman la poblacin
bajo estudio y debe excluir unidades de cualquier otra poblacin. El marco muestral es de vital importancia en
un estudio por muestreo, pues a partir de ste se seleccionar la muestra.

Ejemplo:
En un hospital se tienen enumerados a todos los pacientes atendidos durante un mes. Para seleccionar una
muestra se elige a un paciente al azar y luego se selecciona a un paciente cada 15 pacientes.


Muestreo Estratificado
Probabilidades y Estadstica
Edmundo Pea Rozas, Juan Garcs Seguel
5

Este mtodo de muestreo supone que una poblacin de tamao N es posible de subdividir de acuerdo a alguna
variable de inters para la investigacin, en k sub-poblaciones menores de tamaos N
1
, N
2
, , N
k
que
denominamos estratos y que se caracterizan por ser mutuamente excluyentes, exhaustivos, heterogneos entre
s pero homogneos al interior de cada uno de ellos. Cada uno de estos estratos se toma luego como una
poblacin particular de tamao ms reducido, para en cada uno de ellos seleccionar muestras aleatorias de
tamaos n
1
, n
2
, , n
k
., cuya suma arroja el tamao total de la muestra

Por ejemplo, si quisiramos estudiar las actitudes polticas de los estudiantes de una universidad, podramos
subdividirlos en estratos de acuerdo al tipo de estudios que cursen, asumiendo que estas actitudes van a ser
diferentes entre quienes siguen Ingeniera, Letras, Medicina u otras carreras. Luego efectuaramos un muestreo
dentro de cada sub-poblacin as definida para, finalmente, realizar un anlisis integrando los resultados de
todas las sub-muestras obtenidas.

Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de inters estn
representados adecuadamente en la muestra.

La distribucin del tamao de la muestra en funcin de los diferentes estratos se denomina afijacin, y puede
ser de diferentes tipos:
Afijacin Simple: A cada estrato le corresponde igual nmero de elementos mustrales. En este tipo de
afijacin, los distintos estratos estarn adecuadamente representados en la muestra solamente si a nivel
poblacional los estratos son de igual tamao o al menos muy similares, en caso contrario, algunos estratos
podrn tener en la muestra una representacin distinta a la que realmente les corresponde, generando con
ello una muestra poco representativa y ocasionando con ello errores en las inferencias que se hagan.
Afijacin Proporcional: En la afijacin proporcional, el tamao muestral de cada estrato es proporcional al
tamao del estrato en la poblacin total.
Afijacin ptima: para la determinacin de los tamaos de muestra en cada estrato se tiene en cuenta el
nivel de dispersin existente en cada uno de ellos, de tal manera que en la muestra, los estratos menos
homogneos debern aportar menos unidades que los estratos ms heterogneos.

Ejemplo:
En un hospital se tienen enumerados a todos los pacientes atendidos durante un mes, se separa la poblacin
en tres grupos etareos: (1) menores de 20 aos, (2) entre 20 y 40 aos y (3) mayores de 40 aos. Para cada
grupo se selecciona una muestra aleatoria.


Muestreo por Conglomerados:

Esta tcnica tiene utilidad cuando la poblacin en estudio permite su subdivisin en poblaciones menores de
caractersticas similares a las de la poblacin total. Cuando es posible asumir tal cosa se procede a subdividir la
poblacin en un nmero finito de conglomerados y, entre ellos, se pasa a escoger algunos que sern los nicos
que se proceder a investigar. Esta eleccin puede realizarse ya sea por el muestreo aleatorio simple o del
muestreo sistemtico. Una vez cumplida esta etapa puede efectuarse una segunda seleccin, dentro de cada
uno de los conglomerados elegidos, para llegar a un nmero an ms reducido de unidades muestrales.

La ventaja de esta tcnica es que evita la tarea de confeccionar el listado con todas las unidades del universo,
lo cual, como hemos visto, en muchos casos resulta imposible de hacer. Su desventaja mayor radica en que, al
efectuarse el muestreo en dos etapas, los errores muestrales de cada una se van acumulando, dando un error
algo mayor que para los mtodos descritos anteriormente.
Probabilidades y Estadstica
Edmundo Pea Rozas, Juan Garcs Seguel
6

La tcnica de los conglomerados suele utilizarse cuando queremos extraer muestras de los habitantes de un
conjunto geogrfico amplio, por ejemplo, una gran ciudad o un conjunto de aldeas, por lo que se procede a
tomar cada aldea o grupo de manzanas como un conglomerado independiente. Del mismo modo se la utiliza
para investigar reservas forestales y marinas, estrellas, productos industriales y otros universos relativamente
semejantes.


TAMAO DE MUESTRA Y ERROR MUESTRAL

El error que se comete debido a que se obtienen conclusiones sobre cierta realidad a partir de la observacin
de slo una parte de ella, se denomina error de muestreo (o error muestral). Este error de muestreo lo que
entrega es una medida en trminos porcentuales de la diferencia que se espera al comparar el valor de un
parmetro de la poblacin con su respectivo estimador muestral.

Se debe tener muy en claro de que por muy bien que se disee un plan de muestreo, es prcticamente
imposible que una muestra represente exactamente a la poblacin, de tal manera que lo que se debe pretender
es que la diferencia que se produce entre el verdadero valor de un parmetro de dicha poblacin y la estimacin
que de l se obtiene a partir de la muestra, sea lo menor posible. De lo anterior se deduce que un estimador
muestral ser ms o menos preciso en la medida de que su error muestral sea tambin ms o menos pequeo.

En trminos ms prcticos se entender por error de muestreo o error muestral a la diferencia que se produce
al comparar un valor calculado a partir de una muestra con el valor que se debera haber obtenido si se hubiese
considerado toda la poblacin.

A medida que incrementamos el tamao de la muestra el error tiende a reducirse, pues la muestra va
acercndose ms al tamao de la poblacin. Del mismo modo, para una muestra determinada, su error ser
menor cuanto ms pequea sea la poblacin a partir del cual se la ha seleccionado.

De lo anterior se puede inferir que en la medida de que se incrementa el tamao de la muestra, el error
muestral debe ir reducindose, debido a que la muestra va acercndose ms al tamao de la poblacin.

Idealmente, para fijar el tamao de muestra adecuado a cada investigacin es preciso primero determinar el
porcentaje de error que estamos dispuestos a admitir. Una vez hecho esto debern realizarse las operaciones
algebraicas correspondientes para poder calcular el tamao de la muestra que nos permita situarnos dentro del
margen de error aceptado. Es decir que no se fija primero el nmero de unidades de la muestra para luego
proceder a determinar el riesgo que se corre, sino a la inversa, se pone un lmite a este riesgo y en
funcin de ese valor se define el tamao de la muestra que nos garantiza no sobrepasarlo.

Anteriormente se seal que mientras mayor sea el tamao de la muestra, menor debe ser el error muestral, sin
embargo, se debe de tener en cuenta que factores como el incremento de costos, el tiempo requerido para
efectuar la investigacin as como la prdida de confiabilidad al tener muestras demasiado grandes puede
incidir directamente en la decisin de la determinacin del tamao de la muestra, debiendo en muchos casos
aceptar el error de muestreo que el tamao muestral permitido origine; en esta situacin, definido el tamao de
la muestra es posible mediante una transformacin algebraica de las formulas existentes para calcular el
tamao muestral, obtener el error de muestreo.

Probabilidades y Estadstica
Edmundo Pea Rozas, Juan Garcs Seguel
7
Por otra parte, la disminucin del error muestral no es linealmente proporcional al aumento del tamao de la
muestra, de tal manera que para una determinada investigacin, disminuir en alguna medida el error de
muestreo puede significar aumentar el tamao de muestra en una magnitud tal que por los costos asociados a
ello no justifique el aumento del tamao muestral.

Se debe tener presente adems que el error muestral nunca debe calcularse como un porcentaje del
tamao de la muestra respecto de la poblacin.


Para determinar el tamao de muestra se debe distinguir si el parmetro que se desea estimar corresponde a
una proporcin o a una media.

Clculo del tamao de muestra para la media

Calcular
2 2
1 2
0 2
Z
n
e

= y a continuacin determinar el tamao de muestra como


N
n
n
n
0
0
1+
=
Donde:
N = Tamao de la poblacin
E = Error mximo admisible

2
= Varianza de la poblacin
Z
1-/2
= Valor tabulado de la distribucin normal a un nivel de confianza del (1-)%

En la prctica se calcula n
0
, y luego la fraccin n
0
/N. Si esta fraccin es menor de 0.05, nos quedamos con n
0

como tamao de muestra o, en caso contrario se calcula n.

El problema que usualmente se presenta es que la varianza de la poblacin es desconocida. En este caso se
puede obtener una estimacin de la varianza utilizando uno de los siguientes procedimientos:
Obtener un estimador de
2
de alguna investigacin o estudio previo, o de poblaciones que se supone
son parecidas a la que es objeto de estudio.
Se estima
2
por medio de una muestra piloto de tamao n.


Clculo del tamao de muestra para una proporcin

Calcular
2
1 2
0 2
Z pq
n
e

= y a continuacin determinar el tamao de muestra como
N
n
n
n
0
0
1+
=
Donde:
N = Tamao de la poblacin
E = Error mximo admisible
p = Valor de la proporcin de la poblacin
Probabilidades y Estadstica
Edmundo Pea Rozas, Juan Garcs Seguel
8
pq = Varianza de la proporcin (q=1-p)
Z
1-/2
= Valor tabulado de la distribucin normal a un nivel de confianza del (1-)%

En la prctica se calcula n
0
, y luego la fraccin n
0
/N. Si esta fraccin es menor de 0.05, nos quedamos con n
0

como tamao de muestra o, en caso contrario se calcula n.

El problema que usualmente se presenta es que la varianza de la poblacin es desconocida. En este caso se
puede obtener una estimacin de la varianza utilizando uno de los siguientes procedimientos:
Obtener un estimador de
2
=pq de alguna investigacin o estudio previo, o de poblaciones que se
supone son parecidas a la que es objeto de estudio.
Se estima
2
=pq por medio de una muestra piloto de tamao n.
Si la proporcin p no es muy pequea, se estima la varianza mxima (pq=0.25)

You might also like