La técnica de muestreo estratificado consiste en dividir la población en subgrupos o estratos y seleccionar una muestra de cada estrato de forma independiente. Esto reduce el error muestral en comparación con el muestreo aleatorio simple si los estratos son internamente homogéneos pero heterogéneos entre sí. Existen diferentes tipos de muestreo estratificado como el proporcional, uniforme u óptimo, variando el tamaño asignado a cada estrato. El muestreo estratificado permite estimar parámetros poblacionales
La técnica de muestreo estratificado consiste en dividir la población en subgrupos o estratos y seleccionar una muestra de cada estrato de forma independiente. Esto reduce el error muestral en comparación con el muestreo aleatorio simple si los estratos son internamente homogéneos pero heterogéneos entre sí. Existen diferentes tipos de muestreo estratificado como el proporcional, uniforme u óptimo, variando el tamaño asignado a cada estrato. El muestreo estratificado permite estimar parámetros poblacionales
La técnica de muestreo estratificado consiste en dividir la población en subgrupos o estratos y seleccionar una muestra de cada estrato de forma independiente. Esto reduce el error muestral en comparación con el muestreo aleatorio simple si los estratos son internamente homogéneos pero heterogéneos entre sí. Existen diferentes tipos de muestreo estratificado como el proporcional, uniforme u óptimo, variando el tamaño asignado a cada estrato. El muestreo estratificado permite estimar parámetros poblacionales
Esta tcnica, perteneciente a la familia de muestreos
probabilsticos, consiste en dividir toda la poblacin objeto de estudio en diferentes subgrupos o estratos disjuntos, de manera que un individuo slo puede pertenecer a un estrato. Una vez definidos los estratos, para crear la muestra se seleccionan individuos empleando una tcnica de muestreo cualquiera a cada uno de los estratos por separado. Si por ejemplo empleamos muestreo aleatorio simple en cada estrato, hablaremos de muestreo aleatorio estratificado (M.A.E. en
adelante). Del mismo modo, podramos usar otras tcnicas de
muestreo en cada estrato (muestreo sistemtico, aleatorio con reposicin, etc.). Los estratos suelen ser grupos homogneos de individuos, que a su vez son heterogneos entre diferentes grupos. Por ejemplo, si en un estudio esperamos encontrar un comportamiento muy diferente entre hombres y mujeres, puede ser conveniente definir dos estratos, uno por cada sexo. Si la seleccin de estos estratos es correcta (1) los hombres deberan comportarse de forma parecida entre ellos, (2) las mujeres deberan comportarse de forma muy similar entre ellas y (3) hombres y mujeres deberan mostrar comportamientos dispares entre s. Si la anterior condicin se cumple (estratos homogneos internamente, heterogneos entre s) el uso del muestreo aleatorio estratificado reduce el error muestral, mejorando la precisin de nuestros resultados al realizar un estudio sobre la muestra. Es relativamente habitual definir estratos de acuerdo a algunas variables caractersticas de la poblacin como son la edad, sexo, clase social o regin geogrfica. Estas variables permiten dividir fcilmente la muestra en grupos mutuamente excluyentes y con bastante frecuencia, permiten discriminar comportamientos diferentes dentro de la poblacin.
Tipos de muestreo estratificado
Dependiendo del tamao que asignamos a los estratos, hablaremos de diferentes tipos de muestreo estratificado. Tambin se acostumbra a hablar de diferentes formas de afijacin de la muestra en estratos. (1) Muestreo estratificado proporcionado Cuando seleccionamos una caracterstica de los individuos para definir los estratos, suele ocurrir que el tamao de las subpoblaciones resultantes en el universo son diferentes. Por ejemplo, queremos estudiar el % de la poblacin que fuma en
Mxico y pensamos que la edad puede ser un buen criterio para
estratificar (es decir, pensamos que existen diferencias importantes en el hbito de fumar dependiendo de la edad). Definimos 3 estratos: menores de 20 aos, de 20 a 44 aos y mayores de 44 aos. Es de esperar que al dividir toda la poblacin mexicana en estos 3 estratos no resulten grupos de igual tamao. Efectivamente, si miramos datos oficiales, obtenemos: * Estrato 1 Poblacin Mexicana menor de 19 aos: 42,4 millones (41,0%) * Estrato 2 Poblacin Mexicana de 20 a 44 aos: 37,6 millones (36,3%) * Estrato 3 Poblacin Mexicana mayor de 44 aos: 23,5 millones (22,7%) Si usamos muestreo estratificado proporcionado, la muestra deber tener estratos que guarden las mismas proporciones observadas en la poblacin. Si en este ejemplo queremos crear una muestra de 1.000 individuos, los estratos tendrn que tener un tamao como sigue: Estrato 1 2 3
Poblacin 42,4M 37,6M 23,5M
Proporcin 41,0% 36,3% 22,7%
Muestra 410 363 227
(2) Muestreo estratificado uniforme
Hablaremos de una afijacin uniforme cuando asignamos el mismo tamao de muestra a todos los estratos definidos, sin importar el peso que tienen esos estratos en la poblacin. Siguiendo con el ejemplo anterior, un muestreo estratificado uniforme definira la siguiente muestra por estrato: Estrato 1 2 3
Poblacin 42,4M 37,6M 23,5M
Proporcin 41,0% 36,3% 22,7%
Muestra 334 333 333
Esta tcnica favorece los estratos que tienen menos peso en la
poblacin, equiparndolos en importancia a los estratos ms relevantes. Globalmente, reduce la eficiencia de nuestra muestra (menor precisin en los resultados), pero como contrapartida permite estudiar caractersticas particulares de cada estrato con mayor precisin. En nuestro ejemplo, si queremos emitir alguna afirmacin especfica sobre la poblacin del estrato 3 (mayores de 44 aos), podremos hacerlo con menor nivel de error muestral si empleamos una muestra de 333 unidades que si lo hacemos con una muestra de 227 (como ocurra en el muestreo estratificado proporcional). (3) Muestreo estratificado ptimo desviacin estndar)
(respecto
la
En este caso, el tamao de los estratos en la muestra no
guardar proporcionalidad con la poblacin. Por el contrario, se define el tamao de los estratos proporcionalmente a la desviacin estndar de las variables objeto de estudio. Es decir, se toman estratos de mayor tamao en los estratos con mayor variabilidad interna para representar mejor en el total de la muestra los grupos poblacionales ms difciles de estudiar.
Eficiencia de los diferentes muestreos estratificados
Las preguntas inevitables son: cuando conviene emplear la estratificacin?, qu tipo de estratificacin es ms conveniente? El muestreo estratificado proporcional produce siempre menor o igual error muestral que el muestreo aleatorio simple, es decir, es ms preciso. La igualdad se produce cuando las medias o las proporciones que estamos analizando son iguales en todos los estratos. Por lo tanto, la estratificacin produce ms beneficio cuanto ms diferentes sean los estratos entre s.
El muestreo estratificado ptimo es siempre igual
o ms preciso que el muestreo estratificado proporcional. Ambos mtodos son igual de precisos cuando las desviaciones tpicas dentro de cada estrato son iguales, en cuyo caso ambos mtodos son totalmente equivalentes. Por lo tanto, la estratificacin ptima produce ms beneficio cuanto ms diferencias existan entre las desviaciones dentro de cada grupo, situacin en la que podremos reducir el tamao muestral de los grupos ms homogneos en beneficio de los ms heterogneos. Como contrapartida, es un mtodo ms complejo y que requiere tener mucha informacin a priori de la muestra que estudiamos, algo que normalmente no tenemos.
Tamaos de muestra requeridos por cada tcnica
Vemos que la estratificacin puede proporcionar beneficios. Si estas tcnicas pueden emplearse para estimar de forma ms precisa ya sean medias (p.e. media de cigarrillos consumidos por los fumadores de Mxico) o proporciones (p.e. proporcin de la poblacin de Mxico que fuma), tambin pueden permitirnos reducir el tamao de muestra requerido para lograr una estimacin con un nivel de error determinado. La siguiente tabla resume el tamao de muestra requerido al emplear cada tcnica, en funcin del error mximo que estamos dispuestos a aceptar y de las caractersticas del propio universo, que consideraremos de tamao infinito (si fuese finito, debe aplicarse un factor de correccin).
Para interpretar el cuadro anterior es necesario tener en cuenta
lo siguiente: Z = Es la desviacin del valor medio que aceptamos para lograr el nivel de confianza deseado. En funcin del nivel de confianza que busquemos, usaremos un valor determinado que viene dado por la forma que tiene la distribucin de Gauss. Los valores ms frecuentes son: Nivel de confianza 90% -> Z=1,645 Nivel de confianza 95% -> Z=1,96 Nivel de confianza 99% -> Z=2,575 L es el nmero de estratos en que particionamos la muestra y h es un ndice que se refiere a un estrato concreto. Por lo tanto, h puede variar entre 1 y L estratos. p es la proporcin que buscamos en el total de la poblacin (p.e. % de fumadores). Por lo tanto, (1-p) es la proporcin de la muestra complementaria, la que no cumple el criterio buscado (no fumadores). Del mismo
modo, ph es dicha proporcin dentro de cada uno de los
estratos. 2 es la varianza que el dato buscado (en el caso de estimar medias) tiene en el total de la poblacin. Asimismo, h2 es la varianza dentro de cada estrato. e es el margen de error aceptado. Wh es el peso que el estrato tiene en la muestra (tamao del estrato respecto al total de la muestra). Si hablamos de estratificacin proporcional, cada Wh es igual a la proporcin que ese estrato representa en la poblacin. Si hablamos de estratificacin ptima, cada Wh se calcula en funcin de la dispersin dentro de cada estrato. Es posible demostrar a partir de las frmulas anteriores que los diferentes mtodos de estratificacin slo reducen el tamao de la muestra si los valores de p y vara entre estratos. De lo contrario, todas las expresiones son equivalentes. Veamos un ejemplo: si tomamos la expresin de tamao de muestra requerido para estimar una media mediante un muestreo estratificado ptimo (ignorando el parmetro Z en este caso)
y consideramos que todas las varianzas de los estratos son
iguales (h=) y que el tamao de los estratos es idntico (Wh=1/L), el resultado que obtenemos es
Esperamos que este post ayude a aclarar la utilidad del
muestreo estratificado. En prximos posts abordaremos el muestreo sistemtico.