Professional Documents
Culture Documents
Modulo: Muestreo
Ms. Sc. Lic. Jorge Luis Medrano llano
Universidad publica de el alto
1
¿De que se trata el modulo?
Competencias buscadas
2
Programa mínimo
1. Muestreo y distribuciones muéstrales:
2. Tipos de muestreo aleatorio
Muestreo Aleatorio Simple
Muestreo Aleatorio Estratificado
Muestreo Aleatorio por Conglomerados
3. Errores de muestreo
4. Estimaciones de los parámetros poblacionales
5. Diseños de investigación por muestreo
Organización de la asignatura
Clases teóricas:
Fundamentos teóricos del muestreo
Clases prácticas con SPSS y Excel:
Desarrollo de casos de aplicación
3
Bibliografía
-Gorgas – Cardiel - Zamorano: Estadística Básica para Estudiantes de
Ciencias. UCM, Madrid-España. 2011..
Bibliografía Complementaria
- Ritchey, Ferris J.: Estadística para las Ciencias Sociales. 2da. Ed. Mc. Graw
Hill. México, 2006.
4
INTRODUCCIÓN
¿Qué es la estadística?
Estadística es la ciencia de recolectar,
organizar, presentar, analizar e interpretar
datos con el propósito de ayudar a una toma
de decisiones más efectiva.
5
ESTADISTICA DESCRIPTIVA E INFERENCIAL
6
INFERENCIA ESTADÍSTICA
ORGANIZACIÓN
Y RESUMEN
Tema de Investigación ESTADÍSTICA
-Antecedentes Previos DESCRIPTIVA
-Objetivos INTERPRETACIÓN
-Preguntas de Investigación Muestra
-Posibles Hipótesis ¿Población o Muestra?
-Unidad de Análisis INFERENCIA
Población
-Población ESTADISTÍCA
-Variables
CONCLUSIONES
Probabilidad
INFORMACIÓN
8
RECORDEMOS
Un estadístico (estadígrafo)
Es una medida que describe las
características de una muestra.
Un parámetro
Es una medida que describe las
características de la población.
9
ESTADISTICOS Y PARAMETROS
Muestra Población
MEDIDA
(Estadístico) (Parámetro)
Variables Cuantitativas
Media 𝒙
Desviación Estándar 𝒔
Varianza 𝒔𝟐 2
Variables Cualitativas o Categorizadas
Proporción 𝑝=𝑝
10
MUESTREO
MEDIA ARITMETICA
MEDIANA
POBLACION ESTIMACIONES VARIANZA
MUESTRA
OBJETIVO PROPORCION
RAZON
¿QUÉ TANTO SE
INFERENCIA APROXIMA ESTA
¿ES LA MUESTRA ESTIMACION AL
REPRESENTATIVA VERDADERO VALOR EN LA
DE LA POBLACION?
POBLACIÓN?
11
¿Qué es el muestreo?
12
DISEÑO DE LA INVESTIGACIÓN
METODOLOGIA DE PLANIFICACIÓN DE
INVESTIGACIÓN CIENTÍFICA
13
MAPIC
MATRIZ DE PLANIFICACIÓN EN
INVESTIGACIÓN CIENTÍFICA
ESTUDIOS POR ESTUDIOS POR
OBSERVACIÓN EXPERIMENTACIÓN
• Estudios basados en la • Estudios basados en la
observación de las unidades experimentación sobre las
de investigación, se pueden unidades de investigación.
realizar mediante:
• Censos
• Encuestas
• Revisión de registros
administrativos
14
MAPIC
ESTUDIOS POR OBSERVACIÓN
15
MAPIC
ESTUDIOS POR EXPERIMENTACIÓN
16
ESTUDIOS POR OBSERVACIÓN
17
1. Definición de los resultados esperados
18
Definición de los resultados esperados
Ejemplos
Estimar la demanda de un producto y proyectarla para un
periodo de 5 años:
Estadísticamente: Estimar una cantidad (promedio)
Estimar la concentración de calcio en mujeres embarazadas
Estadísticamente: Estimar una cantidad (promedio)
Identificar factores que inciden en la cartera en mora de
las instituciones de microcrédito.
Estadísticamente: Estimar porcentajes (proporciones)
Estimar la prevalencia de Hepatitis B
Estadísticamente: Estimar porcentaje (proporción)
19
2. Definición de la población y unidades de
observación
Población
Conjunto de “individuos” sobre los que existe una
interés de analizar
Población finita o infinita
Unidades de observación
Elementos de la población que serán observados o
estudiados. Por ejemplo: personas, familias, empresas,
productos, marcas, etc.
20
3. Definición de las variables
21
3. Definición de las variables
Tipos de datos
Datos cuantitativos
Datos de medición – continuos
Datos de conteo - discreta
Datos cualitativos
Datos binarios
Datos ordinales
Datos nominales
22
4. Métodos de colecta
Cuantitativas Encuestas
Experimentos
Externas Publicaciones
Estadísticas sectoriales
Informes Externos
23
4. Métodos de colecta
Métodos de colecta primarios
INVESTIGACIÓN INVESTIGACION
CUANTITATIVA CUALITATIVA
Busca las causas sin recurrir a la Interés por comprender el
interpretación subjetiva comportamiento humano
Aproximación lógico-positivista Aproximación fenomenológica
Medición controlada Medición observacional natural, sin
control
Objetivismo, perspectiva externa Subjetivismo, perspectiva iterna
Orientación verificacionista, Orientación hacia el descubrimiento,
confirmatoria, reduccionista, inferencial exploratoria, descriptiva, inductiva
Orientación hacia el resultado Orientación hacia el proceso
Importancia de la formalidad, datos Importancia del contenido, datos reales
exactos y rigurosos
Particular – Intenta analizar General – Intenta sintetizar 24
4. Métodos de colecta
Métodos de investigación cualitativos
Semidirectos Phillips 66
Delphi
Observación Personal
Análisis de Contenido
Auditoria
25
4. Métodos de colecta
Métodos de investigación cualitativos
26
7. Análisis de datos
Muestra
Censo Muestreo
30
7. Análisis de los datos
Análisis exploratorio
Unidimensional Bidimensional Multidimensional
1. Resultados Esperados
2. Población y Unidades de Observación
3. Variable y tipo de dato
4. Método de colecta
5. Plan de muestreo (selección de la muestra)
6. Método Estadístico
7. Determinación del tamaño de la muestra
34
Ejemplo
Nivel de
ingreso
35
MUESTREO Y DISTRIBUCIONES
MUESTRALES
MUESTREO ALEATORIO SIMPLE
36
¿Qué es el muestreo?
37
¿Por qué muestrear?
• Menor costo
• Mayor exactitud
38
Limitaciones
PROBABILISTICO NO PROBABILISTICO
(Aleatorio) (No aleatorio)
• Toda unidad de muestreo (y en • La selección se realiza por
consecuencia toda unidad de conveniencia o por criterio del
la población) tiene una investigador, por lo tanto no
probabilidad positiva y existe una probabilidad
conocida de pertenecer a la conocida de pertenecer a la
muestra. muestra.
• Generalmente son menos
• Permiten realizar el estudio de exactos que los métodos
las características de la probabilísticos y menos
población mediante la costosos; sin embargo no
inferencia estadística. existe forma de medir su
precisión.
42
Planes de muestreo
PROBABILISTICO NO PROBABILISTICO
(Aleatorio) (No aleatorio)
43
METODOS NO
PROBABILISTICOS
Muestreo indiscriminado
Muestra de voluntarios
Muestreo al juicio
Muestreo por cuotas
Muestreo por bola de nieve
44
Muestreo indiscriminado
2. Saturación de la muestra
• Con cada interacción, la lista crece como bola de nieve, hasta que se
puede lograr un cuasi-censo, existe el riesgo de no tomar en cuenta a
individuos o sub-grupos que nadie menciona, ni conoce.
52
Muestreo Aleatorio Simple
𝑁 20.000
Coeficiente de elevación = = = 40
𝑛 500
Se inferencia que:
𝑛 500
Fracción de muestreo = = = 2,5%
𝑁 20000
62
Características
Números
aleatorios:
20
27
29
32
40
MUESTREO
ALEATORIO
SISTEMATICO
MASIS
65
Características
N = 48
n=5
k = N/n
k = 48/5
k 10
Comenzando
por la unidad
17
MUESTREO
ALEATORIO
ESTRATIFICADO
MAE
68
Características
Afijación simple
Afijación proporcional
Afijación óptima
Muestreo Aleatorio Estratificado
Afijación simple
Afijación simple:
3.000
N = 10.000 𝐶𝐸1 = = 300
100
N1 = 3.000
N2 = 5.000 5.000
N3 = 2.000 𝐶𝐸1 = = 500
100
n = 300 2.000
𝐶𝐸1 = = 200
100
n = 300 5.000
𝑛2 = 300 =150
10.000
2.000
𝑛3 = 300 = 60
10.000
Muestreo Aleatorio Estratificado
Afijación proporcional: Coeficiente de elevación
3.000
N = 10.000 𝐶𝐸1 = = 33,33
90
N1 = 3.000
N2 = 5.000 5.000
N3 = 2.000 𝐶𝐸2 = = 33,33
150
n = 300 2.000
𝐶𝐸3 = = 33,33
60
n = 300 𝑁𝑖 ∗ 𝑆𝑖 ∗ 𝑛
𝑛𝑖 = 𝑡
𝑖=1 𝑁𝑖 ∗ 𝑆𝑖
n = 300
Muestreo Aleatorio Estratificado
Afijación optima: Cálculo de S
b) Se puede hacer una encuesta piloto, en una
muestra pequeña, respecto de la variable que
interesa analizar, por ejemplo salario de las
personas:
N = 10.000
N1 = 3.000
Supongamos tres muestras pequeñas, para medir el
N2 = 5.000 salario promedio
N3 = 2.000
Estrato 1 Estrato 2 Estrato 3
3.240 3.182 7.343
n = 300 4.543 5.996 6.279
2.961 6.857 6.832
3.242 6.808 3.977
Promedio 3.497 5.711 6.108
Desviación 710 1.731 1.485
Muestreo Aleatorio Estratificado
Afijación optima: Cálculo de S
3000 ∗ 710 ∗ 300
N = 10.000 𝑛1 = = 46
3000 ∗ 710 + 5000 ∗ 1731 + 2000 ∗ 1485
n = 300
Muestreo Aleatorio Estratificado
Afijación óptima: Coeficiente de elevación
N1 = 3.000 3.000
𝐶𝐸1 = = 65,21
N2 = 5.000 46
N3 = 2.000
5.000
𝐶𝐸2 = = 26,46
S1 = 710 189
S2 = 1.731 2.000
S3 = 1.485 𝐶𝐸3 = = 30,77
65
n = 300 Para hacer las inferencias a la población se debe
ponderar el resultado muestral por el
coeficiente de cada estrato.
Se quiere estimar el gasto mensual de transporte en
2.000 hogares.
N1 = 800 𝟖𝟎𝟎
𝒏𝟏 = 𝟏𝟐𝟎 ∗ = 𝟒𝟖
N2 = 1.200 𝟐𝟎𝟎𝟎
𝟖𝟎𝟎
Coeficiente de elevación = = 𝟏𝟔, 𝟔𝟕
n = 120 𝟒𝟖
𝟏𝟐𝟎𝟎
S1 = 200 𝒏𝟏 = 𝟏𝟐𝟎 ∗ = 𝟕𝟐
S2 = 320 𝟐𝟎𝟎𝟎
𝟏𝟐𝟎𝟎
Coeficiente de elevación = = 𝟏𝟔, 𝟔𝟕
𝟕𝟐
Se quiere estimar el gasto mensual de transporte en
2.000 hogares.
𝟖𝟎𝟎
Coeficiente de elevación = =22,86
n = 120 𝟑𝟓
𝟏𝟐𝟎𝟎∗𝟑𝟐𝟎
S1 = 200 𝒏𝟏 = 𝟏𝟐𝟎 ∗ = 85
𝟓𝟒𝟒.𝟎𝟎𝟎
S2 = 320
𝟏𝟐𝟎𝟎
Coeficiente de elevación = = 𝟏𝟒, 𝟏𝟏
𝟖𝟓
Se quiere estimar el gasto mensual de transporte en
2.000 hogares.
85
Características
Escuelas
Iglesias
Edificios
Almacenes
Características
89
Cálculo del tamaño de la muestra
1. Defina el objetivo:
1. Cuantitativo (media)
2. Cualitativo (proporción)
2. Defina el tipo de Población:
1. Finita (Numerable)
2. Infinita (No enumerable)
3. Defina el nivel de confianza (1-)
1. 99% Se usa para controles de calidad.
2. 95% Se usa para estudios de mercado, estudios sociales, etc.
3. 90% Se usa para investigaciones sociales especiales.
4. Defina el error de estimación
1. Si es cuantitativo, el error es un número
2. Si es cualitativo, el error es un porcentaje
90
𝜎 𝑠
𝜎𝜇 = =
𝑛 𝑛
91
𝑝(1 − 𝑝)
𝜎𝑝 =
𝑛
92
Determinación del error, considerando la
amplitud del intervalo
𝑝·𝑞 𝜎
𝑒 ≤∙ 𝑍1−𝛼/2 · 𝑒 ≤ 𝑍1−𝛼/2 ·
𝑛 𝑛
𝑝·𝑞 𝑁−𝑛
𝑒 ≤ 𝑍1−𝛼/2 · 𝜎 𝑁−𝑛
𝑛 𝑛−1 𝑒 ≤ 𝑍1−𝛼/2 ·
𝑛 𝑛−1
2 2
𝑍1−𝛼/2 ·𝑝·𝑞 𝑍1−𝛼/2 · 𝜎2
𝑛= 𝑛=
𝑒2 𝑒2
Si no se conoce la desviación 𝑥𝑖 − 𝑥 2
𝜎=𝑠=
poblacional: 𝑛−1
PARA ESTIMAR LA MEDIA POBLACIONAL (µ)
E: Estratos
W: Peso (proporción de los estratos)
Se desea estimar el nivel de aprendizaje en los estudiantes
de una facultad, organizados en: excelentes (1), Muy
buenos (2), Buenos (3).El detalle se presenta en la
siguiente tabla:
n1 = 3, n2 = 7, n3 = 13 n1 = 2, n2 = 7, n3 = 14
Se desea determinar el nivel de satisfacción que experimentan los
estudiantes, con relación a sus expectativas académicas en la Universidad,
con un error del 10%.
Estrato NE PE QE NhPhQh
1 500 38% 62% 118
2 1000 45% 55% 248
3 2000 60% 40% 480
3500 845
Afijación proporcional
n1 = 13, n1 = 27, n1 = 53
Tamaño de la muestra
Estimación de proporciones
105
Tamaño de muestra para comparar dos
grupos
Tamaño de muestra para comparar dos
proporciones
n
Z * α 2p(1 p) Zβ * p1 (1 p1 ) p 2 (1 p 2 )
2
(p1 p 2 ) 2
Zα = Valor correspondiente al riesgo. Valores Zα
Zβ = Valor correspondiente al poder o potencia. Potencia . Valores Zβ
(es recomendable que esté entre el 80 a 90%)
Solución n
1.96 * 2 * 0.8(1 0.8) 0.842 * 0.7(1 0.7) 0.9(1 0.9) 2
(0.7 0.9) 2
p1 = 0,7
p2 = 0,9 n = 61
Zα = 1,96
Zβ = 0,842
p = 0,8
Tamaño de muestra para comparar
dos medias
2( Z Z ) * s 2 2
n 2
e
Solución:
e = 15 2(1,645 1,282) 2 *162
n
S = 16 152
Zα = 1,645 n = 20
Zβ = 1,282
Validación del Tamaño de Muestra
Una muestra para variables cuantitativas se puede validar de acuerdo con el
efecto tamaño. Cieza (2001) indica que “una buena observación se sugiere
tenga un efecto tamaño menor o igual a 0.5”
e
Et
Donde:
s
Et= Efecto tamaño
d = Valor mínimo de la diferencia que se desea detectar.
S = Desviación estándar
Tamaño de Muestra Ajustado a las
Pérdidas
En todo proyecto se deben considerar imprevistos que pueden hacer que
el tamaño de muestra calculada inicialmente se vea afectada ya sea por
que el sujeto de estudio se mudó, no desea participar, abandona, viaja,
etc. Se emplea la siguiente fórmula:
n
nc
1 pe
Donde:
nc = muestra corregida
n = Muestra calculada
Pe = Porcentaje de pérdidas
Resumen de Formulas
113
FÓRMULAS PARA CALCULAR EL TAMAÑO DE
MUESTRA DE UN GRUPO
Población
desconocida
Variable
cualitativa
(Una
proporción)
Población
conocida
Tamaño de muestra
para un grupo
Población
desconocida
Variable
Cuantitativa
(Una media)
Población
conocida
FÓRMULAS PARA CALCULAR EL TAMAÑO DE
MUESTRA DE DOS GRUPOS
Variable
cualitativa
(Dos
Tamaño de proporciones)
muestra
para dos
grupos Variable
cuantitativa
(Dos medias)
Metodología LQAS
Lot Quality Aceptance Sampling
Muestreo de Aceptación de la Calidad del
Lote
116
¿Qué es LQAS?
• Es un método de muestreo que puede ser usado
para identificar áreas prioritarias (Ej. Servicios,
médicos, Programas de educación, etc.) o
indicadores que no alcanzan coberturas promedio o
que no alcanzan a la meta
120
TERMINOLOGIA BÁSICA
LOTE: población del área de supervisión que será potencialmente analizada.
ÁREA DE SUPERVISIÓN: área geográfica del proyecto que está a cargo de uno o más
supervisores de la organización.
MUESTRA: población seleccionada aleatoriamente para representar el área de supervisión.
MUESTREO ALEATORIO: cuando toda la población del área de supervisión tiene la misma
posibilidad de ser seleccionada en la muestra.
REGLA DE DECISIÓN: El número mínimo de respuestas correctas esperadas en la muestra
para juzgar si un área de supervisión alcanza la meta y/o cobertura promedio del proyecto.
META: Es lo que establece la organización como el nivel mínimo esperado de cobertura.
COBERTURA PROMEDIO: Es la cobertura promedio de la organización en el área total del
proyecto.
INDICADOR PRIORITARIO: si el número de respuestas correctas es menor que la regla de
decisión de la cobertura promedio y/o de la meta del proyecto
ÁREA DE SUPERVISIÓN PRIORITARIA: son las áreas que están por debajo de la meta y/o de
la cobertura promedio del proyecto.
Tamaño de la muestra de LQAS
Cumplen la
Identificar recursos humanos que Meta de
pueden ayudar en las áreas de
menor cobertura
cobertura
ACUMULADO
1 170 170
2 213 383
3 153 536
4 113 649
5 170 819
6 160 979
7 150 1139
8 170 1299
9 150 1449
10 150 1599
11 95 1694
12 89 1783
13 150 1933
14 124 2057
15 128 2785
16 125 2310
17 320 2630
Paso 3. Calcular el intervalo de muestreo (IM)
Paso 4: Elegir un número aleatorio, para realizar la
selección por MASIS
• Se comienza a seleccionar a
partir del # aleatorio
obtenido
• Comenzando en 77 se va
aumentado 138, hasta
completar las 19 unidades
de muestreo.
Ficha de tabulación
3
Uso de la tabla de decisiones
# Indicador Total de respuestas correctas en Total Tamaño de muestra Total Cobertura Cobertura
cada lote/regla de decisión correctas tamaño promedio/ objetivo
en el de total o Meta
1 2 3 4 5 program 1 2 3 4 5 muestr correctas/t
a a en el amaño
progra muestra
ma
1
3
¿Cómo definir prioridades con LQAS?
138
Poblaciones difíciles de alcanzar
Diversidad sexual
Asociaciones de
diversidad sexual
No Discos
Identificados Bares
Trabajadores
<<Closet>> Sexuales Saunas
Asisten a sitios
conocidos
Metodología de muestreo
Semilla
•Censo / Enumeración
•Sondeos en la población
•Métodos multiplicadores
•Captura - Recaptura
CENSO
Recuento total de
individuos que
componen la
población
Consiste en contar o
enumerar por completo
todos los individuos
sobre un área dada.
Métodos de Captura Recaptura
n1n2 (200)(100)
Nˆ 1000
m 20
159