You are on page 1of 16

Universidad Autónoma de Santo Domingo

Primada de América
Fundada el 28 de octubre del 1538
Facultad de Humanidades
Escuela de Psicología

Sustentante (autor/a)
Nathacha F. Henríquez González

Matrícula
100414567

Asignatura
Estadística Inferencial para Psicólogos (PSI-228)
Sección:
01

Maestro:
Joel A. Patiño De Los Santos
IV. DISTRIBUCIONES MUESTRALES. Y LA ESTIMACION

1. Diferencia entre población y muestra:

Una población es el conjunto de todos los elementos que interesan en un estudio. La población es todo
el grupo de individuos u objetos en estudio, y la muestra es una parte o subconjunto de dicha población.
Es el total de individuos que deseo estudiar o caracterizar.

En el ejemplo anterior es la población de México, pero podemos pensar en todo tipo de universos, más
generales y más concretos. Por ejemplo, si quiero saber cuánto fuman de media los fumadores de
México, el universo en este caso sería "los fumadores de México".

Una muestra es un subconjunto de la población. Es el conjunto de individuos del universo que


selecciono para estudiarlos, por ejemplo, a través de una encuesta.

POBLACIÓN o UNIVERSO: Es todo conjunto de elementos, finito o infinito, definido por una o más
características, de las que gozan todos los elementos que lo componen, y sólo ellos. En muestreo, se
entiende por población a la totalidad del universo que interesa conocer, y que es necesario que esté
bien definido para que se sepa en todo momento qué elementos lo componen. Conviene recordar que
población es el conjunto de elementos a los cuales se quieren inferir los resultados.

2. ¿Por qué muestrear la población? Razones para muestrear

Cuando se estudian las características de una población, existen diversas razones prácticas para preferir
la selección de porciones o muestras de una población para observar y medir. He aquí algunas razones
para muestrear:

1. Establecer contacto con toda la población requeriría


mucho tiempo. Un candidato para un puesto federal quizá desee determinar las posibilidades
que tiene de resultar electo. Una encuesta de muestreo en la que se utiliza el personal y las entrevistas
de campo convencionales de una empresa especializada en encuestas tardaría de uno o dos días. Con el
mismo personal y los mismos entrevistadores, y laborando siete días a la semana, se requerirían 200
años para ponerse en contacto con toda la población en edad de votar. Aunque fuera posible reunir a un
numeroso equipo de encuestadores, quizá no valdría la pena entrar en contacto con todos los votantes.
2. E l costo de estudiar todos los elementos de una
población resultaría prohibitivo. Las organizaciones que realizan encuestas de
opinión pública y pruebas entre consumidores, como Gallup Polls y Roper ASW, normalmente entran en
contacto con menos de 2 000 de las casi 60 millones de familias en Estados Unidos. Una organización
que entrevista a consumidores en panel cobra cerca de $40 000 por enviar muestras por correo y
tabular las respuestas con el fin de probar un producto (como un cereal para el desayuno, alimento para
gato o algún perfume). La misma prueba del producto con los 60 millones de familias tendría un costo
de aproximadamente $1 000 000 000.

3. Es imposible veriicar de manera física todos los elementos


de la población. Algunas poblaciones son infinitas. Sería imposible verificar toda
el agua del lago Erie en lo que se refiere a niveles de bacterias, así que se eligen muestras en diversos
lugares. Las poblaciones de peces, aves, serpientes o mosquitos son grandes, y se desplazan, nacen y
mueren continuamente. En lugar de intentar contar todos los patos que hay en Canadá o todos los
peces del lago Pontchartrain, se hacen aproximaciones mediante diversas técnicas: se cuentan todos los
patos que hay en un estanque, capturados al azar, se revisan las cestas de los cazadores o se colocan
redes en lugares predeterminados en el lago.

4. Algunas pruebas son de naturaleza destructiva. Si los


catadores de vino de Sutter Home Winery, California, se bebieran todo el vino para evaluar la vendimia,
acabarían con la cosecha y no quedaría nada disponible para la venta. En el área de producción
industrial: las placas de acero, cables y productos similares deben contar con una resistencia mínima a la
tensión. Para cerciorarse de que el producto satisface la norma mínima, el departamento de control de
calidad elige una muestra de la producción actual. Cada pieza se somete a tensión hasta que se rompe y
se registra el punto de ruptura (medido en libras por pulgada cuadrada). Es obvio que si se sometieran
todos los cables o todas las placas a pruebas de resistencia a la tensión no habría productos disponibles
para vender u utilizar. Por la misma razón, Kodak selecciona sólo una muestra de película fotográfica y la
somete a pruebas para determinar la calidad de todos los rollos que se producen; y sólo unas cuantas
semillas se someten a pruebas de germinación en Burpee, antes de la temporada de siembra.

5. Los resultados de la muestra son adecuados. Aunque


se contara con recursos suficientes, es difícil que la precisión de una muestra de 100% —toda la
población— resulte esencial en la mayoría de los problemas. Por ejemplo, el gobierno federal utiliza una
muestra de tiendas de comestibles distribuidas en Estados Unidos para determinar el índice mensual de
precios de los alimentos. Los precios del pan, frijol, leche y otros productos de primera necesidad se
incluyen en el índice. Resulta poco probable que la inclusión de todas las tiendas de comestibles de
Estados Unidos influya significativamente en el índice, pues los precios de la leche, el pan y otros
productos de primera neces

3. Ventajas e Desventajas del muestreo:

✔ Ventajas

 Rapidez y facilidad de realizar el estudio


 Menor número de sujetos a estudiar
 Menor costo económico
 Mayor validez del estudio.
 Mayor número de variable a estudiar
 Controlar y ajustar posibles variables de confusión.
 Es muy útil cuando el Universo es muy grande o Infinito.
 Cuando algunos de los elementos observados se destruye en la observación.
 El producto sufre menos daño al haber menos manipulación.

✘ Desventajas:

 Muestra representativa: no existe una definición formal que nos permita afirmar que una
muestra es o no representativa de la población objeto de estudio.
 Error de muestreo o error aleatorio: es el error que se comete debido al hecho de sacar
conclusiones sobre una población a partir del estudio de una muestra de ella.
4. MÉTODOS DE MUESTREO PROBABILÍSTICO:

son aquellos que se basan en el principio de probabilidad. Es decir, aquellos en los que todos los
individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y,
consiguientemente, todas las posibles muestras de tamaño n tienen la misma probabilidad de ser
elegidas. Sólo estos métodos de muestreo probabilístico nos aseguran la representatividad de la
muestra extraída y son, por tanto, los más recomendables. Dentro de los métodos de muestreo
probabilístico encontramos los siguientes tipos:

5. MUESTREO ALEATORIO SIMPLE:

En un muestreo aleatorio simple todos los individuos tienen la misma probabilidad de ser seleccionados.
La selección de la muestra puede realizarse a través de cualquier mecanismo probabilístico en el que
todos los elementos tengan las mismas opciones de salir. Por ejemplo uno de estos mecanismos es
utilizar una tabla de números aleatorios, o también con un ordenador generar números aleatorios,
comprendidos entre cero y uno, y multiplicarlos por el tamaño de la población, este es el que vamos a
utilizarada. Es aquel muestreo que mediante la asignación de números se selecciona de forma mecánica
varios elementos de la muestra.

6. MUESTREO ALEATORIO SISTEMÁTICO:

Es un tipo de muestreo aleatorio simple en el que los elementos se seleccionan según un patrón que se
inicia con una elección aleatoria. Es aquel muestreo que al igual que el aleatorio simple, se asignan
números a la muestra, pero la diferencia existente es que solo se selecciona un elemento de la muestra.

7. MUESTREO ALEATORIO ESTRATIFICADO:

Es aquel muestreo en la que se consideran que todos los elementos seleccionados en la muestra,
cumplan con los requisitos expuestos en el estudio.

8. MUESTREO ALEATORIO POR CONGLOMERADOS

un conglomerado se considera una agrupación de elementos que presentan características similares a


toda la población. Es aquel muestreo en las que se selecciona de forma directa la muestra.

Por ejemplo, para analizar los gastos familiares o para controlar el nivel de audiencia de los programas y
cadenas de televisión, se utiliza un muestreo por conglomerados-familias que han sido elegidas
aleatoriamente.

9. EL MUESTREO NO PROBABILÍSTICO:

es una técnica de muestreo donde las muestras se recogen en un proceso que no brinda a todos los
individuos de la población iguales oportunidades de ser seleccionados. El muestreo no probabilístico es
una técnica de muestreo en la cual el investigador selecciona muestras basadas en un juicio subjetivo en
lugar de hacer la selección al azar. El muestreo no probabilístico es más útil para estudios exploratorios
como la encuesta piloto (una encuesta que se implementa en una muestra más pequeña, en
comparación con el tamaño de muestra predeterminado). El muestreo no probabilístico se utiliza donde
no es posible extraer un muestreo de probabilidad aleatorio debido a consideraciones de tiempo o
costo.

Tipos de muestreo no probabilístico y ejemplos

1. Muestreo por conveniencia

El muestreo por conveniencia es una técnica de muestreo no probabilística donde las muestras de la
población se seleccionan solo porque están convenientemente disponibles para el investigador. Estas
muestras se seleccionan solo porque son fáciles de reclutar y porque el investigador no consideró
seleccionar una muestra que represente a toda la población. Son seleccionadas porque son accesibles
para el investigar, los sujetos son elegidos simplemente porque son fáciles de reclutar.

Un ejemplo de muestreo por conveniencia sería utilizar a estudiantes voluntarios que sean conocidos
del investigador. El investigador puede enviar la encuesta a los estudiantes y ellos en este caso actuarían
como muestra.

2. Muestreo consecutivo

Esta técnica de muestreo no probabilística es muy similar al muestreo por conveniencia (con una ligera
variación). Aquí, el investigador elige una sola persona o un grupo de muestra, realiza una investigación
durante un periodo de tiempo, analiza los resultados y luego pasa a otra asignatura o grupo de sujetos si
es necesario.

Esta técnica de muestreo le da al investigador la oportunidad de trabajar con muchos temas y afinar su
investigación mediante la recopilación de resultados que tienen conocimientos vitales.

Muestreo por cuotas

El muestreo por cuotas es una técnica de muestreo no probabilístico en donde el investigador asegura
una representación equitativa y proporcionada de los sujetos, en función de qué rasgo es considerado
base de la cuota.

Por ejemplo, si la base de la cuota es de nivel de año en la universidad y el investigador necesita una
representación igual, con un tamaño de muestra de 100, debe seleccionar 25 estudiantes de 1º año, 25
de 2° año, 25 de 3º año y 25 de 4º año. Las bases de la cuota generalmente son la edad, el género, la
educación, la etnia, la religión y el nivel socioeconómico.

Muestreo de bola de nieve

El muestreo de bola de nieve se lleva a cabo generalmente cuando hay una población muy pequeña. En
este tipo de muestreo, el investigador le pide al primer sujeto que identifique a otro sujeto potencial
que también cumpla con los criterios de la investigación. La desventaja de usar una muestra de bola de
nieve es que difícilmente sea representativa de la población.
DISEÑO DE ENCUESTAS

Una Distribuciones de muestreo:

es la distribución de las resultadas si en realidad seleccionara todas las muestras pasibles. El resultado
único que usted obtiene en la práctica es solo uno de las resultadas en Ja distribución de muestreo.

Una distribución de probabilidad de todas las medias posibles de las muestras es una distribución de las
medias de las muestras. Los especialistas en estadística la conocen como distribución de muestreo de la
media
distribución de muestra media

es la distribución de todas las medias muestrales posibles, si se seleccionaran todas las muestras
pasibles de un tamaño determinado.
Formula:

EJEMPLO DE DISTRIBUCION MUESTRAL MEDIA


Estimación (o estimar) es el proceso de encontrar una aproximación sobre una medida, lo que se ha de
valorar con algún propósito es utilizable incluso si los datos de entrada pueden estar incompletos,
incierto, o inestables. , un estimador es un estadístico de la muestra utilizado para estimar un parámetro
poblacional

Es cuando queremos realizar el estudio de una población cualquiera de la que desconocemos sus
parámetros. Por ejemplo:

Estimaciones puntuales: es el valor de un solo estadístico muestra1. como una media muesttal. Una
estimación puntual es un solo número que se utiliza para estimar un parámetro de población
desconocido. Un estimador puntual consiste en un solo valor (punto) deducido de una muestra para
estimar el valor de una población. Por ejemplo, suponga que elige una muestra de 50 ejecutivos de nivel
medio y le pregunta a cada uno la cantidad de horas que laboró la semana pasada. Se calcula la media
de esta muestra de 50 y se utiliza el valor de la media muestral como estimador puntual de la media
poblacional desconocida. Ahora bien, un estimador puntual es un solo valor.

Un enfoque que arroja más información consiste en presentar un intervalo de valores del que se espera
que se estime el parámetro poblacional. Dicho intervalo de valores recibe el nombre de intervalo de
confianza. Una estimación de intervalo es un rango de valores que se utiliza para estimar un parámetro
de la población. Una estimación de este tipo indica el error de dos maneras: por la extensión del
intervalo y por la probabilidad de que el verdadero parámetro poblacional se encuentre dentro del
intervalo. Una estimación de intervalo es un rango de números llamado Intervalo. que se construye en
torno a un estimador purnual. El Intervalo de confianza se construye de manera que permita conocer la
pro00b!11doo de que el Intervalo Incluya al parámetro poblac!onal.
Características estimadores:

1) Sesgo. Se dice que un estimador es insesgado si la Media de la distribución del estimador es igual al
parámetro. Estimadores insesgados son la Media muestral (estimador de la Media de la población) y
la Varianza (estimador de la Varianza de la población):

Ejemplo:

En una población de 500 puntuaciones cuya Media (m) es igual a 5.09 han hecho un muestreo aleatorio
(número de muestras= 10000, tamaño de las muestras= 100) y hallan que la Media de las Medias
muestrales es igual a 5.09, (la media poblacional y la media de las medias muestrales coinciden). En
cambio, la Mediana de la población es igual a 5 y la Media de las Medianas es igual a 5.1 esto es, hay
diferencia ya que la Mediana es un estimador sesgado.

La Varianza es un estimador sesgado. Ejemplo: La Media de las Varianzas obtenidas con la Varianza en
un muestreo de 1000 muestras (n=25) en que la Varianza de la población es igual a 9.56 ha resultado
igual a 9.12, esto es, no coinciden. En cambio, al utilizar la Cuasivarianza la Media de las Varianzas
muestrales es igual a 9.5, esto es, coincide con la Varianza de la población ya que la Cuasivarianza es
un estimador insesgado.

2) Consistencia. Un estimador es consistente si aproxima el valor del parámetro cuanto mayor es n


(tamaño de la muestra). Algunos estimadores consistentes son:

Ejemplo

En una población de 500 puntuaciones cuya Media (m) es igual a 4.9 han hecho tres muestreos
aleatorios (número de muestras= 100) con los siguientes resultados:
vemos que el muestreo en que n=100 la Media de las Medias muestrales toma el mismo valor que la
Media de la población.

3) Eficiencia. Diremos que un estimador es más eficiente que otro si la Varianza de la distribución
muestral del estimador es menor a la del otro estimador. Cuanto menor es la eficiencia, menor es la
confianza de que el estadístico obtenido en la muestra aproxime al parámetro poblacional.

Ejemplo:

La Varianza de la distribución muestral de la Media en un muestreo aleatorio (número de muestras:


1000, n=25) ha resultado igual a 0.4. La Varianza de la distribución de Medianas ha resultado, en el
mismo muestreo, igual a 1.12, (este resultado muestra que la Media es un estimador más eficiente que
la Mediana).

Ejemplo

Se generan 100000 muestras aleatorias (n=25) de una población que sigue la distribución Normal, y
resulta:

La distribución de las Medias muestrales aproxima al modelo Normal:

Cualidades de un buen estimador

a) Debe ser insesgado: un estimador es insesgado, si en promedio, tiende a tomar valores que están por
encima del parámetro de la población con la misma frecuencia y la misma extensión, con la que tiende a
asumir valores por debajo del parámetro de población que se está estimando.

b) Debe ser eficiente: de varios estimadores insesgados, el más eficiente es el que tiene el error
estándar más pequeño.
c) Debe ser consistente: significa que a medida que aumenta el tamaño de la muestra, la estimación se
aproxima al valor del parámetro.

d) Debe ser suficiente: significa que ningún otro estimador puede suministrar más información sobre el
parámetro.

Elaboración de, los intervalos de confianza:


Pasos

1. Escribe el fenómeno que te gustaría examinar:

Supongamos que trabajas con la siguiente situación: el peso promedio de un estudiante de género
masculino en la Universidad ABC es de 82 kg (180 lb). Analizarás qué tan precisamente podrás predecir
el peso de los estudiantes varones de la universidad ABC dentro de un intervalo de confianza dado.

2. Selecciona una muestra de tu población escogida:

Esta es la que utilizarás en la recolección de datos para evaluar tu hipótesis. Supongamos que
seleccionaste, al azar, 1000 estudiantes hombres.

3. Calcula el promedio y la desviación estándar de tu muestra. ...

Escoge un dato estadístico de tu muestra (por ejemplo, el promedio o la desviación estándar) que
quieras usar para estimar el parámetro de tu población escogida. Un parámetro de población es un valor
que representa una característica particular de la población. Así es cómo puedes encontrar el promedio
y la desviación estándar de tu muestra:

Para calcular el promedio (o media) de los datos de la muestra, solo suma todos los pesos de los 1000
hombres que elegiste y divide el resultado entre 1000, es decir, el número de hombres. Esto debe darte
un valor del peso promedio de 84,4 kg (186 lb).

Para calcular la desviación estándar de la muestra, tendrás que encontrar el promedio o la media de los
datos. Luego, tendrás que encontrar la varianza de los datos o el promedio al cuadrado de las
diferencias con respecto al valor medio. Una vez que encuentres este número, solo calcula su raíz
cuadrada. Supongamos que la desviación en este caso es de 14 kg (30 lb) (ten en cuenta que esta
información algunas veces podría estar disponible para ti al resolver un problema de estadística).

4. Elige el nivel de confianza que desees:

Los niveles de confianza usados con mayor frecuencia son 90 %, 95 % y 99 %. Al resolver un problema,
es posible que tengas este dato a tu disposición. Supongamos que escogiste 95 %.

5. Calcula tu margen de error:

Puedes encontrar el margen de error usando la siguiente fórmula: Za/2 * σ/√(n). Za/2 = coeficiente de
confianza, donde a = nivel de confianza, σ = desviación estándar, n = tamaño de muestra. Esta es otra
forma de decir que deberías multiplicar el valor crítico por el error estándar. Así es como puedes
resolver esta fórmula al dividirla en partes:
Para hallar el valor crítico, o Za/2: en este caso el nivel de confianza es de 95 %. Convierte el porcentaje
a un número decimal 0,95 y divídelo entre 2 para tener 0,025. Luego, revisa la tabla de valores z para
encontrar el valor que corresponde a 0,025. Verás que el valor más cercano es -1,96 en la intersección
de la fila 1,9 y la columna 0,6.

Calcula el error estándar: toma la desviación estándar, 14 kg (30 lb), y divídela entre la raíz cuadrada del
tamaño de la muestra, 1000. Obtendrás 14/31,6 o 0,44 kg (0,95 lb).

Multiplica 1,96 por 0,44 (tu valor crítico por tu error estándar) para obtener 0,86; tu margen de error.

6. Expresa tu intervalo de confianza:

Para expresar el intervalo de confianza, simplemente tienes que tomar el promedio o la media (82), y
escribirla al lado de ± y el margen de error. La respuesta es: 82 ± 0,86. Puedes encontrar los límites
superior e inferior del intervalo de confianza, sumando y restando el margen de error a la media.
Entonces, tu límite inferior es 82 – 0,86 o 81,14 kg (178,14 lb), y tu límite superior es 82 + 0,86, o 82,86
kg (181,86 lb).

También puedes usar esta fórmula práctica para encontrar el intervalo de confianza: x̅ ± Za/2 * σ/√(n).
Aquí, x̅ representa la media.

Error estándar de la media:

al sumar y restar al estimador puntual una cantidad llamada margen de error. La fórmula general de una
estimación por intervalo es

Estimación puntual ± Margen de error

El objetivo de la estimación por intervalo es aportar información de qué tan cerca se encuentra la
estimación puntual, obtenida de la muestra, del valor del parámetro poblacional.

Error Estándar de la Media Muestral

La raíz cuadrada de la varianza de la distribución del estadístico se denomina Error Estándar y


proporciona una medida de confiabilidad para el dato estadístico obtenido a partir de una muestra ya
que la desviación estándar es una medida del error del muestreo (de la variación en la muestra).

El error estándar (EE) es una medida de la variación del estimador que permite cuantificar el error de
estimación (variación entre las estimaciones).

El EE del estadistico media muestral indica la confiabilidad de la media obtenida de una muestra de
tamaño n, se calcula como
Suele ser útil expresar el error estándar en términos relativos. El error estándar es una estimación de
cuánto varía el valor de una estadística de prueba de muestra a muestra. El error estándar se calcula
tomando la desviación estándar de la distribución de muestreo para la estadística de prueba. La
distribución de muestreo es la distribución de todas las muestras posibles.

La desviación estándar (SD) representa la variación en los valores de una variable, mientras que el error
estándar de la media (Estándar Error of the Mean, SEM) representa la dispersión que tendría la media
de una muestra de valores si se continuaran tomando muestras. Por lo tanto, el SEM proporciona una
idea de la precisión de la media y el SD nos da una idea de la variabilidad de las observaciones
individuales. Estos dos parámetros están relacionados:

SEM = SD/√n

Donde:

SEM = Error estándar de la media

SD = Desviación estándar

n = tamaño de la muestra

Si EE representa el error estándar de un estimador , el error estándar relativo es . Un error estándar


relativo de hasta 0,20 podría ser admisible, pero un error estándar relativo de 0,80 implicaría que la
discrepancia promedio del estimador respecto del valor que está estimando, representa
aproximadamente un 80% del mismo-

Intervalo de población:

Criterios para la determinación del tamaño de una muestra:

Para determinar el tamaño de muestra necesario para estimar una proporción poblacional se utiliza
un método similar al empleado para la media poblacional.l Recuerde que al determinar el tamaño de
la muestra de un intervalo de confianza para la media. el error de muestreo se define por
Nivel de precisión

El nivel de precisión, también llamado error de muestreo, es el rango en donde se estima que está el
valor real de la población. Este rango se expresa en puntos porcentuales. Por lo tanto, si un investigador
descubre que el 70% de los agricultores de la muestra han adoptado una tecnología recomendada con
una tasa de precisión de ~+mn~ 5%, el investigador puede concluir que entre el 65% y el 75% de los
agricultores de la población han adoptado la nueva tecnología.

Nivel de confianza

El intervalo de confianza es la medida estadística del número de veces de cada 100 que se espera que
los resultados se encuentren dentro de un rango específico.

Por ejemplo, un intervalo de confianza de 90% significa que los resultados de una acción probablemente
cubrirán las expectativas el 90% de las veces.

La idea básica descripta en el Teorema del límite central es que cuando una población se muestrea
muchas veces, el valor promedio de un atributo obtenido es igual al valor real de la población. En otras
palabras, si un intervalo de confianza es del 95%, significa que 95 de 100 muestras tendrán el valor real
de la población dentro del rango de precisión.

Grado de variabilidad

Dependiendo de la población objetivo y los atributos a considerar, el grado de variabilidad varía


considerablemente. Cuanto más heterogénea sea una población, mayor deberá ser el tamaño de la
muestra para obtener un nivel óptimo de precisión. Ten en cuenta que una proporción de 55% indica un
nivel más alto de variabilidad que un 10% o un 80%. Esto se debe a que 10% y 80% significa que una
gran mayoría no posee o posee el atributo en cuestión.

Existen muchos enfoques para determinar el tamaño de la muestra, incluyendo el uso de un censo en el
caso de poblaciones más pequeñas, el uso de tablas publicadas, imitar un tamaño de muestra de
estudios similares y aplicar fórmulas para calcular un tamaño de la muestra.

Determinar el tamaño de la muestra que se va a seleccionar es un paso importante en cualquier estudio


de investigación de mercados, se debe justificar convenientemente de acuerdo al planteamiento del
problema, la población, los objetivos y el propósito de la investigación

La fórmula para calcular el tamaño de muestra cuando se desconoce el tamaño de la población es la


siguiente:

You might also like