Professional Documents
Culture Documents
ASIGNATURA:
TEMA:
PROFESOR:
CPC. Larrea Chucas Mariano
ALUMNO:
Idrogo Celis, Jimmy Anderson
CICLO ACADEMICO:
Quinto
La media muestral es el estimador usual de una media poblacional. Sin embargo, diferentes
muestras escogidas de la misma población tienden en general a dar distintos valores de
medias muestrales. El error estándar de la media (es decir, el error debido a la estimación
de la media poblacional a partir de las medias muestrales) es la desviación estándar de todas
las posibles muestras (de un tamaño dado) escogidos de esa población. Además, el error
estándar de la media puede referirse a una estimación de la desviación estándar, calculada
desde una muestra de datos que está siendo analizada al mismo tiempo.
2. Formule y desarrolle un ejemplo de muestreo probabilístico:
Supongamos que queremos medir la satisfacción de los clientes de una empresa. Para poder
generar un marco muestral, podríamos acceder al sistema informático de la empresa y extraer
una lista de todas las personas que han contratado un producto en el último año. Cada una de
las personas de esa lista serían unidades muestrales. Seleccionando un conjunto de estos
clientes, obtendría una muestra.
En este caso, la línea negra horizontal representa el valor fijo de la media desconocida de la
población, µ. Los intervalos de confianza azules verticales que se sobreponen a la línea
horizontal contienen el valor de la media de la población. El intervalo de confianza rojo que
está completamente por debajo de la línea horizontal no lo contiene. Un nivel de confianza
de 95% indica que 19 de 20 muestras (95%) de la misma población producirán intervalos de
confianza que incluirán el parámetro de población.
Más formalmente es una función medible T que, dada una muestra estadística de
valores (X_{1},X_{2},...,X_{n}), les asigna un número, T(X_{1},X_{2},...,X_{n})}, que
sirve para estimar determinado parámetro de la distribución de la que procede la muestra.
Así, por ejemplo, la media de los valores de una muestra (media muestral) sirve para estimar
la media de la población de la que se ha extraído la misma; la varianza muestral podría usarse
para estimar la varianza poblacional, etc.1 Esto se denomina como realizar una estimación
puntual.
La relación entre dos variables cuantitativas queda representada mediante la línea de mejor
ajuste, trazada a partir de la nube de puntos. Los principales componentes elementales de una
línea de ajuste y, por lo tanto, de una correlación, son la fuerza, el sentido y la forma:
La fuerza extrema según el caso, mide el grado en que la línea representa a la nube de
puntos: si la nube es estrecha y alargada, se representa por una línea recta, lo que indica
que la relación es fuerte; si la nube de puntos tiene una tendencia elíptica o circular, la
relación es débil.
El sentido mide la variación de los valores de B con respecto a A: si al crecer los valores
de A lo hacen los de B, la relación es directa (pendiente positiva); si al crecer los valores
de A disminuyen los de B, la relación es inversa (pendiente negativa).
La forma establece el tipo de línea que define el mejor ajuste: la línea recta, la curva
monotónica o la curva no monotónica.
Coeficientes de correlación
Existen diversos coeficientes que miden el grado de correlación, adaptados a la naturaleza de
los datos. El más conocido es el coeficiente de correlación de Pearson (introducido en
realidad por Francis Galton), que se obtiene dividiendo la covarianza de dos variables entre
el producto de sus desviaciones estándar. Otros coeficientes son:
Cuando los valores altos de una de las variables suelen mayoritariamente corresponderse con
los valores altos de la otra, y lo mismo se verifica para los pequeños valores de una con los
de la otra, se corrobora que tienden a mostrar comportamiento similar lo que se refleja en un
valor positivo de la covarianza
Por el contrario, cuando a los mayores valores de una variable suelen corresponder en general
los menores de la otra, expresando un comportamiento opuesto, la covarianza es negativa.
El signo de la covarianza, por lo tanto, expresa la tendencia en la relación lineal entre las
variables.
La magnitud requiere un esfuerzo adicional de interpretación:
La versión normalizada de la covarianza, el coeficiente de correlación indica la magnitud
de la especificidad de la relación lineal.
Se debe distinguir entre:
(1) la covarianza de dos variables aleatorias, parámetro estadístico de
una población considerado una propiedad de la distribución conjunta y
(2) la covarianza muestral que se emplea como un valor estadísticamente
estimado del parámetro.
7. ¿Qué significa tamaño de muestra y como se calcula?
El tamaño de la muestra es el número de sujetos que componen la muestra extraída de
una población, necesarios para que los datos obtenidos sean representativos de la población.
¿Cómo se determina el tamaño de una muestra?
Determinar el tamaño de la muestra que se va a seleccionar es un paso importante en
cualquier estudio de investigación de mercados, se debe justificar convenientemente de
acuerdo al planteamiento del problema, la población, los objetivos y el propósito de la
investigación
Cálculo del tamaño de una muestra conociendo el tamaño de la población
La fórmula para calcular el tamaño de muestra cuando se desconoce el tamaño de la
población es la siguiente:
En donde
Z = nivel de confianza,
P = probabilidad de éxito, o proporción esperada
Q = probabilidad de fracaso
D = precisión (error máximo admisible en términos de proporción)
Cálculo del tamaño de una muestra desconociendo el tamaño de la población
La fórmula para calcular el tamaño de muestra cuando se conoce el tamaño de la población
es la siguiente:
Selección aleatoria:
Selección sistemática:
Es un tipo de muestreo que es aplicable cuando los elementos de la población sobre la que
se realiza el muestreo están ordenados. Este procedimiento de muestreo se basa en tomar
muestras de una manera directa y ordenada a partir de una regla determinística, también
llamada sistemática.