You are on page 1of 7

dfsfs

ESCUELA PROFESIONAL DE CONTABILIDAD

ASIGNATURA:

Metodología de la investigación científica

TEMA:

Preguntas sobre análisis estadístico

PROFESOR:
CPC. Larrea Chucas Mariano

ALUMNO:
Idrogo Celis, Jimmy Anderson

CICLO ACADEMICO:
Quinto

Lambayeque, Julio del 2018


1. ¿En qué consiste error estándar?
El error estándar es la desviación estándar de la distribución muestral de un estadístico. El
término se refiere también a una estimación de la desviación estándar, derivada de una
muestra particular usada para computar la estimación.

La media muestral es el estimador usual de una media poblacional. Sin embargo, diferentes
muestras escogidas de la misma población tienden en general a dar distintos valores de
medias muestrales. El error estándar de la media (es decir, el error debido a la estimación
de la media poblacional a partir de las medias muestrales) es la desviación estándar de todas
las posibles muestras (de un tamaño dado) escogidos de esa población. Además, el error
estándar de la media puede referirse a una estimación de la desviación estándar, calculada
desde una muestra de datos que está siendo analizada al mismo tiempo.
2. Formule y desarrolle un ejemplo de muestreo probabilístico:
Supongamos que queremos medir la satisfacción de los clientes de una empresa. Para poder
generar un marco muestral, podríamos acceder al sistema informático de la empresa y extraer
una lista de todas las personas que han contratado un producto en el último año. Cada una de
las personas de esa lista serían unidades muestrales. Seleccionando un conjunto de estos
clientes, obtendría una muestra.

La proporción existente entre el tamaño de la muestra y el tamaño del marco muestral se


conoce como fracción muestral, y ya vimos en un post anterior que esta fracción junto al
tamaño del marco muestral, define la precisión de los resultados que obtendré al encuestar la
muestra.
Muestreo probabilístico
Hablaremos de muestro probabilístico siempre que se cumplan dos condiciones:
(1) Todos los elementos de mi población tienen una probabilidad mayor de cero de ser
seleccionados en la muestra.
(2) Conozco de forma precisa dicha probabilidad para cada elemento, lo que se conoce como
probabilidad de inclusión.
El cumplimiento de ambos criterios es el que hace posible obtener resultados no sesgados
cuando estudio la muestra. En ocasiones, estos resultados no sesgados requieren usar técnicas
de ponderación (weighting), pero esta ponderación es posible precisamente porque conozco
qué probabilidad tengo de que cada individuo sea seleccionado en mi muestra. Las muestras
generadas en estas condiciones se conocen también como muestras probabilísticas.
La definición anterior nos lleva a concluir que sólo podemos hacer muestreo probabilístico
si dispongo de un marco muestral. El censo de un país, el conjunto de direcciones de hogares
en una población o la lista de clientes de una empresa, son ejemplos de marcos muestrales
que hacen posible un muestreo probabilístico. En cada uno de estos casos, el universo a
estudiar es diferente: habitantes de un país, hogares de una población y clientes de una
empresa, respectivamente.
Una vez tengo un marco muestral, la forma exacta que empleo para seleccionar mi muestra
define las diferentes técnicas de muestreo probabilístico: Muestreo aleatorio simple,
muestreo sistemático, muestreo estratificado, muestreo por conglomerados, muestreo
desproporcionado.

3. Explique con ejemplo el significado de nivel de confianza:

Nivel de confianza: es el grado de certeza (o probabilidad), expresado en porcentaje con el


que queremos realizar la estimación de un parámetro a través de un estadístico muestral.

El nivel de confianza representa el porcentaje de intervalos que incluirían el parámetro de


población si usted tomara muestras de la misma población una y otra vez. Por lo general, un
nivel de confianza de 95% funciona adecuadamente. Esto indica que si usted recogió cien
muestras y creó cien intervalos de confianza de 95%, cabría esperar que aproximadamente
95 de los intervalos incluyeran el parámetro de población, tal como la media de la población,
como se muestra en la siguiente figura.

En este caso, la línea negra horizontal representa el valor fijo de la media desconocida de la
población, µ. Los intervalos de confianza azules verticales que se sobreponen a la línea
horizontal contienen el valor de la media de la población. El intervalo de confianza rojo que
está completamente por debajo de la línea horizontal no lo contiene. Un nivel de confianza
de 95% indica que 19 de 20 muestras (95%) de la misma población producirán intervalos de
confianza que incluirán el parámetro de población.

4. ¿Qué significa el promedio muestral?

El promedio muestral es una medida cuantitativa, derivada de un conjunto de datos de


una muestra, con el objetivo de estimar o inferir características de
una población o modelo estadístico.

Más formalmente es una función medible T que, dada una muestra estadística de
valores (X_{1},X_{2},...,X_{n}), les asigna un número, T(X_{1},X_{2},...,X_{n})}, que
sirve para estimar determinado parámetro de la distribución de la que procede la muestra.
Así, por ejemplo, la media de los valores de una muestra (media muestral) sirve para estimar
la media de la población de la que se ha extraído la misma; la varianza muestral podría usarse
para estimar la varianza poblacional, etc.1 Esto se denomina como realizar una estimación
puntual.

5. ¿Qué significa la correlación estadística?

la correlación indica la fuerza y la dirección de una relación lineal y proporcionalidad entre


dos variables estadísticas. Se considera que dos variables cuantitativas están correlacionadas
cuando los valores de una de ellas varían sistemáticamente con respecto a los valores
homónimos de la otra: si tenemos dos variables (A y B) existe correlación entre ellas si al
disminuir los valores de A lo hacen también los de B y viceversa. La correlación entre dos
variables no implica, por sí misma, ninguna relación de causalidad

La relación entre dos variables cuantitativas queda representada mediante la línea de mejor
ajuste, trazada a partir de la nube de puntos. Los principales componentes elementales de una
línea de ajuste y, por lo tanto, de una correlación, son la fuerza, el sentido y la forma:

 La fuerza extrema según el caso, mide el grado en que la línea representa a la nube de
puntos: si la nube es estrecha y alargada, se representa por una línea recta, lo que indica
que la relación es fuerte; si la nube de puntos tiene una tendencia elíptica o circular, la
relación es débil.
 El sentido mide la variación de los valores de B con respecto a A: si al crecer los valores
de A lo hacen los de B, la relación es directa (pendiente positiva); si al crecer los valores
de A disminuyen los de B, la relación es inversa (pendiente negativa).
 La forma establece el tipo de línea que define el mejor ajuste: la línea recta, la curva
monotónica o la curva no monotónica.

Coeficientes de correlación
Existen diversos coeficientes que miden el grado de correlación, adaptados a la naturaleza de
los datos. El más conocido es el coeficiente de correlación de Pearson (introducido en
realidad por Francis Galton), que se obtiene dividiendo la covarianza de dos variables entre
el producto de sus desviaciones estándar. Otros coeficientes son:

 Coeficiente de correlación de Spearman


 Correlación de Kendall
 Correlación canónica
 Coeficiente de Correlación Intraclase
 Coeficiente de Correlación Biserial
 Correlación Poliserial
 Correlación Tetracórica
 Correlación Policórica
 Correlación de Kendall
 Correlación de Jaspen
 Correlación de Fechner

6. ¿Qué significa la covarianza?

la covarianza es un valor que indica el grado de variación conjunta de dos variables


aleatorias respecto a sus medias. Es el dato básico para determinar si existe una dependencia
entre ambas variables y además es el dato necesario para estimar otros parámetros básicos,
como el coeficiente de correlación lineal o la recta de regresión.

Cuando los valores altos de una de las variables suelen mayoritariamente corresponderse con
los valores altos de la otra, y lo mismo se verifica para los pequeños valores de una con los
de la otra, se corrobora que tienden a mostrar comportamiento similar lo que se refleja en un
valor positivo de la covarianza

Por el contrario, cuando a los mayores valores de una variable suelen corresponder en general
los menores de la otra, expresando un comportamiento opuesto, la covarianza es negativa.

El signo de la covarianza, por lo tanto, expresa la tendencia en la relación lineal entre las
variables.
La magnitud requiere un esfuerzo adicional de interpretación:
La versión normalizada de la covarianza, el coeficiente de correlación indica la magnitud
de la especificidad de la relación lineal.
Se debe distinguir entre:
(1) la covarianza de dos variables aleatorias, parámetro estadístico de
una población considerado una propiedad de la distribución conjunta y
(2) la covarianza muestral que se emplea como un valor estadísticamente
estimado del parámetro.
7. ¿Qué significa tamaño de muestra y como se calcula?
El tamaño de la muestra es el número de sujetos que componen la muestra extraída de
una población, necesarios para que los datos obtenidos sean representativos de la población.
¿Cómo se determina el tamaño de una muestra?
Determinar el tamaño de la muestra que se va a seleccionar es un paso importante en
cualquier estudio de investigación de mercados, se debe justificar convenientemente de
acuerdo al planteamiento del problema, la población, los objetivos y el propósito de la
investigación
Cálculo del tamaño de una muestra conociendo el tamaño de la población
La fórmula para calcular el tamaño de muestra cuando se desconoce el tamaño de la
población es la siguiente:

En donde
Z = nivel de confianza,
P = probabilidad de éxito, o proporción esperada
Q = probabilidad de fracaso
D = precisión (error máximo admisible en términos de proporción)
Cálculo del tamaño de una muestra desconociendo el tamaño de la población
La fórmula para calcular el tamaño de muestra cuando se conoce el tamaño de la población
es la siguiente:

En donde, N = tamaño de la población Z = nivel de confianza, P = probabilidad de éxito, o


proporción esperada Q = probabilidad de fracaso D = precisión (Error máximo admisible en
términos de proporción).

8. Establezca la diferencia entre unidad de análisis y unidad muestral:

Unidad de análisis es el "sujeto" al que se investiga.

Unidad de muestral es la unidad de la población a partir de las cuales se selecciona la muestra.


Por ejemplo: Uno puede tomar un hogar como unidad de análisis, y entrevistar al jefe de
hogar para obtener la información requerida. En este caso la unidad de análisis es el hogar, y
unidad de muestreo el jefe del hogar.
9. Explique el teorema del límite central:

El teorema del límite central es un teorema fundamental de probabilidad y estadística. El


teorema describe la distribución de la media de una muestra aleatoria proveniente de una
población con varianza finita. Cuando el tamaño de la muestra es lo suficientemente grande,
la distribución de las medias sigue aproximadamente una distribución normal. El teorema se
aplica independientemente de la forma de la distribución de la población. Muchos
procedimientos estadísticos comunes requieren que los datos sean aproximadamente
normales. El teorema de límite central le permite aplicar estos procedimientos útiles a
poblaciones que son considerablemente no normales. El tamaño que debe tener la muestra
depende de la forma de la distribución original. Si la distribución de la población es simétrica,
un tamaño de muestra de 5 podría producir una aproximación adecuada. Si la distribución de
la población es considerablemente asimétrica, es necesario un tamaño de muestra más
grande. Por ejemplo, la distribución de la media puede ser aproximadamente normal si el
tamaño de la muestra es mayor que 50. Las siguientes gráficas muestran ejemplos de cómo
la distribución afecta el tamaño de la muestra que se necesita.

10. Explique la selección aleatoria y selección sistemática:

Selección aleatoria:

Lo mismo que muestreo aleatorio. La selección se realiza de manera que cada


miembro de la población tenga la misma oportunidad de ser elegido.

Selección sistemática:

Es un tipo de muestreo que es aplicable cuando los elementos de la población sobre la que
se realiza el muestreo están ordenados. Este procedimiento de muestreo se basa en tomar
muestras de una manera directa y ordenada a partir de una regla determinística, también
llamada sistemática.