You are on page 1of 4

1 - PANORAMA GENERAL Y ESTADSTICA DESCRIPTIVA

POBLACIONES, MUESTRAS Y PROCESOS: o Poblacin: conjunto de elementos de referencia sobre el que se realizan las observaciones. o Censo: recuento de individuos que conforman una poblacin. o Muestra: subconjunto de casos o individuos de una poblacin. Es un medio hacia un fin, y no un fin. o Caractersticas de una poblacin: Categrica. Numrica. o Variable: cualquier caracterstica cuyo valor cambia entre los objetos de una poblacin. o Datos: resultado de observaciones efectuadas en las variables. Univariados: observacin de una sola variable. Bivariados: observacin de dos variables. Multivariados: observacin de ms de dos variables. o ESTUDIOS ENUMERATIVOS Vs ANALTICOS: En los estudios enumerativos, el inters se centra en un conjunto, finito, identificable e invariable, de individuos u objetos con los que se lleva a cabo el muestreo. Un estudios analticos, se define por naturaleza, uno que no es enumerativo. Marco de muestreo, es una lista de individuos u objetos con los que se lleva a cabo el muestreo. o RECOPILACIN DE DATOS: Muestra aleatoria simple: muestra en la que cualquier subconjunto particular de tamao especifico tiene la misma probabilidad de ser elegida. Muestreo estratificado: separacin de las unidades de la poblacin en grupos que no se traslapen, tomando una muestra de cada uno de los estratos. MTODOS GRFICO Y TABULAR EN ESTADSTICA DESCRIPTIVA: o Diagrama de tallo y hojas: Es una forma rpida de obtener una representacin visual ilustrativa de un conjunto de datos. Pasos para construir un diagrama de tallo y hojas: Seleccione uno o ms dgitos directores para los valores del tallo. Los dgitos finales se convierten en hojas. Liste los posibles valores del tallo en una columna vertical. Registre la hoja por cada observacin junto al valor correspondiente del tallo. Indique las unidades para tallos y hojas en algn lugar del diagrama. Un diagrama de tallos hoja transmite informacin de: Identificacin de un valor caracterstico o representativo. Grado de dispersin respecto al valor caracterstico. Presencia de algn hueco en los datos. Grado de simetra en la distribucin de los valores. Cantidad y ubicacin de picos. Presencia de cualquier valor atpico. o Diagramas de puntos: Es un resumen atractivo de datos numricos cuando el conjunto de datos es ms o menos pequeo o hay relativamente pocos valores de datos distintos. Cada observacin se representa por un punto arriba del lugar correspondiente en una escala de medicin horizontal. Cuando un valor se presenta ms de una vez, hay un punto para cada ocurrencia, y esos puntos se apilan verticalmente. Un diagrama de puntos transmite informacin de: Ubicacin. Dispersin. Valores extremos. Huecos.

Longinos Recuero Bustos, curso 2010/11. lrecuero1@alumno.uned.es

Histogramas: Una variable es: Discreta si su conjunto de valores posibles es finito o se puede enumerar en una sucesin infinita. Continua si sus valores posibles consisten en un intervalo completo en la recta numrica. La frecuencia ( ) de cualquier valor particular de una variable es la cantidad de veces que se presenta ese valor en el conjunto de datos o nmero de observaciones ( ). La frecuencia relativa ( ) del valor es la fraccin o proporcin de las veces que se presenta ese valor. Un distribucin de frecuencias es una tabla de o de , o ambas. Construccin de un histograma para datos discretos: Se determina la y la de cada valor de . Se marcan los posibles valores de en una escala horizontal. Arriba de cada valor se traza un rectngulo cuya altura es la o como alternativa la de ese valor. Construir un histograma para datos continuos, requiere subdividir el eje de las mediciones en una cantidad adecuada de intervalos de clase o clases, de modo que cada observacin est contenida en exactamente una clase. Construccin de un histograma para datos continuos, anchos de clase iguales: Se determina la y la para cada clase. Se marcan los lmites de clase en un eje de medicin horizontal. Arriba de cada intervalo de clase, se traza un rectngulo cuya altura es la o como alternativa la correspondiente Una regla emprica razonable para el nmero de clases ( ) es: Construccin de un histograma para datos continuos, anchos de clase desiguales: Despus de determinar la y la , se calcula la altura de cada rectngulo ( Las que resultan se denominan densidades ( ), y la escala vertical es la escala de densidad. Esto tambin funciona cuando los anchos de clase son iguales. Un histograma de densidades tiene una propiedad interesante. Al multiplicar por el ancho de clase ambos lados de la frmula de la densidad, se obtiene:

) con la frmula:

Es decir, el rea de cada rectngulo es la frecuencia relativa de la clase correspondiente. Adems, puesto que la suma de las frecuencias relativas debe ser 1, el rea total de los rectngulos en histograma de densidad es igual a 1. Formas de histogramas: Unimodal: Es el que sube hasta un solo pico y despus baja (a). Bimodal: Tiene dos picos distintos resultantes cuando el conjunto de datos consiste en observaciones de dos clases bastante distintas de individuos u objetos (b). Multimodal: Con ms de dos picos. Simtrico: Cuando la mitad izquierda es imagen especular de la mitad derecha (a). Sesgo positivo: Cuando el extremo derecho o superior se extiende comparado con el extremo izquierdo o inferior (c). Sesgo negativo: si se extiende a la izquierda (d).

Longinos Recuero Bustos, curso 2010/11. lrecuero1@alumno.uned.es

Datos cualitativos: Tanto una distribucin de frecuencias como un histograma se pueden construir cuando el conjunto de datos es de naturaleza cualitativa (categrica). Datos multivariados: Es comn que los datos sean de naturaleza multivariada. Es decir, si se obtiene una muestra de individuos u objetos y en cada uno se hacen dos mediciones o ms, entonces cada observacin consistira en varias mediciones en un individuo u objeto. MEDIDAS DE LOCALIZACIN: o A partir de los datos, se intenta extraer varias cantidades de resumen. o Una caracterstica importante de un conjunto de nmeros es su localizacin y, en particular, su centro. o La media o promedio aritmtico del conjunto: La media muestral de un conjunto de observaciones est dada por:

Para informar del valor de se recomienda usar exactitud decimal de un dgito decimal ms que para la exactitud de las . La mediana es defectuosa ante valores atpicos. Medida poblacional: promedio de los valores de la poblacin y se denota mediante la letra griega . La mediana: Valor medio cuando las observaciones se ordenan de menor a mayor. La mediana muestral se obtiene ordenando primero las observaciones de menor a mayor y despus: nico valor medio si es impar es par y valor ordenado valor ordenado

Promedio de los valores medios si

La mediana no es defectuosa ante valores atpicos. Mediana poblacional: denotada por y al igual que con y , se puede pensar en usar para hacer una inferencia sobre . Otras medidas de localizacin: Cuartiles: Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales. El 1er, 2 y 3er cuartil, determinan los valores correspondientes al 25%, al 50% y al 75% de los datos. El 2 cuartil coincide con la mediana. Percentiles: Medias recortadas: Es un trmino medio entre y Una media recortada al % (entre el 5 y 25%), se calcula eliminando el % ms pequeo y el % ms grande de una muestra ordenada y se promediara el resto. Proporciona una medida que no es tan sensible a valores atpicos como la media ni tan insensible como la mediana. Datos categricos y proporciones muestrales: Cuando los datos son categricos, una distribucin de frecuencias o distribucin de frecuencias relativas proporcionan un resumen efectivo de los datos. Las cantidades de resumen numricas, naturales, en esta situacin son cada una de las frecuencias y las frecuencias relativas. Longinos Recuero Bustos, curso 2010/11. lrecuero1@alumno.uned.es

MEDIDAS DE VARIABILIDAD: o Variabilidad: Grado de dispersin en torno al centro (media o mediana). o Desviacin: Segn el DRAE es, la diferencia entre la medida de una magnitud y el valor de referencia. o Varianza: Segn el DRAE es, la media de las desviaciones cuadrticas de una variable aleatoria, referidas al valor medio de esta. o Medidas de variabilidad para datos muestrales: Rango o recorrido: Es la diferencia entre los valores mximo y mnimo en la muestra. Desviaciones a partir de la media: Varianza muestral, que se denota por , se define por:

Una expresin opcional para

es:

Si utilizando la expresin opcional el valor de es negativo, entonces se ha cometido un error de clculo. Para solucionarlo se proponen varias propiedades de Sea una muestra y cualquier constante diferente de cero. 1. Si , ,, , entonces ,y 2. Si , , , entonces , , donde es la varianza muestral de las y es la varianza muestral de las . Desviacin estndar muestral, representada por , es la raz cuadrada (positiva) de la varianza: Varianza poblacional, que se denota por , se define por:

Desviacin estndar poblacional, representada por poblacional:

, es la raz cuadrada (positiva) de la varianza

Diagramas de caja: Es un resumen grfico basado en cuartiles que describe varias de las caractersticas ms destacables de un conjunto de datos: 1. Centro. 2. Dispersin. 3. Naturaleza y magnitud de cualquier desviacin respecto a la simetra. identificacin de valores atpicos. Por definicin: Se ordenan las observaciones de menor a mayor, separando la mitad ms pequea de la mitad ms grande; la mediana se incluye en ambas mitades si es impar. Entonces, el cuarto inferior es la mediana de la mitad ms pequea y el cuarto superior es la mediana de la mitad ms grande. Una medida de la dispersin que es resistente a los valore atpicos es la cuarta dispersin , dada por: cuarto superior cuarto inferior Diagramas de caja que muestran valores atpicos: Cualquier observacin ms all de 1.5 desde el cuarto ms cercano es un valor atpico. Un valor atpico es extremo si est a ms de 3 del cuarto ms cercano, y es moderado en cualquier otro caso. Cada valor atpico moderado se representa con un circulo lleno, y cada valor atpico extremo con un circulo vacio. Diagramas de caja comparativos o lado a lado: Son una forma muy eficaz de mostrar semejanzas y diferencias entre dos o ms conjuntos de datos de observaciones de la misma variable. Longinos Recuero Bustos, curso 2010/11. lrecuero1@alumno.uned.es

You might also like