You are on page 1of 27

TEORA DE LA PROBABILIDAD Y COLAS

UNIDAD 1: ESTADISTICA DESCRIPTIVA


Estefana Patio Hoyos
Universidad de Antioquia 2012

ESTADSTICA

Es la ciencia encargada de recoger, analizar e interpretar los datos numricos relativos a un conjunto de elementos. Como ciencia aplicada se ocupa del estudio de los mtodos y procedimientos para efectuar esa recogida, clasificacin y resumen de los datos.

El gran mrito de la Estadstica como disciplina, es proporcionar las herramientas necesarias para obtener conclusiones sobre una poblacin, a partir de la observacin de tan slo una muestra de la misma. La incertidumbre inherente al proceso de generalizacin es estudiada y medida con base en la teora de la probabilidad la cual permite tener la informacin acerca de la confianza asociada con las conclusiones resultantes de la inferencia realizada.

La Estadstica en el mbito de la Ciencia y la Ingeniera


Prueba de una vacuna Determinacin de la dosis de una droga Caracterizacin de la demanda por el servicio de urgencia hospitalaria Control de calidad Comparacin de la eficiencia de dos procesos Produccin agrcola Econometra Anlisis actuarial

Algunos problemas que resuelve la Estadstica

Descripcin de datos: Es el primer problema que aborda. Se trata de encontrar procedimientos para resumir la informacin obtenida de los datos. Anlisis de Muestras: En numerosas ocasiones no es posible estudiar todos los elementos de una poblacin (ya sea por razones tcnicas o econmicas), por lo que se toma una muestra.

Contrastacin de Hiptesis: La contrastacin de hiptesis requiere una metodologa para comparar las predicciones resultantes de la hiptesis con los datos observados y el diseo de experimentos para garantizar que las conclusiones que se extraigan de la experimentacin no estn invalidadas por factores no controlados. Prediccin: Muchas variables, sobre todo econmicas, tienen cierta inercia en su evolucin y aunque son valores desconocidos, el estudio de su historia es informativo para prever su evolucin futura.

Las Ciencias Estadsticas


Estadstica Descriptiva:

Se utiliza cuando los resultados del anlisis estadstico no pretende ir ms all del conjunto de datos investigados.

Describe numricamente, analiza y representa un conjunto de datos ordenados mediante la utilizacin de mtodos numricos, tablas y grficas, simplificando y resumiendo la informacin.

Las Ciencias Estadsticas


Estadstica Inferencial:

Se utiliza para predecir datos futuros a partir de los valores observados, permitiendo hacer una ley aproximada de lo que ocurra en el futuro.

Se apoya en el clculo de probabilidades y a partir de unos datos, efecta estimaciones, decisiones, predicciones y otras generalizaciones sobre un conjunto mayor de datos.

Estadstica Descriptiva

Estadstica Inferencial
Se observa un fenmeno, se recogen los datos de una muestra y se decide sobre qu parmetro se desea hacer una inferencia. Se propone un modelo estadstico que se supone genera la clase de datos deseados. Tcnicas: Estimacin puntual Intervalos de confianza Pruebas de hiptesis Clster o agrupamiento de individuos

Conceptos bsicos

Poblacin (colectivo o universo): Conjunto de unidades, elementos o individuos sobre los que se realiza el estudio, y que cumplen una determinada caracterstica o propiedad. Ejemplos: Todos los egresados de Ingeniera de Sistemas del ao anterior. El conjunto de osos hormigueros que vive en la selva Amaznica.

Muestra: Es cualquier subconjunto de la poblacin que se debe considerar representativa de la misma. El proceso mediante el cual se extrae una muestra se llama muestreo. Dato: Es cada valor incluido en la muestra. Se le puede obtener mediante observacin o medicin.

Tipos de datos:

Categricos (cualitativos): Datos o caractersticas que clasifican sectores de la poblacin. Ej.: Religin, estado civil, tipo de sangre, etc. Cuantitativos: Caractersticas que pueden ser medidas, es decir, pueden ser registradas numricamente.

Variable: Alguna caracterstica observable de los elementos de una poblacin y que puede tomar diferentes valores.

Tipos de variables:

Discretas: Estn asociadas a conteos. Ej: # de peronas en un fila, # de defectos en una pieza. Continuas: Estn asociadas a mediciones. Pueden tomar cualquier valor dentro de un intervalo especfico. Ej: Ingreso mensual de un hogar, peso en kg.

Mtodos grficos y numricos para describir datos cualitativos

La forma ms sencilla de describir de forma numrica una variable cualitativa es determinar su distribucin de frecuencias. Por su parte, esta distribucin de frecuencias determina a su vez las representaciones grficas ms usuales.
Supongamos que tenemos una variable cualitativa, que toma una serie de posibles valores (categoras). El nmero de veces que se da cada valor es la distribucin de frecuencias de la variable. Si en vez de dar el nmero de veces nos fijamos en la proporcin de veces, tenemos la distribucin de frecuencias relativas.

Las representaciones grficas ms usuales son los diagramas de barras y los diagramas de sectores.

Los diagramas de barras son una representacin de cada una de las categoras de la variable mediante una barra colocada sobre el eje X y cuya altura sea la frecuencia o la frecuencia relativa de dichas categoras. Los diagramas de sectores (circulares o torta) son crculos divididos en tantos sectores como categoras, sectores cuyo ngulo debe ser proporcional a la frecuencia de cada categora.

Ejemplo. Tomamos como poblacin los 98 reactores nucleares ms grandes en todo el mundo. Nos fijamos en la variable o dato referente al pas donde estn localizados.

Tabla de frecuencias:

Grfico de barras:

Grfico de sectores:

Mtodos grficos para describir datos cuantitativos

Si tenemos una variable cuantitativa discreta y sta toma pocos valores, podemos tratarla como si fuera una variable cualitativa, calcular su distribucin de frecuencias y dibujar un diagrama de barras. Ejemplo. En una empresa con cadena de montaje donde se empaquetan piezas en cajas se realiza un estudio sobre la calidad de produccin. Los datos siguientes informan sobre el nmero de piezas defectuosas encontradas en una muestra de cajas examinadas: 00000011111111122222222223333333 4444444555566666777889

Sin embargo, la mayora de variables cuantitativas son de tipo continuo, de manera que toman demasiados valores como para que la representacin de su distribucin de frecuencias sea til. Por ello el mtodo grfico ms comn y tradicional para datos cuantitativos es el histograma.

El histograma es una representacin de como se distribuyen las frecuencias en trminos de rectngulos cuyas bases indican las clases o intervalos y cuyas reas son proporcionales a sus frecuencias o frecuencias relativas correspondientes.

Para obtener un histograma de forma manual deben seguirse los siguientes pasos:

Calculamos el nmero, N, de intervalos que vamos a utilizar. Se recomienda que sea aproximadamente igual a la raz cuadrada del nmero de datos. Tambin se les llama clases.
Calculamos el rango, R, del histograma, que ser ligeramente ms amplio que el rango de los datos. El histograma debe comenzar en un nmero ligeramente por debajo del mnimo de los datos y terminar en un nmero ligeramente por encima del mximo. El rango del histograma ser, por tanto,

Calculamos la longitud, L, de los intervalos o amplitud de las clases, como el cociente entre el rango del histograma y el nmero de intervalos, es decir, L = R/N .

Se construyen los N intervalos:

Para cada intervalo, contamos el nmero de datos que hay en l, es decir, la frecuencia del intervalo. El histograma es un diagrama de barras donde en el eje X se colocan los intervalos y sobre ellos se construyen barras cuya altura sea la frecuencia o la frecuencia relativa del intervalo. En este caso, las barras deben dibujarse sin espacio entre ellas.

Ejemplo. Los datos siguientes corresponden al tiempo necesario para procesar 25 trabajos en una CPU. 1.17 1.61 1.16 1.38 3.53 1.23 3.76 1.94 0.96 4.75 0.15 2.41 0.71 0.02 1.59 0.19 0.82 0.47 2.16 2.01 0.92 0.75 2.59 3.07 1.4 Dado que , utilizaremos 5 intervalos. El mnimo de los datos es 0.02 y el mximo 4.75, de manera que podemos considerar como rango del histograma el intervalo [0, 4.8], cuya longitud (rango del histograma) es 4.8. La longitud de los intervalos es, en ese caso, 4.8/5=0.96.

Construimos los intervalos:

Calculamos la distribucin de frecuencia asociada a esos intervalos:

Finalmente, el Histograma es el siguiente

You might also like