You are on page 1of 11

Universidad de los Andes

Facultad de Ingeniera
Escuela de sistemas
Mrida -Estado Mrida

Prof.: Francisco Barillas


Carrera: Ing. de Sistemas Jorge Ferrer
Materia: Estocstica I C.I: 23780175
Contenido
Estadstica Descriptiva
Medidas de Tendencia Central
o Media
o Mediana
o Moda
Medidas de Dispersin
o Varianza
o Desviacin Estndar
o Coeficiente de Variacin de Pearson
Grficos
o Grficos Lineal
o Diagrama Lineal
Diagramas
o Diagrama Circular
o Diagrama de Barras
Grficos de Barra Sencillos
Grficos de Barra Agrupados
Grficos de Barras Apilados
Pirmide de Poblacin
Histogramas
Polgonos de Frecuencia
Ojiva
Distribucin de Frecuencia Para Datos Agrupados en
Intervalos de clase
Estadstica descriptiva:
La estadstica descriptiva es la rama de la estadstica que recolecta, analiza y
caracteriza un conjunto de datos (peso de la poblacin, beneficios diarios de una
empresa, temperatura mensual,) con el objetivo de describir las caractersticas y
comportamientos de este conjunto mediante medidas de resumen, tablas o
grficos.
Medidas de tendencia central
Las medidas de tendencia central (o de centralizacin) son medidas que tienden a
localizar en qu punto se encuentra la parte central de un conjunto ordenado de
datos de una variable cuantitativa.
Media
Definimos media (tambin llamada promedio o media aritmtica) de un conjunto
de datos (X1, X2, .,XN) al valor caracterstico de una serie de datos resultado
de la suma de todas las observaciones dividido por el nmero total de datos.

Es decir:

,
Visto desde un punto de vista ms conceptual, la media aritmtica es el centro de
los datos en el sentido numrico, ya que intenta equilibrarlos por exceso y por
defecto. Es decir, si sumamos todas las diferencias de los datos a la media da
cero.
Mediana
La mediana (Me(X)) es el elemento de un conjunto de datos ordenados (X1, X2,
, XN) que deja a izquierda y derecha la mitad de valores.

Si el conjunto de datos no est ordenado, la mediana es el valor del conjunto tal


que el 50% de los elementos son menores o iguales y el otro 50% mayores o
iguales.
Moda
La moda (Mo(X)) es el valor ms repetido del conjunto de datos, es decir, el valor
cuya frecuencia relativa es mayor. En un conjunto puede haber ms de una moda.

Medidas de dispersin
Las medidas de dispersin o medidas de variabilidad muestran la variabilidad de
un conjunto de datos, indicando la mayor o menor concentracin de datos
respecto a las medias de centralizacin.
Varianza
La varianza (S2) mide la dispersin de los datos de una muestra respecto a la
media, calculando la media de los cuadrados de las distancias de todos los datos

Al elevar las diferencias al cuadrado se garantiza que las diferencias absolutas


respecto a la media no se anulan entre s. Adems, resaltan los valores alejados.
Siempre se cumple que la varianza es mayor o igual que cero (S2 0). La
varianza es cero cuando todos los datos son el mismo (ejemplo: {1,1,1,1,1}).
Si en vez de tratarse de una muestra, la varianza se refiere a la poblacin, el
denominador ser N.
Desviacin estndar
La desviacin estndar es la medida de dispersin (S) asociada a la media. Mide
el promedio de las desviaciones de los datos respecto a la media en las mismas
unidades de los datos.

Coeficiente de Variacin de Pearson


El coeficiente de variacin de Pearson (r) mide la variacin de los datos respecto a
la media, sin tener en cuenta las unidades en la que estn.

El coeficiente de variacin toma valores entre 0 y 1. Si el coeficiente es prximo al


0, significa que existe poca variabilidad en los datos y es una muestra muy
compacta. En cambio, si tienden a 1 es una muestra muy dispersa.
Para interpretar fcilmente el coeficiente, podemos multiplicarlo por cien para
tenerlo en tanto por cien.

Grficos
Un grfico (o grfica) es el recurso de representar los datos numricos por medio
de lneas, diagramas, dibujos, etc. La representacin grfica es un importante
suplemento al anlisis y estudio estadstico
Los grficos llaman la atencin del lector y hacen que de un vistazo ste tenga
una mayor comprensin de los datos. Un buen grfico puede captar al lector para
que a continuacin lea todo el estudio. Si un estudio se compone nicamente de
texto y tablas, posiblemente no todos los lectores lean el estudio.
Existen muchas clases de grficas. Se pueden destacar los siguientes tipos:
Grfico lineal
El grfico lineal (grfico de lneas o diagrama lineal) se compone de una serie de
datos representados por puntos, unidos por segmentos lineales. Mediante este
grfico se puede comprobar rpidamente el cambio de tendencia de los datos.
El diagrama lineal se suele utilizar con variables cuantitativas, para ver su
comportamiento en el transcurso del tiempo. Por ejemplo, en las series temporales
mensuales, anuales, trimestrales, etc.

Diagrama
Un diagrama es un tipo de representacin grfica que sirve para representar un
conjunto de datos.
Segn la RAE (Real Academia Espaola), un diagrama es un dibujo geomtrico
que sirve para demostrar una proposicin, resolver un problema o representar de
una manera grfica la ley de variacin de un fenmeno.
Existen diferentes tipos de diagramas, de los que se pueden destacar los
siguientes:

Diagrama Circular
El diagrama circular (tambin llamado diagrama de sectores o diagrama de pastel)
sirve para representar variables cualitativas o discretas. Se utiliza para representar
la proporcin de elementos de cada uno de los valores de la variable.
Consiste en partir el crculo en porciones proporcionales a la frecuencia relativa.
Entindase como porcin la parte del crculo que representa a cada valor que toma
la variable.

Clculo de los sectores


Un crculo completo son 360 (o 2 radianes). El ngulo de cada porcin debe ser
proporcional a la frecuencia de cada valor. Por ejemplo, si un valor representa un
50% del total de elementos, su sector del crculo tendr un ngulo de 180 (o
radianes).
Sea (X1,X2,,XN) un conjunto de elementos. La frmula para calcular el ngulo de
cada sector es la siguiente:
El ngulo de cada sector se calcula como 360 dividido por el total de sujetos (N) y
multiplicado por la frecuencia absoluta (ni), o bien el producto de la frecuencia
relativa (fi) por 360. Tambin podemos calcular el ngulo en radianes:

Diagrama de barras:
El diagrama de barras (o grfico de barras) es un grfico que se utiliza para
representar datos de variables cualitativas o discretas. Est formado por barras
rectangulares cuya altura es proporcional a la frecuencia de cada uno de los valores
de la variable.

Las principales caractersticas del diagrama de barras son:


En el eje de abcisas se colocan las cualidades de la variable, si la variable es
cualitativa, o los valores de dicha variable, si es discreta.
En el eje de ordenadas se colocan las barras proporcionales a la frecuencia relativa
o absoluta del dato.
Las barras pueden ser horizontales o verticales, segn si los valores de la variable
se reflejan en el eje horizontal o vertical.
Todas las barras deben tener el mismo ancho y no deben superponerse las unas
con las otras.
Existen cuatro tipos de grficos de barras segn las series de datos y como estn
estas representadas:
1. Grfico de barras sencillo
Representa los datos de una nica serie o conjunto de datos

2. Grfico de barras agrupados


Representa los datos de dos o ms series o conjuntos de datos.
Cada serie se representa en un mismo color.
Las barras se colocan una al lado de la otra por categora de la variable para
comparar las series de datos.

3. Grfico de barras apilado


Representa los datos de dos o ms series o conjuntos de datos.
Cada serie se representa en un mismo color.
Cada barra representa una categora de la variable, y se divide en segmentos que
representan cada una de las series de datos.
4. Pirmide de poblacin
Una pirmide de poblacin es un diagrama de barras bidireccional que muestra la
poblacin por sexo y rangos de edad en un momento determinado.
En el eje vertical se representan los intervalos de edades. En el eje horizontal se
representan los porcentajes de poblacin. En una direccin se representarn los
hombres y en el otro las mujeres

Histograma
Un histograma es una representacin grfica de datos agrupados mediante
intervalos. Los datos provienen de una variable cuantitativa continua. Gracias a l
puedes hacerte rpidamente una idea de la distribucin de los datos o muestra.
Tambin cabe emplear variables cualitativas ordinales, siendo necesario que el
nmero de datos sea alto.
Un histograma es un conjunto de rectngulos que representan las frecuencias
absolutas de cada uno de los intervalos. Los intervalos abarcan todo el conjunto sin
cortarse, de manera que un elemento est solo en un intervalo.

El histograma se construye de la manera siguiente:


En el eje de abscisas se colocan los intervalos, de menor a mayor.
En el eje de ordenadas se representan las frecuencias absolutas.
Se dibujan rectngulos de anchura igual y proporcional al intervalo. La altura es la
frecuencia absoluta. Los rectngulos son adyacentes, pero no intersectan entre s.
Polgonos de Frecuencia
Un polgono de frecuencias es un grfico que se utiliza para variables cuantitativas
discretas. Se representa mediante puntos que sealan la frecuencia absoluta de
cada valor y lneas que unen los puntos consecutivos.
Se puede dibujar un polgono de frecuencias a partir de un histograma. Para ello se
deben unir los puntos medios de las bases superiores de los rectngulos

Tambin se puede construir un histograma o su polgono de frecuencias, colocando


en ordenadas las frecuencias acumuladas.

Ojiva
Es un grfico de lnea que se disea utilizando en el eje horizontal las fronteras
superiores de una distribucin de frecuencias. La informacin se obtiene de la
columna de frecuencias acumuladas (absoluta o relativa). Las caractersticas son
las siguientes:
En el eje horizontal se colocan las fronteras superiores de cada intervalo
Todos los puntos tienen la misma distancia en el eje X
Las lneas permanecen unidas
El primer extremo termina sobre el eje horizontal
Los datos son numricos o continuos
En el cambio de intervalo es posible colocar el valor de la frecuencia absoluta o
relativa para una mejor comprensin de los datos.
La forma general de una ojiva es la siguiente:
Distribucin de Frecuencia Para Datos Agrupados en Intervalos de
clase
Cuando existe un gran nmero de datos, por lo general ms de 40, y los valores
extremos de una serie se encuentran muy distanciados entre s, en vez de
colocarlos uno a uno con su respectiva frecuencia en la distribucin, es conveniente
agruparlos en los llamados intervalos de clase.
Los intervalos de clase permiten simplificar el manejo de los datos, sin embargo, los
resultados se tornan menos precisos, que trabajando con datos directos. El error
producto de la agrupacin de intervalos de clase, disminuye a medida en que el
nmero de datos que cubra cada intervalo sea menor. Se recomienda construir
entre un mnimo de 5 y un mximo de 18 intervalos de clase. Deben tener el mismo
ancho.
Punto Medio o Marca de Clase de un intervalo de Clase; es el punto medio del
intervalo (valor que est situado a igual distancia de los extremos del intervalo). Para
calcular el punto medio de un intervalo de clase, se utiliza la siguiente frmula:
Xm = Xs + Xi = Li + Ls

You might also like