You are on page 1of 26

AO DE LA PROMOCIN DE LA INDUSTRIA RESPONSABLE Y DEL

COMPROMISO CLIMTICO

Presentado por:
QUISPE GONZALES, RAUL CESAR

GEOESTADSTICA I

Docente:
Ing. AUGUSTO TEVES ROJAS

DISTRIBUCIN LOG-NORMAL, CONSTRUCCIN DE HISTOGRAMAS DE 1978


DATOS Y SU ANLISIS PP-PLOT

Escuela Acadmico Profesional de Ingeniera de Minas


Facultad de Ingeniera Geolgica, Minera y Metalrgica
UNIVERSIDAD NACIONAL DE INGENIERIA

05/NOVIEMBRE/2014

NDICE

DISTRIBUACION LOG-NORMAL
GEOESTADISTICA I

NDICE....
...
.2

OBJETIVOS.
....3

ALCANCES.
..4

INTRODUCCIN.
..5
MARCO
TERICO...
.6
CLCULO DE
HISTOGRAMAS.
.13
CALCULO DE PPPLOT.....16
ANLISIS Y EVALUACIN DE
RESULTADOS...19

DISTRIBUACION LOG-NORMAL
GEOESTADISTICA I

CONCLUSIONES
....20
ALGORITMO PARA GENERAR RANDOM CON DISTRIBUCIN
LOGNORMAL...21
BIBLIOGRAFA.
...22

OBJETIVOS

Analizar y elaborar el histograma de 1978 datos brindados por el


profesor el PhD Marn Suarez, que es una data tomada de un caso

real con el cual trabajaremos el siguiente trabajo.


Realizar y analizar el histograma con los logaritmos naturales de los

datos brindados, como ya se mencin por el profesor en clase.


Realizar y analizar la grfica pp-plot generada con los datos de clase
y la distribucin Normal, adems de esto tambin analizar cuando
existe perturbacin de datos.

DISTRIBUACION LOG-NORMAL
GEOESTADISTICA I

ALCANCES

En el presente informe se analizara el histograma para 1978 datos,


mediante el uso del histograma, para lo cual el profesor hizo entrega

de estos datos reales tomados en el campo.


A continuacin se analizara el histograma de los logaritmos de estos
1978 datos, de manera aleatoria y desordenada, con lo que se
realizara la comparacin con el histograma mencionado

anteriormente.
Por ltimo se analizara la grfica que genera el pp-plot, viendo las
conclusiones que se puede extraer de esta grfica, que es la
comparacin de los dos histogramas mencionados anteriormente.

DISTRIBUACION LOG-NORMAL
GEOESTADISTICA I

INTRODUCCIN

Una distribucin de probabilidad indica toda la gama de valores que pueden


representarse como resultado de un experimento. Una distribucin de
probabilidad es similar al distribucin de frecuencias relativas .Si embargo,
en vez de describir el pasado, describe la probabilidad que un evento se
realice en el futuro, constituye una herramienta fundamental para la
prospectiva, puesto que se puede disear un escenario de acontecimientos
futuros considerando las tendencias actuales de diversos fenmenos
naturales.
Las decisiones estadsticas basadas en la estadstica inferencial son
fundamentales en la investigacin que son evaluadas en trminos de
distribucin de probabilidades.
En el presente trabajo, se estudia de manera gil los diverso tipos de
distribucin

probabilstica,

caracterizaremos

cada

distribucin,

la

fundamentacin matemtica de los diversos resultados no se enfocaran en

DISTRIBUACION LOG-NORMAL
GEOESTADISTICA I

el presente trabajo; slo me limitar al estudio descriptivo de la distribucin


de probabilidades discretas.

MARCO TERICO
DISTRIBUCIN DE PROBABILIDAD
La distribucin de probabilidad de una variable aleatoria es una funcin que
asigna a cada suceso definido sobre la variable aleatoria la probabilidad de
que dicho suceso ocurra. La distribucin de probabilidad est definida sobre
el conjunto de todos los sucesos, cada uno de los sucesos es el rango de
valores de la variable aleatoria.
Cuando la variable aleatoria toma valores en el conjunto de los nmeros
reales, la distribucin de probabilidad est completamente especificada por
la funcin de distribucin, cuyo valor en cada real x es la probabilidad de
que la variable aleatoria sea menor o igual que x.
Dada
una variable
aleatoria todos
distribucin,
, es:

son

puntos

su funcin

de

Si la variable es discreta, es decir, si toma valores aislados dentro de un


intervalo, su distribucin de probabilidad especifica todos los valores
posibles de la variable junto con la probabilidad de que cada uno ocurra. En
el caso continuo, es decir, cuando la variable puede tomar cualquier valor
de un intervalo, la distribucin de probabilidad permite determinar las
probabilidades correspondientes a con subintervalos de valores.

DISTRIBUACION LOG-NORMAL
GEOESTADISTICA I

DISTRIBUCION LOGNORMAL
Si los logaritmos Y de una variable aleatoria X se distribuyen normalmente
se dice que X se distribuye normalmente.
Esta distribucin es muy usada para el calculo de valores extremos por
ejemplo Qmax, Qmnimos, Pmax, Pmnima (excelentes resultados en
Antioquia). Tiene la ventaja que X>0 y que la transformacin Log tiende a
reducir la asimetra positiva ya que al sacar logaritmos se reducen en mayor
proporcin los datos mayores que los menores.
Funcin de densidad

y = ln x
Donde, y : media de los logaritmos de la poblacin (parmetro escalar),
estimado
y : Desviacin estndar de los logaritmos de la poblacin, estimado
sy.

Estimacin de parmetros

Factor de frecuencia

Puede trabajarse en el campo original y en el campo transformado.

DISTRIBUACION LOG-NORMAL
GEOESTADISTICA I

1. Campo transformado: Si se trabaja en el campo transformado se trabaja


con la media y la desviacin estndar de los logaritmos, as:
Ln(XTr) = xTr+KSy
de donde,
XTr = eln (xTr)

con K con variable normal estandarizada para el Tr dado, x y media de los


logaritmos y Sy es la desviacin estndar de los logaritmos.

2. Campo original: Si se trabaja con los X sin transformar el K se calcula


como

K es la variable normal estandarizada para el Tr dado,


es el
coeficiente de variacin, x media de los datos originales y s desviacin
estndar de los datos originales.

Lmites de confianza

En el campo transformado.

DISTRIBUACION LOG-NORMAL
GEOESTADISTICA I

En donde, n nmero de datos, Se error estndar, K T variable normal


estandarizada.
Se trata de la densidad de probabilidad de una variable log x distribuida
segn una funcin normal:
X = N(,)

Y = eX

Con este cambio de variable quedar:


Funcin de distribucin: G(y) = P(Yy) = P(e X y) = P(Xlog y) = F(log
y)
Funcin de densidad

: g(y) = G(y) = F(log y) * (1/y)

Tambin es conocida como Ley de Galton-Mac. Aliester o ley del


efecto
proporcional, segn Calot (1988).

Los parmetros principales que la caracterizan son:

Parmetr
os

Soporte

pdf

DISTRIBUACION LOG-NORMAL
GEOESTADISTICA I
cdf

Media

Mediana

Moda

Varianza

Asimetra

Curtose

Entropa

A continuacin se muestran unos grficos de la funcin de distribucin y de


la funcin de densidad:
Funcin de densidad

10

DISTRIBUACION LOG-NORMAL
GEOESTADISTICA I

Funcin de distribucin

Puede comprobarse que la mediana est comprendida entre la


moda1 y la media y ms cerca de la media que la moda, en particular,

11

DISTRIBUACION LOG-NORMAL
GEOESTADISTICA I

puede comprobarse que la mediana 2 est casi dos veces ms cerca de la


media que de la moda.
La distribucin lognormal es una probabilidad frecuentemente
utilizada para expresar el comportamiento de observaciones con
asimetra positiva, en donde la mayora de los valores ocurren en las
proximidades de un valor mnimo.
Segn Cabrera (1998), una condicin para la validez de que una
variable se distribuya Lognormal es que x sea la resultante de un nmero
elevado de causas independientes con efectos positivos, que se
componen de manera multiplicativa y cada una de estas causas tiene un
efecto despreciable frente al global.
Esta distribucin es caracterstica en conjuntos de datos donde
existe mayor frecuencia de valores pequeos, por lo cual la media se
desplaza hacia la derecha y esto hace que el mejor estadgrafo de
posicin sea la moda y no la media aritmtica (Conferencia UNACH,
1995). Esta consideracin se valora, pero no se comparte en lo referente
a la valoracin del centro de los datos por considerarse que el mismo
puede hallarse con ms exactitud en el valor de la mediana, la cual se
conoce no es influida por valores extremos, lo cual no ocurre con la
moda. Tambin se considera que otra medida de posicin vlida para
esta distribucin es la media geomtrica (Pea, 1994).

NDICE DE EVENTOS QUE PRESENTAN UNA DISTRIBUCIN LOGNORMAL


1. Patrones de abundancia de especies.
2. Distribucin log-normal de las concentraciones ambientales.
3. Modelo log-normal del precio de las acciones.
4. Anlisis de la comunidad de una laguna costera en la costa sur
occidental de Mxico.
5. Cuantificacin de la vitamina B2.
6. Distribucin del peso molecular de los polmeros.
7. Prediccin de sismos una ojeada al futuro.
8. Factores que afectan las tasas de captura de langostino
amarillo..
2

12

DISTRIBUACION LOG-NORMAL
GEOESTADISTICA I

9. Comportamiento de las precipitaciones en el sector del lago


Titicaca (Bolivia) durante el fenmeno El Nio.
10.Produccin de nanopartculas de Cobre.

TEST DE NORMALIDAD

13

DISTRIBUACION LOG-NORMAL
GEOESTADISTICA I

CLCULO DE HISTOGRAMAS
1. DATOS ALEATORIOS DE LA DATA ARUN2: Para el clculo de los
histogramas utilizamos el programa SPSS para clculos
estadsticos.

14

DISTRIBUACION LOG-NORMAL
GEOESTADISTICA I

Distribucin Log-Normal

Distribucin Normal (Ln de los datos aleatorios obtenidos):

15

DISTRIBUACION LOG-NORMAL
GEOESTADISTICA I

2. DATOS ALEATORIOS DE ARUN2 CON DATOS ALEATORIOS LOGNORMAL PERTURBADOS:


Distribucin Log-Normal

16

DISTRIBUACION LOG-NORMAL
GEOESTADISTICA I

Se puede apreciar la anomala en la parte derecha de la distribucin (rango


3-4)
Distribucin Normal (Ln de los datos aleatorios perturbados)

SE OBSERVA LA
FORMACION DE LA
CAMPANA DA
GAUSS.

CLCULO DE PPPLOT
Determinamos el PP-Plot mediante el programa SPSS.

1. DATOS ALEATORIOS DE LA DATA ARUN2 (Ln DE LOS DATOS):


17

DISTRIBUACION LOG-NORMAL
GEOESTADISTICA I

Del Ln de la data que inicialmente se encontraba con distribucin Lognormal se comprueba con el PP-Plot que efectivamente se trata de una data
sin presencia de anomalas.Esto se puede comprobar por la presencia de
una lnea recta en la grafica

18

DISTRIBUACION LOG-NORMAL
GEOESTADISTICA I

2. DATOS ALEATORIOS DE LA DATA ARUN2 PERTURBADOS (Ln DE


LOS DATOS PERTURBADOS):

En este caso debido a la inclusin de datos que no guardan relacin con la


data inicial, se va a presentar una anomala (que se puede notar en los
histogramas anteriores).Esto traer como consecuencia la perturbacin de
la lnea recta presentada en la data sin alterar.
Si los nmeros aleatorios incluidos toman valores mayores a los de la data
(histograma expandido hacia la derecha) la curva tendera hacia arriba.

19

DISTRIBUACION LOG-NORMAL
GEOESTADISTICA I

20

DISTRIBUACION LOG-NORMAL
GEOESTADISTICA I

ANLISIS DE RESULTADOS

La verificacin que los datos aleatorios brindados por el profesor en


clase son los corresponden a una distribucin Log-Normal.

Luego de la realizacin del histograma de los logaritmos naturales de


los datos aleatorios brindados en clase se observa una distribucin
Normal o Gaussiana.

Al realizar el pp-plot, de los logaritmo naturales de los datos que


cumplen una distribucin log-normal, es decir, de los datos que
cumple con la distribucin Normal o de Gauss, respecto a la
distribucin Normal, se evidencia una tendencia Lineal o de recta
debido a que esta distribucin de nmeros brindadas no presentan
anomalas, ms bien una generacin de datos Normales lo que le da
la linealidad a esta pp-plot.

Al realizar el pp-plot de los datos perturbados se evidencia un bastn


al final de la grfica, esto es debido a las anomalas presentes en las
grficas anteriores (histogramas) debido al ingreso de datos que no
cumplen una distribucin Gaussiana del todo.

CONCLUSIONES

21

DISTRIBUACION LOG-NORMAL
GEOESTADISTICA I

El teorema del lmite central o teorema central del lmite indica que,
en condiciones muy generales, la distribucin de la suma de variables
aleatorias tiende a una distribucin normal y al realizar el histograma
la formacin de la campana de Gauss (tambin llamada distribucin
gaussiana o curva de Gauss o campana de Gauss) cuando la cantidad
de variables es muy grande.
Para la distribucin lognormal estudiada se ha realizado una grfica
PP-Plot en el que se compara a la distribucin experimental con la
terica. Si en la grfica del PP-Plot se obtiene una lnea recta
entonces se comprueba la normalizacin como se observ al
comienzo del anlisis de la grfica, caso contrario la grfica
resultante va ser una curva.
La grafica PP-Plot nos va a ayudar a verificar la existencia de
anomalas que puedan presentarse en muestras lognormal, sern
mucho ms tiles cuando se tomen muestras donde las anomalas no
sean notorias.

Para corroborar que los datos han sido normalizados (a partir de la


media y la desviacin estndar tomadas), este informe presenta un
histograma en el cual se puede apreciar la forma gaussiana de las
frecuencias resultantes.

En el PP-Plot la recta degenerada se debe a una anomala en la


muestra inicial, esto se debe a que se ha agregado datos de diferente
espacio muestral a los datos inciales.

22

DISTRIBUACION LOG-NORMAL
GEOESTADISTICA I

Algoritmo para simular 100000 random log


normal para una media y desviacin estndar
dadas (usando programador C)
#include <stdio.h>
#include <stdlib.h>
#include <time.h>
#include <unistd.h>
#include <math.h>
//#include<iostream.h>
#include<conio.h>
char nombre[80];
char m[80];
char n[80];
int nmu, i,p,;
float R [240000];
float S[10000];
float Z[10000];
float L[10000];
float sum,media,sd,uv,sv;
FILE *archivo;

////UNIFORM RANDOM NUMBERS


void URNG (void)
{
srand(time(NULL) + getpid());

for (i =0 ; i < 24*nmu ; i++)


{

R[i]=((double)rand()/(double)RAND_MAX) ;

23

DISTRIBUACION LOG-NORMAL
GEOESTADISTICA I
}
///AQUI SE SUMAN
for(p=0;p<24*nmu;p=p+24)
{
sum=0;
for (i=p;i<p+24;i++)
{
sum = R[i] + sum ;
}
S[p/24]=sum ;
}
}
int main(void)
{
puts("=============================================
===========================");
puts("

GENERACION DE NUMEROS ALEATORIOS

");
puts("=============================================
=========================");
puts("ingrese la cantidad de nmeros aleatorios a generar ( <= 2000)");
gets(nombre);
nmu=atoi(nombre);
puts("ingrese la media de la distribucin");
gets(m);
media=atof(m);
puts("ingrese la desviacin estndar de la distribucion");
gets(n);
sd=atof(n);

24

DISTRIBUACION LOG-NORMAL
GEOESTADISTICA I
puts("Ingrese la ruta y el nombre del archivo de salida : ");
gets(nombre);
if( (archivo = fopen(nombre,"w"))==NULL)
{
puts("error al tratar de abrir el archivo de salida ! ");
return 0;
}
uv = log(media)-0.5*log((pow(sd,2)/pow(media,2))+1);
sv = log((pow(sd,2)/pow(media,2))+1)
URNG ( );
fprintf(archivo,"Datos normalizados \n");
for (i=0;i<nmu;i++)
{
Z[i] = sv*((S[i]-24*0.5)/(sqrt(2)))+uv ;
fprintf(archivo,"Z[%3d] = \t %10.3f \n",i,Z[i]);
}
fprintf(archivo,"Datos simulados lognormal con media = %f y sd = %f
\n",media,sd);
for (i=0;i<nmu;i++)
{
L[i]=exp(Z[i]);
fprintf(archivo,"L[%3d] = \t %10.3f \n",i,L[i]);
}
fclose(archivo);
puts("*******************************by
****************************");
getch();
}

BIBLIOGRAFA

25

RAUL

C.

QUISPE

DISTRIBUACION LOG-NORMAL
GEOESTADISTICA I

Ph. D Marn Surez. APUNTES EN CLASE

Programa para Estadstica Descriptiva SPSS

http://www.monografias.com/trabajos29/distribucionprobabilidades/distribucion-probabilidades.shtml

26

You might also like