Professional Documents
Culture Documents
DISTRIBUCIONES DE PROBABILIDAD EN HIDROLOGA El comportamiento de las variables aleatorias discretas o continuas se describe con la ayuda de Distribuciones de Probabilidad. La variable se designa por mayscula y un valor especfico de ella por minscula. Por P(x = a) se denota la probabilidad de que un evento asuma el valor a; similarmente P(a x b) denota la probabilidad de que un evento se encuentre en el intervalo (a,b). Si conocemos la probabilidad P(a x b) para todos los valores de a y b, se dice que conocemos la Distribucin de Probabilidades de la variable x. Si x es un nmero dado y consideramos la probabilidad P(X x): F(x)= P(X x): y llamamos F(x) la funcin de distribucin acumulada. Ejemplo Se tienen las probabilidades de que haya 1, 2, 3, ... etc, das nublados por semana en un determinado lugar, con ellos calcule la distribucin de probabilidades x 0 1 2 3 4 5 6 7 Total P(x) 0.05 0.15 0.25 0.20 0.15 0.10 0.08 0.02 1.0 F(x) 0.05 0.20 0.45 0.65 0.80 0.90 0.98 1.00
Si se tiene una variable aleatoria continua, la figura presenta el histograma de 85 aos de registro de caudales de crecientes (mximos instantneos) en el ro Magdalena, agrupados en 9 intervalos de clase. x 1 2 P(x) 0.05 0.10 F(x) 0.05 0.15
http://fluidos.eia.edu.co/hidrologiai/probabilidad/probabilidad.htm
12/07/2013
Page 2 of 16
3 4 5 6 7 8 9 Total
Cuando el nmero de observaciones se incrementa, el tamao de los intervalos decrece y se puede tener algo s
donde f(x) es la llamada funcin de densidad de probabilidades y tiene las siguientes caractersticas i) ii) iii) Lo que implica que las probabilidades se definen slo como REAS bajo la funcin de densidad de probabilidad (FDP) entre lmites finitos. 1.1 MOMENTOS DE LAS DISTRIBUCIONES
Las propiedades de las distribuciones pueden ser definidas completamente en trminos de los momentos. Los momentos en estadstica son similares a los momentos en fsica (rotacin respecto al origen)
http://fluidos.eia.edu.co/hidrologiai/probabilidad/probabilidad.htm
12/07/2013
Page 3 of 16
para la variable discreta o respecto a la media (eje de rotacin diferente al origen) para la variable continua
1.2
PARMETROS ESTADSTICOS
Los estadsticos extraen informacin de una muestra, indicando las caractersticas de la poblacin. Los principales estadsticos son los momentos de primer, segundo y tercer orden correspondiente a la media, varianza, y asimetra respectivamente.
1.2.1 Media :
es el valor esperado de la variable misma . Primer momento respecto a la origen. Muestra la tendencia central de la distribucin
1.2.2 Varianza :
mide la variabilidad de los datos. Es el segundo momento respecto a la media.
en el cual el divisor es n-1 en lugar de n para asegurar que la estadstica de la muestra no sea sesgada, es decir, que no tenga una tendencia, en promedio, a ser mayor o menor que el valor verdadero. Las unidades de la varianza son la media al cuadrado, la desviacin estndar s es una medida de la variabilidad que tiene las mismas dimensiones que la media y simplemente es la raz cuadrada de la varianza, se estima por s. El significado de la desviacin estndar se ilustra en la siguiente figura
http://fluidos.eia.edu.co/hidrologiai/probabilidad/probabilidad.htm
12/07/2013
Page 4 of 16
Coeficiente de variacin
http://fluidos.eia.edu.co/hidrologiai/probabilidad/probabilidad.htm
12/07/2013
Page 5 of 16
20 15 20 Total=100
29 23.25 33 = 138.9
ANALISIS DE FRECUENCIA
El anlisis de frecuencia es una herramienta utilizada para, predecir el comportamiento futuro de los caudales en un sitio de inters, a partir de la informacin histrica de caudales. Es un mtodo basado en procedimientos estadsticos que permite calcular la magnitud del caudal asociado a un perodo de retorno. Su confiabilidad depende de la longitud y calidad de la serie histrica, adems de la incertidumbre propia de la distribucin de probabilidades seleccionada. Cuando se pretende realizar extrapolaciones, perodo de retorno mayor que la longitud de la serie disponible, el error relativo asociado a la distribucin de probabilidades utilizada es ms importante, mientras que en interpolaciones la incertidumbre est asociada principalmente a la calidad de los datos a modelar; en ambos casos la incertidumbre es alta dependiendo de la cantidad de datos disponibles (Ashkar, et al. 1994). La extrapolacin de frecuencias extremas en una distribucin emprica de crecientes es extremadamente riesgosa (Garcon, 1994). Para determinar la magnitud de eventos extremos cuando la distribucin de probabilidades no es una funcin fcilmente invertibles se requiere conocer la variacin de la variable respecto a la media. Chow en 1951 propus determinar esta variacin a partir de un factor de frecuencia KT que puede ser expresado:
Para una distribucin dada, puede determinarse una relacin entre K y el perodo de retorno Tr. Esta relacin puede expresarse en trminos matemticos o por medio del uso de una tabla. El anlisis de frecuencia consiste en determinar los parmetros de las distribuciones de probabilidad y determinar con el factor de frecuencia la magnitud del evento para un perodo de retorno dado. A continuacin se describen las principales distribuciones de probabilidad utilizadas en hidrologa, la forma de estimar sus parmetros, el factor de frecuencia y los lmites de confianza. Estos ltimos son indicadores de que tanta incertidumbre se tiene con las extrapolaciones, puesto que determinar el rango de valores donde realmente estara la variables, si el rango es muy grande la incertidumbre es muy alta y si es pequeo, por el contrario, habr mucha confianza en el valor estimado. 3 DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES CONTINUAS 3.1 DISTRIBUCION NORMAL
La distribucin normal es una distribucin simtrica en forma de campana, tambin conocida como Campana de Gauss. Aunque muchas veces no se ajusta a los datos hidrolgicos tiene amplia aplicacin por ejemplo a los datos transformados que siguen la distribucin normal.
http://fluidos.eia.edu.co/hidrologiai/probabilidad/probabilidad.htm
12/07/2013
Page 6 of 16
Los dos parmetros de la distribucin son la media m y desviacin estndar s para los cuales (media) y s (desviacin estndar) son derivados de los datos.
donde a es el nivel de probabilidad es el cuantil de la distribucin normal estandarizada para una probabilidad acumulada de 1-a y Se es el error estndar 3.2 DISTRIBUCIN LOGNORMAL DE DOS PARMETROS
Si los logaritmos Y de una variable aleatoria X se distribuyen normalmente se dice que X se distribuye normalmente. Esta distribucin es muy usada para el calculo de valores extremos por ejemplo Qmax, Qmnimos, Pmax, Pmnima (excelentes resultados en Antioquia). Tiene la ventaja que X>0 y que la transformacin Log tiende a reducir la asimetra positiva ya que al sacar logaritmos se reducen en mayor proporcin los datos mayores que los menores. Limitaciones: tiene solamente dos parmetros, y requiere que los logaritmos de la variables estn centrados en la media
http://fluidos.eia.edu.co/hidrologiai/probabilidad/probabilidad.htm
12/07/2013
Page 7 of 16
y = ln x donde, my : media de los logaritmos de la poblacin (parmetro escalar), estimado estndar de los logaritmos de la poblacin, estimado sy.
sy : Desviacin
es el coeficiente de variacin, x media K es la variable normal estandarizada para el Tr dado, de los datos originales y s desviacin estndar de los datos originales.
http://fluidos.eia.edu.co/hidrologiai/probabilidad/probabilidad.htm
12/07/2013
Page 8 of 16
en donde, n numero de datos, Se error estndar, KT variable normal estandarizada. EJEMPLO: En un ro se tienen 30 aos de registros de Qmximos instantneos anuales con x= 15 m3/s, S = 5 m3/s (media y desviacin estndar para los datos originales). xy=2.655, sy = 0.324 (media y desviacin estndar de los datos transformados). Encontrar el caudal para un periodo de retorno de 100 aos y los limites de confianza para un a = 5%. Calcular la probabilidad de que un caudal de 42.5 m3/s no sea igualado o excedido P(Q 4.25). Solucin: n=30 x= 15 m3/s s = 5 m3/s En el campo original
xy=2.655 sy = 0.324
http://fluidos.eia.edu.co/hidrologiai/probabilidad/probabilidad.htm
12/07/2013
Page 9 of 16
En el campo transformado se tiene que: LnQTr100 = 2.655 + 2.33*0.324 LnQTr100 = 3.40992 QTr100 = Exp (3.40992) Q Tr100 = 30.26 m3/s Limites de confianza Ln (QTr) t(1-a) Se
d = 1.93
t(1-a) = t(0.95) = 1.645 (Ledo de la tabla de la normal) Ln(30.28) (1.645 ) (0.11) 3.41 0.18095 [3.22905 [e3.22905 [25.26 3.59095] e3.59095] 36.29]
b) Calcular la probabilidad de que un caudal de 45 m3/s no se igualado o excedido P(Q 4.25). Ln(42.5) = 3.75 t = (3.75 - 2.655)/0.324 F(3.38) = 0.9996 Ledo de la tabla de la normal P(Q 4.25) = 99.9% 3.3 DISTRIBUCION GUMBEL O EXTREMA TIPO I
Una familia importante de distribuciones usadas en el anlisis de frecuencia hidrolgico es la distribucin general de valores extremos, la cual ha sido ampliamente utilizada para representar el comportamiento de crecientes y sequas (mximos y mnimos).
http://fluidos.eia.edu.co/hidrologiai/probabilidad/probabilidad.htm
12/07/2013
Page 10 of 16
donde
Donde Tr es el periodo de retorno. Para la distribucin Gumbel se tiene que el caudal para un perodo de retorno de 2.33 aos es igual a la media de los caudales mximos.
KT es el factor de frecuencia y t(1-a) es la variable normal estandarizada para una probabilidad de no excedencia de 1-a. EJEMPLO: Para el ejemplo anterior encontrar el Q de 100 aos de periodo de retorno y los intervalos de confianza. x= 15 m3/s, s = 5 m3/s QTr100 = x + KT s
http://fluidos.eia.edu.co/hidrologiai/probabilidad/probabilidad.htm
12/07/2013
Page 11 of 16
KT = 3.14 QTr100 = 15 + 3.14*5 QTr100 = 30.7 m3/s Intervalos de confianza t(1-a) = t(0.95) = 1.645 (Ledo de la tabla de la normal)
d = 3.93
Xt t(1-a) Se 30.7 m3/s (1.64) (3.58) [24.83 m3/s 3.4 36.58 m3/s] Intervalo de confianza para QTr100
Esta distribucin ha sido una de las mas utilizadas en hidrologa. Como la mayora de las variables hidrolgicas son sesgadas, la funcin Gamma se utiliza para ajustar la distribucin de frecuencia de variables tales como crecientes mximas anuales, Caudales mnimos, Volmenes de flujo anuales y estacionales, valores de precipitaciones extremas y volmenes de lluvia de corta duracin. La funcin de distribucin Gamma tiene dos o tres parmetros.
http://fluidos.eia.edu.co/hidrologiai/probabilidad/probabilidad.htm
12/07/2013
Page 12 of 16
donde z es la variable normal estandarizada Este valor de K se encuentra tabulado de acuerdo al valor de Cs calculado con la muestra.
Donde S es la desviacin estndar de la muestra, n es el nmero de datos y d se encuentra tabulado en funcin de Cs y Tr. EJEMPLO: Se tiene una estacin con 30 aos de registros de caudales mximos instantneos con Media de 4144 pie3/s y desviacin estndar de 3311 pie3/s. Si el coeficiente de asimetra de los caudales es de 1.981 pie3/s cual es caudal para un periodo de retorno de 100 aos y su intervalo de confianza. QTr100 = X+ SK K es F(1.981, 100) de tablas se obtiene K=3.595 (1.9,100) = 3.553 (2.0,100) = 3.605
QTr100 = 4144+ (3.595) (3311) QTr100 = 16050 pie3/s Intervalos de confianza Xt t(1-a) Se
http://fluidos.eia.edu.co/hidrologiai/probabilidad/probabilidad.htm
12/07/2013
Page 13 of 16
d = F(1.981,100)
Se = 5133.56 pie3/s t(1-a) = t(0.95) = 1.645 (Ledo de la tabla de la normal) 16050 (5133.56) (1.645) [7605.29 pie3/s 24494.71pie3/s] Intervalos de confianza para QTr100
3.5
Si los logaritmos Y de una variable aleatoria X se ajustan a una distribucin Pearson tipo III, se dice que la variable aleatoria X se ajusta a una distribucin Log Pearson Tipo III. Esta distribucin es ampliamente usada en el mundo para el anlisis de frecuencia de Caudales mximos. Esta se trabaja igual que para la Pearson Tipo III pero con Xy y Sy como la media y desviacin estndar de los logaritmos de la variable original X.
y y0 para < 0
http://fluidos.eia.edu.co/hidrologiai/probabilidad/probabilidad.htm
12/07/2013
Page 14 of 16
donde z es la variable normal estandarizada Este valor de K se encuentra tabulado de acuerdo al valor de Cs calculado con la muestra.
Donde Sy es la desviacin estndar de los logaritmos de la muestra, n es el nmero de datos y se encuentra tabulado en funcin de Cs y Tr. 4 AJUSTE DE DISTRIBUCIONES
Para la modelacin de caudales mximos se utilizan, entre otras, las distribuciones Log - Normal, Gumbel y Log-Gumbel principalmente. Para seleccionar la distribucin de probabilidades de la serie histrica se deben tener en cuenta algunas consideraciones. Cuando en la serie histrica se observan outliers[1] es necesario verificar la sensibilidad del ajuste debido a la presencia de estos, (Ashkar, et al. 1994) Para el ajuste a las distribuciones Log-Normal, Log-Gumbel y Log-Pearson se requiere transformar la variable al campo logartmico para modelarla, con lo que se disminuye la varianza muestral, pero tambin se filtran las variaciones reales de los datos. Las distribuciones de dos parmetros fijan el valor del coeficiente de asimetra, lo que en algunos casos puede no ser recomendable. La distribucin Log - Normal de dos parmetros slo es recomendable s el coeficiente de asimetra es cercano a cero. Las distribuciones Gumbel y Log - Gumbel son recomendables si el coeficiente de asimetra de los eventos registrados es cercano a 1.13 Para ajustar distribuciones de tres parmetros (Log Normal III, Log Pearson) se requiere estimar el coeficiente de asimetra de la distribucin; para ello es necesario disponer de una serie con longitud de registros larga, mayor de 50 aos, (Kite, 1988). Las distribuciones de dos parmetros son usualmente preferidas cuando se dispone de pocos datos, porque reducen la varianza de la muestra, (Ashkar, et al. 1994).
http://fluidos.eia.edu.co/hidrologiai/probabilidad/probabilidad.htm
12/07/2013
Page 15 of 16
Para seleccionar la distribucin de probabilidades adecuada se debe tratar de utilizar informacin adicional del proceso hidrolgico que permita identificar la forma en que se distribuye la variable. Usualmente es muy difcil determinar las propiedades fsicas de los procesos hidrolgicos para identificar el tipo de distribucin de probabilidad que es aplicable. Kite (1988) y Mamdouh (1993) afirman que no existe consistencia sobre cual es la distribucin que mejor se ajusta a los caudales mximos y recomiendan seleccionar el mejor ajuste a criterio del modelador con la prueba de ajuste grfico o basado en el comportamiento de las pruebas estadsticas de bondad del ajuste (por ejemplo Chi Cuadrado, Smirnov-Kolmogorov, CramerVon Mises) en las que se calcula un estimador y se compara con un valor tabulado para determinar si el ajuste es adecuado o no. En la prueba de ajuste grfica se dibujan los valores registrados en la serie contra la distribucin terica de probabilidades y de manera visual (subjetiva) se determina si el ajuste es adecuado o no. Cuando la informacin es adecuada el anlisis de frecuencia es la metodologa ms recomendable para la evaluacin de eventos extremos, ya que la estimacin depende solamente de los caudales mximos anuales que han ocurrido en la cuenca y no da cuenta de los procesos de transformacin de la precipitacin en escorrenta. Obviamente tiene algunas limitaciones relacionadas con el comportamiento de la serie histrica y con el tamao y calidad de los datos de la muestra. Cuando se presenten cambios o tendencias en la serie histrica se deben utilizar tcnicas estadsticas que permitan removerlos para poder realizar el anlisis de frecuencias (Kite, 1988; Mamdouh, 1993; Ashkar, et al. 1994). La seleccin inadecuada de la distribucin de probabilidades de la serie histrica arrojar resultados de confiabilidad dudosa, (Ashkar, et al. 1994). El tamao de la muestra influye directamente en la confiabilidad de los resultados, as a mayor perodo de retorno del estimativo mayor longitud de registros necesaria para mejor confiabilidad en los resultados. El ajuste a distribuciones se puede hacer de dos tcnicas, con el factor de frecuencia como se refiri en el numeral 2 o hallando la distribucin emprica de los datos muestrales, por el mtodo de Plotting Position. 4.1 Plotting Position
Trabaja con la probabilidad de excedencia asignada a cada valor de la muestra. Se han propuesto numerosos mtodos empricos. Si n es el total de valores y m es el rango de un valor en una lista ordenada de mayor a menor (m=1 para el valor mximo) la probabilidad de excedencia se puede obtener por medio de las siguientes expresiones
California
Weibull
Hazen La expresin ms utilizada es la Weibull. Con las anteriores expresiones se halla lo que se conoce
http://fluidos.eia.edu.co/hidrologiai/probabilidad/probabilidad.htm
12/07/2013
Page 16 of 16
como la distribucin emprica de una muestra, esta luego se puede ajustar a una de las distribuciones tericas presentadas anteriormente. Los resultados pueden ser dibujados en el papel de probabilidad; este es diseado para que los datos se ajusten a una lnea recta y se puedan comparar los datos muestrales con la distribucin terica (lnea recta). 4.2 Pruebas de Ajuste
Para determinar que tan adecuado es el ajuste de los datos a una distribucin de probabilidades se han propuesto una serie de pruebas estadsticas que determinan si es adecuado el ajuste. Estos son anlisis estadsticos y como tal se deben entender, es decir, no se puede ignorar el significado fsico de los ajustes.
http://fluidos.eia.edu.co/hidrologiai/probabilidad/probabilidad.htm
12/07/2013