Professional Documents
Culture Documents
(
1
1
(4)
che tende, per k alla funzione asintotica:
( )
( )
x e
e
x
=
(5)
4
che viene perci definita legge asintotica del massimo valore, o legge doppio esponenziale o
legge di Gumbel, dallo studioso che per primo l'ha applicata all'idrologia.
2. Variabile ridotta e carta probabilistica
2.1. Se si considera la variabile:
y = (x - ) (10)
posto che y funzione lineare di x, risulta:
( ) ( ) x y e
e
y
= =
(11)
x
y
= + =
1 1
ln ln (12)
se si indicano con x
e con y
6
= 1,28255 (17)
D'altro canto dalla retta (x) riportata in Fig.1 si riconosce che i frattili y
0,025
e y
0,975
,
corrispondenti a valori di (y) pari rispettivamente a 0,025 e a 0,975, non risultano simmetrici
rispetto alla moda
~
y = 0, cos come avverrebbe per la distribuzione normale, ma pari a:
y
0,025
= -1,305 (18)
y
0,975
= +3,675
Inoltre, posto che (0) = 0,368 :
a differenza di quanto avviene per la distribuzione normale, in cui il 95% dei valori della variabile
compreso fra y
0,025
e y
0,975
si ripartisce in pari eguali al disotto e al disopra del valore modale.
Nella distribuzione doppio-esponenziale, nell'intervallo compreso fra y
0,025
e
~
y ricade il
(36,8-2,5) = 34,3% della popolazione, mentre, nell'intervallo delimitato da
~
y e da y
0,975
ne ricade il
(97,5 - 36,8)=60,7%
2.3. Per dedurre la probabilit cumulata (x) corrispondente a un assegnato valore x di una
variabile distribuita secondo la legge doppio esponenziale, essendo nota la funzione (y) data dalla
(11), basta conoscere i valori assunti dai parametri ed . Fissato infatti un valore di x, basta
calcolare a mezzo della (10) il valore di y che corrisponde ad x, assumendo poi:
( ) ( ) x y e
e
y
= =
(11)
Se viceversa si vuol conoscere il valore x
di x cui corrisponde un assegnato valore di , o,
pi brevemente, il frattile x
di un assegnato valore di , basta calcolare il valore y
di y che
risulta frattile dello stesso valore di , ricordando che :
x
y
= + =
1 1
ln ln (12)
8
In Tab. I sono riportati i frattili x
con = 0,500
= +
0 57722 ,
con = 0,570
x
(12)
T
0,025 - 1,305/ 1,03
0,368 1,58
0,500 + 0,366/ 2
0,570 + 0,577/ 2,33
0,800 + 1,500/ 5
0,900 + 2,250/ 10
0,950 + 2,970/ 20
0,967 + 3,384/ 30
0,975 + 3,676/ 40
0,980 + 3,902/ 50
0,990 + 4,600/ 100
0,998 + 6,214/ 500
0,999 + 6,907/ 1000
Tab. I. Legge doppio-esponenziale:
Valori di x corrispondenti ad assegnati valori della probabilit cumulata F o del periodo di ritorno T.
D'altra parte i parametri ed sono legati alla media e allo scarto quadratico medio
( ) x
x
= della x dalle relazioni
1 6
1 28255
= =
x
x
,
(19)
= - 0,450
x
(20)
9
3. Interpretazione di una singola serie di dati.
Formulazione dell'ipotesi di lavoro
3.1. Disposti gli n dati che costituiscono il campione in ordine crescente indicando con x
(1)
il
pi piccolo di essi, e con x
(2)
,x
(3)
,...,x
(i)
,...,x
(n)
quelli successivi, si calcola per ogni x
(i)
la frequenza
cumulata:
( )
( )
F x
i
n
i
=
+1
(43)
e si riportano in carta probabilistica di Gumbel i punti (x
(i)
, F(x
(i)
)).
Se i punti empirici si dispongono su un andamento pressocch rettilineo, propenderemo per
l'ipotesi che la (5) bene si adatti ad interpretare la distribuzione di probabilit della x. In caso
contrario, se i punti si dispongono intorno a una curva, propenderemo per unaltra ipotesi di lavoro,
quale pu essere quella rappresentata dalla (36) o unaltra ancora.
Precisazione dell'ipotesi di lavoro: stima dei parametri ed
3.2. Dalla relazione (5), per la stima dei parametri si ricorre usualmente o al metodo dei
momenti (M) di semplice applicazione o al metodo della massima verosimiglianza (MV), pi
efficiente degli altri metodi di stima, ma che presenta difficolt di risoluzione.
Con il metodo M, tenendo presente la (19) e la (20) le stime
1
e di ed a di si ottengono in
funzione della media x e dello scarto quadratico medio s
x
degli n dati disponibili dalle relazioni:
e = x - 0,450 s
x
(44)
1
128255 a
s
x
=
.
(45)
1
Lo stesso simbolo e oltre che per la stima empirica di , stato adoperato anche per indicare la base dei
logaritmi neperiani. L'uso dello stesso simbolo nei due diversi significati non pu, per, creare confusioni nella
interpetrazione del testo.
10
Note le stime e ed a dei parametri ed della distribuzione si ottiene immediatamente in
base alla (12) la retta P(x), che in carta probabilistica di Gumbel meglio interpola i punti empirici
[x; F(x)]. Non pu escludersi, per, che la retta P(x), essendo stata dedotta da un campione di
dimensione limitata, si scosti, anche se di poco dalla retta che rappresenterebbe la funzione di
ripartizione (x) della popolazione della x. Alla P(x) perci va dato il significato di stima empirica
della (x).
In particolare per ogni fissato valore di , una stima del frattile x
di si ottiene in base al
valore x
che nella retta P(x) corrisponde a P = , pari secondo la (12) o la (14) rispettivamente a:
x
P
= e + y
P
/a per P = (46)
x
P
= x + k
P
s
x
per P = (47)
Posto che dalla popolazione della x possono pensarsi tratti infiniti campioni di dimensione n e
posto che e ed 1/a, e quindi x
P
, assumono di volta in volta valori diversi la x
P
deve essere
considerata una variabile casuale caratterizzata dalla sua distribuzione di probabilit, definita
distribuzione di campionatura di x
P
. In particolare si dimostra che x
P
pu ammettersi distribuita
praticamente secondo la legge normale del caso, con media e varianza pari rispettivamente a:
( )
M x x
p
=
(48)
( ) ( ) Var x x
x
n
K K
n
n
p p p p
= = + + +
|
\
|
.
|
2
2
2
1 114 0 6 05
1
. . . (49)
Con il metodo MV le stime e ed
1
a
si ottengono dagli n valori x
1
, x
2
,... x
n
a disposizione
mediante le relazioni:
1
1
1
a
x
x e
e
i
i
n
ax
ax
i
n
i
i
=
=
(50)
11
e
n
e
ae ax
i
n
i
=
=
1
1
(51)
L'equazione (50) nell'incognita a implicita e perci presenta difficolt numeriche di
risoluzione, che peraltro possono essere facilmente superate con l'ausilio di un eleboratore
elettronico.
Verifica dell'ipotesi di lavoro
3.3. Precisata l'ipotesi di lavoro, ammettendo che la distribuzione di probabilit cumulata
della variabile x sia rappresentata dalla funzione P(x), ottenuta ponendo nella (5) le stime e ed 1/a
dei parametri ed 1/, necessario verificare se gli scarti fra la P(x) e la distribuzione di frequenze
cumulate F(x) del campione debbano o meno ritenersi significativi in termini probabilistici (test di
adattamento). I test pi adottati sono quelli del chi-quadrato e di Kolmogorov.
3.4. Per applicare il test del chi-quadrato si suddivide il campo di variazione della x in k
classi e si mettono a confronto le frequenze f
i
, e le probabilit p
i
che corrispondono a ciascuna
classe i rispettivamente nella serie empirica di cui disponiamo e nella popolazione di cui P(x) ci d
la composizione.
Se gli intervalli di classe si assumono equiprobabili, cio di lunghezza (x
i+1
-x
i
) diversa ma con
probabilit corrispondente costante
1
:
( ) ( ) p P x P x
i
k
i
k k
i i i
= =
+
=
+1
1 1
(54)
quando si considerino n osservazioni, il numero np
i
di esse che ci si deve attendere che ricada in
ciascuna classe costante e pari ad
n
k
.
1
Se la x distribuita secondo la legge doppio esponenziale, si ha quindi: x e
a
k
i
i
=
1
lnln
12
Indicando con n
i
il numero di valori effettivamente osservati della x compresi fra x
i+1
ed x
i
, la
grandezza
( )
X
n np
np
k
n
n n
i i
i i
k
i
i
k
2
1
2
2
1
=
=
= =
(55)
si pu ammettere che risulti distribuita come la grandezza statistica
2
con un numero di gradi
di libert f pari a k-3
1
, purch siano sufficientemente grandi sia il numero k di classi sia il numero
n
k
di valori che ci si deve attendere in ciascuna classe. Generalmente basta assumere k 5 e pari
al massimo fra i numeri interi per cui risulta n/k 5
In definitiva si accetta l'ipotesi di lavoro con il livello di significativit,
(2)
se
2
risulta
inferiore al valore critico
0
2
di
2
corrispondente ad una probabilit cumulata (1-) (Tab. II).
n k f
0
2
25 - 29 5 2 5,99
30 - 34 6 3 7,81
35 - 39 7 4 9,49
40 - 44 8 5 11,10
45 - 49 9 6 12,60
50 - 54 10 7 14,10
Tabella II
Valori critici
0
2
del chi-quadrato per un livello di significativit = 0,05.
Disposti gli n dati osservati della variabile x in ordine crescente, il test di kolmogorov mette
a confronto per ogni valore x
i
la frequenza cumulata ( ) F x
i
e la probabilit cumulata P(x
i
)
corrispondente ad x
i
in base all'ipotesi avanzata, e calcola la grandezza statistica:
D = max |F(x
i
) - P(x
i
)| (56)
pari alla massima differenza in valore assoluto tra F(x
i
) e P(x
i
).
1
Un grado di libert perduto per il vincolo p
i
t
=
=
1
1
altri due gradi di libert per le relazioni che permettono di
stimare i parametri della distribuzione
2
Il livello di significativit la probabilit di rigettare l'ipotesi quando essa vera.
13
Si accetta l'ipotesi di lavoro con il livello di significativit se D risulta inferiore al valore
critico D
0
corrispondente alla probabilit cumulata 1 - , valore che dipende solo dalla dimensione
n del campione, mentre risulta indipendente dalla distribuzione della x (Tab.III).
Nel caso che i parametri che definiscono la P(x) devono essere stimati dal campione, cos
come accade di norma nelle indagini idrologiche, i valori D
0
riportati in Tabella III sono
leggermente inferiori dei reali valori critici di quantit che per non sono note. Il test di
Kolmogorov in questo caso perci approssimato.
Esso presenta il vantaggio che pu essere effettuato anche per via grafica, rappresentando su
carta probabilistica le curve di controllo della F(x), definite in base alle relazioni
F
1
(x) = P(x) - D
0
e F
2
(x) = P(x) + D
0
.
Tabella III
n D
0
5 0,56
10 0,41
15 0,34
20 0,29
25 0,27
30 0,24
35 0,23
40 0,21
45 0,2
50 0,19
> 50 1.36/n
Tabella III
Valori critici D
0
della statistica di Kolmogorov per un livello di significativit = 0,05.
Determinazione della fascia fiduciaria della (x)
3.5. Come gi si detto al paragrafo 3.2, la retta P(x), stimata con il metodo della massima
verosimiglianza, che meglio interpola i punti empirici [x; F(x)] compendia tutta l'informazione che
il singolo campione di cui disponiamo pu fornirci nei riguardi della funzione di ripartizione (x),
14
che caratterizza la popolazione della x. Trattandosi, per, di un campione di dimensione limitata
non pu escludersi che, per difetto di campionatura, la P(x), pur essendo la migliore stima della
(x) che pu trarsi da esso, si scosti anche se di poco dalla (x)
1
.
Pi precisamente, ricordando che la (x) non nota e indicando al solito per un assegnato
valore di :
con x
i
valori estremi fra cui ci si deve attendere che ricada x
tenuto conto che il campione di dimensione n ne ha dato la stima x
P
, per P = ;
intervallo fiduciario di x
con varianza
2
(x
P
) data
dalla (49) o (53) a seconda che la stima di x
P
sia stata dedotta dal campione di dimensione n con il
metodo dei momenti o con il metodo della massima verosimiglianza;
2) lo scarto massimo che ci si pu attendere fra x
P
e x
max
2 per (57)
3) noto x
P
, i limiti fiduciari x
1
e x
2
della x
1
ln ln
Il numero di osservazioni che ci si deve attendere che ricada in ciascuna classe costante e
pari ad
n
k
.
Classe 1/k i/k Q
i
n
i
1 0.143 0.143 408.9 6
2 0.143 0.286 537.8 6
3 0.143 0.429 652.4 5
4 0.143 0.571 773.9 5
5 0.143 0.714 922.9 6
6 0.143 0.857 1151.5 6
7 0.143 1.000 5
Tab. VI
Indicando con n
i
il numero di valori effettivamente osservati nella generica classe Q
i+1
Q
i
, si
calcola la grandezza X
2
pari a :
19
( )
X
n np
np
k
n
n n
i i
i i
k
i
i
k
2
1
2
2
1
=
=
= =
(55)
che risulta pari a :
X
2
7
39
219 39 0 308 = = .
In definitiva si accetta l'ipotesi di lavoro avendo fissato il livello di significativit pari a
0.05, confrontando il valore
2
calcolato con il valore critico
0
2
di
2
corrispondente ad una
probabilit cumulata (1-) (Tab. II), che in corrispondenza del numero di gradi di libert k -3 = 4
pari a
0
2
= 9,49. Poich X
2
<
0
2
, lipotesi di lavoro pu essere accettata.