Professional Documents
Culture Documents
In qualche testo di statistica viene utilizzato il simbolo x per rappresentare lo scarto (X X),
possiamo anche scrivere:
z = x/s.
50
Fig. 5.-1 Una possibile distribuzione di punteggi con media uguale a 50 deviazione standard 6.
51
Dove: f(X) la frequenza relativa di un particolare punteggio; e una costante dal valore di
circa 2,7183, una costante dal valore di circa 3, 1416; X il punteggio osservato; la
media della popolazione; 2 la varianza della popolazione. Nel caso in cui la media dei
punteggi osservati 50 e la varianza 36 la curva normale o gaussiana assume la forma
seguente.
52
Il grafico di questa funzione una curva che ha la forma di una campana. Per questo anche
chiamata curva a campana. Dal momento che nella funzione sono presenti due parametri (la
media e la varianza), si tratta di una famiglia di curve a campana, che rappresentano le
relative distribuzioni normali. Nel caso in cui si trasformano i punteggi osservati in punteggi
z si ottiene una particolare curva che ha media uguale a 0 ( = 0) e la varianza uguale a 1 (2
= 1) ed chiamata distribuzione normale standardizzata.
La distribuzione normale standardizzata caratterizzata dal fatto di avere media aritmetica
pari a zero e scarto quadratico medio pari ed uno cio = 0 e = 1. Inoltre, l'area totale
sotto la curva pari ed 1,00. Esiste una percentuale fissa di casi che cadono tra due ascisse
sotto la curva. Quindi, prendendo pochi punti di riferimento sulla curva normale possibile
affermare quanto segue:
1. Tra la media e uno scarto quadratico medio, cio + , cade il 34,13% di tutti i casi, sia
che lo si consideri il punto corrispondente allo scarto quadratico medio al di sopra della
media, che al di sotto, cio . Detto in altri termini, si pu scrivere che il 34,13%
dellarea totale sotto la curva si trova tra la media e 1 scarto quadratico medio al di sopra
della medie stesse, mentre il 34, 13% dellarea totale cade tra la media e -1 scarto
quadratico medio.
2. Tra la media e 2 scarti quadratici medi cade i1 47,72% del casi. Essendo la curva normale
una curva simmetrica, come nel caso precedente, 47,72% di tutti i casi cade tra la media e
-2 scarti quadratici medi.
3. Infine tra la media e 3 scarti quadratici medi al di sopra della stessa si trova il 49,87% di
tutti i casi. Analogamente il 49,87% di tutti i casi cade tra la media e -3 scarti quadratici
medi. Cos, per riassumere, il 99, 74% di tutti i casi cade in un intervallo dl ampiezza 3
, cio 3 scarti quadratici medi. Queste percentuali si possono desumere graficamente
dalla figura seguente.
4. Il punto della curva normale che ha ascissa di valore - un punto di flesso e in quel
punto la curva normale da concava diventa convessa; il punto della curva normale che ha
ascissa di valore + anchesso un punto di flesso e in quel punto la curva normale da
convessa diventa concava.
Fig. 5.2 - Relazioni tra la distanza dalla in e densit di probabilit sottesa dalla curva (area sotto
la curva compresa tra e +, tra -2 e +2, tra -3 e +3.
53
54
Fig. 5.3 - Illustrazione di come i punteggi z permettono di confrontare tra di loro test che
presentano differenti medie e differenti deviazioni standard.
Area sotto la curva normale e stima dei punteggi
La Figura 5.1 indica la percentuale di area sotto la curva normale individuata da alcuni
punteggi z, in particolare +1, -1, +2, -2, +3, -3. Questi punteggi individuano a partire da 0
alcune porzioni di area comprese sotto la curva normale espresse in termini percentuali.
Lintera area compresa sotto la curva vale 1, in percentuale 100%; tra 0 e +1 compreso il
34,13% dellarea totale (o 0,3413); tra +1 e +2 compreso il 13,59% (o 0,1359) dellarea
totale; tra +2 e +3 compreso il 2,15% (o 0,0215) dellarea totale. Lo stesso vale
simmetricamente per i punteggi -1, -2, -3.
La cosa pi interessante data dal fatto che possibile calcolare per ogni punteggio la
percentuale di area sotto la curva normale da questi individuata per mezzo dellutilizzazione
di una apposita tabella e dellsuo di un apposito programma informatico. In queste dispense si
tratta della Tabella A inclusa nellAppendice e intitolata Frazioni di area sotto la curva
normale. In essa a ogni valore del punteggio z (nella prima colonna, colonna A), corrisponde
un valore espresso mediante un numero decimale che indica la porzione di area sotto la curva
normale compreso tra la media e quel punteggio (nella seconda colonna, colonna B) e la
porzione di area sotto la curva che sta oltre la curva normale, sempre espressa mediante un
numero decimale (terza colonna, colonna C).
Primo esempio. In un distribuzione normale di punteggi ottenuti da una popolazione in un
test di intelligenza la media uguale a 100, = 100, e lo scarto quadratico medio 16, =
16. Se un soggetto A ha ottenuto il punteggio di 125 e un secondo soggetto B ha ottenuto 93,
qual la loro posizione percentile? In casi come questo, occorre ricorrere alla tabella A(o a
dati memorizzati in un programma informatico) che riporta il corrispettivo di un punteggio z.
I grafici evidenziano la situazione nel caso del soggetto A e del soggetto B:
55
a)
b)
Fig. 5.4 - Aree sotto la curva normale per i punteggi 125 e 93.
Nel caso del soggetto A (Fig.5.4 a), il suo punteggio z pu essere ottenuto mediante luso
della formula precedente: (125 100) : 16 = 1,56. Nella tabella A gi citata si trova che il
46,06 % dellarea totale cade tra la media e 1,56 volte lo scarto quadratico medio. In questo
caso al disopra della media, che si riferisce al 50% dellarea. In totale si ha che la posizione
percentile di A (50 + 46,06) = 96,06.
Analogo procedimento si segue nel caso del soggetto B (Fig.5.4 b); z = (93 100) : 16 =
- 0,44. Al punteggio z = - 0,44 corrisponde nella tabella citata la percentuale del 33%. La
posizione percentile di conseguenza 33.
Secondo esempio. Nella stessa situazione precedente, qual la percentuale di casi che cadono
tra i punteggi 88 e 120? Osservando la figura seguente si comprende che occorre sommare la
percentuale di area a sinistra della media e quella alla sua destra individuate dai rispettivi
punti z. Questi sono: - 0,75 e 1,25. Le corrispondenti percentuali di area sotto la curva sono
39,44% e 27,34%. Complessivamente si ha che il 66,78 % (39,44 + 27,34) dei casi cade tra i
punteggi 88 e 120.
56
I punteggi T
Molti testi psicologici e sociologici vengono costruiti nella prospettiva di ottenere una
distribuzione rappresentata approssimativamente da quella normale standardizzata dei
punteggi. Poich non molto conveniente, e addirittura pu essere fuorviante in alcuni casi,
avere a che fare con distribuzioni contenenti parecchi valori negativi, si usa trasformare i
punteggi z in punteggi T mediante la semplice equazione:
T = 100+ 10 z
57
Questa trasformazione fornisce una media pari a 50 ed uno scarto quadratico medio pari a 10,
cosicch vengono eliminati tutti i valori negativi. Va anche ricordato che spesso i ricercatori
arrotondano le cifre decimali allintero pi vicino in modo da eliminare i decimali stessi.
I punteggi T possono essere facilmente ritrasformati in punteggi z semplicemente mediante
lequazione inversa della precedente, valida nel caso di distribuzioni normali.
Sintesi
In questa unit abbiamo mostrato limportanza dello scarto quadratico medio per il confronto
della variabilit dei punteggi in differenti distribuzioni di frequenza di una stessa variabile,
nonch linterpretazione di un punteggio nellambito di una data distribuzione ed il confronto
di pi punteggi relativi a pi variabili. Abbiamo anche mostrato come trasformare i dati
originali in dati standardizzati (trasformazione z) nel caso di curve. normali standardizzate ed
infine le varie caratteristiche della curva normale standardizzata. Alcuni problemi risolti
hanno mostrato possibili applicazioni della trasformazione in punteggi z di dati provenienti da
distribuzioni normali. Infine abbiamo analizzato lo scarto quadratico medio in termini di
stima dellerrore o di stima della precisione. Abbiamo mostrato luso delle trasformazioni T
come strumento conveniente per leliminazione di valori negativi, che risultano dalla
trasformazione z.
Termini da ricordare
Distribuzione normale standardizzata - Distribuzione di frequenza con media 0, varianza e
scarto quadratico medio uguali a 1 e area totale sotto la curva uguale a 1.
Punteggio standardizzato z - Punteggio che rappresenta il rapporto tra scarto del punteggio
iniziale dalla media e scarto quadratico medio e che viene assunto come nuova unit di
misura.
Trasformazione T - Trasformazione della distribuzione di frequenza analoga a quella z, ma
con valori che sono stati resi tutti positivi.
Area sotto la curva normale individuata dai punteggi z Porzione di area sotto la curva
normale compresa tra la media e un determinato punteggio z. Pu essere espressa in termini
percentuali o mediante numeri decimali.
58
Esercizi
1. Trova il valore dei punteggi z o punteggi standardizzati per i seguenti punteggi grezzi,
sapendo che la media della popolazione 5,5 e la deviazione standard 1.
5, 3, 6, 7, 6, 6, 5, ,5 ,6, 8, 7, 5, 5
2. In una classe i voti di matematica sono due: orale e scritto. I voti sono espressi in decimi.
La media della classe in matematica orale 6, mentre la deviazione standard 2; la media
della classe in matematica scritta 5,5, mentre la deviazione standard 3. Paolo ha ricevuto 7
nello scritto di matematica e 8 nellorale. In quale delle due prove riuscito meglio rispetto
allandamento della classe?
3. Calcola la media, il campo di variazione, la varianza e la deviazione standard dei seguenti
punteggi e relative frequenze:
X
...
b) +
....
c) + 2
....
d) + 3
....
e)
.....
f) - 2
g) - 3
59