You are on page 1of 16

REGRESSIONE LINEARE

Obiettivi della lezione:


A Introduzione alla regressione lineare con il software SPSS B Passi principali per lesecuzione della procedura C Introduzione alla regressione lineare con il software EXCEL D Esempi

Regressione lineare: retta di regressione

Considereremo soltanto il caso di regressione lineare. Si vuole cercare la relazione lineare tra due variabili x e y. Date n osservazioni congiunte di 2 variabili {( x1 , y1 ), ( x2 , y2 ),..., ( xn , yn )} cerco due coefficienti a e b tali che y=ax+b passi il pi possibile vicino a questi punti.

Cerco a e b tali che f (a , b) = yi (axi + b)


i =1

sia minima
2

(Metodo dei minimi quadrati)

Richiami

Precisazioni

Importante!!!! Per poter eseguire i test di ipotesi dobbiamo ipotizzare la normalit dei residui.
3

Grafici a dispersione
Esercizio1: Regressione1.sav

Grafici

Dispersione/Punti

Procedura: inserimento dati e opzioni


Esercizio1: Regressione1.sav

Analisi

Regressione

Regressione lineare
Variabile dipendente

Variabile indipendente

Permette di disegnare grafici a dispersione: consentono di rappresentare due elementi qualsiasi tra i seguenti: la variabile dipendente, i valori attesi standardizzati, i residui standardizzati, i residui cancellati, i valori attesi corretti, i residui studentizzati Consente di calcolare ulteriori statistiche i residui cancellati studentizzati. Permette di disegnare il normal probability plot dei residui!
6

b Riepilogo del modello

Modello 1

R R-quadrato ,997a ,995

R-quadrato corretto ,994

Errore std. della stima ,01667

a. Stimatori: (Costante), X b. Variabile dipendente: Y


Coefficientia Coefficienti non standardizzati B Errore std. -,240 ,016 ,486 ,012 Coefficienti standardizzati Beta ,997

Modello 1

(Costante) X

t -15,341 39,825

Sig. ,000 ,000

a. Variabile dipendente: Y

Test di ipotesi: Parametri della retta: Y=-0.240+0.486*X H0: i coefficienti della retta sono nulli

Per disegnare la retta di regressione


Grafici Interattivi Grafico a Dispersione

Regressione lineare

Y = -0,24 + 0,49 * X R-quadrato = 0,99 A


0,60
A

0,40
A A

0,20
A A

AA A

1,00

1,50

2,00

Esercizio2: Regressione2.sav

Riepilogo del modello Modello 1 R R-quadrato a ,848 ,720 R-quadrato corretto ,714 Errore std. della stima ,98514

a. Stimatori: (Costante), X
Correlazioni Correlazione di Pearson Sig. (1-coda) N Y X Y X Y X Y 1,000 -,848 . ,000 50 50 X -,848 1,000 ,000 . 50 50

Risultato dellanalisi Il coeff. di correlazione significativo ed negativo La dipendenza lineare inversamente proporzionale
9

Coefficientia Coefficienti non standardizzati B Errore std. ,608 ,321 -,583 ,053 Coefficienti standardizzati Beta -,848

Modello 1

(Costante) X

t 1,894 -11,102

Sig. ,064 ,000

a. Variabile dipendente: Y

Parametri della retta: Y=0.608-0.583*X

Test di ipotesi:H0: i coefficienti della retta sono nulli test sullintercetta: non posso rifiutare H0 test sul coefficiente angolare: rifiuto H0
10

Regressione lineare con EXCEL

Procedura: Strumenti --> Analisi dati --> Regressione


Variabile dipendente Variabile indipendente

Calcola i residui Disegna i residui Disegna i residui e le approssimazioni Normal probability plot
11

Coefficienti della retta di regressione

p-value relativo ai test sui coefficienti della retta di regressione


12

Scatterplot con EXCEL


Si utilizza la Creazione guidata grafico per ottenere lo scatterplot
0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 0 0,5 1 1,5 2 2,5 Serie1

Per inserire la retta di regressione si selezionano i dati e si seleziona Aggiungi linea di tendenza

13

Si seleziona per visualizzare sul grafico la retta di regressione

Si seleziona per visualizzare sul grafico il valore di R2

0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 0 0,5 1 1,5 2 2,5 y = 0,4856x - 0,2397 R2 = 0,995 Serie1 Lineare (Serie1)

14

Esercizio

Un materiale utilizzato per la produzione di una fibra sintetica immagazzinato in un locale privo di controllo del livello di umidit. Al variare della percentuale di umidit nel locale si registrano i seguenti stati igrometrici nel materiale (espressi in percentuale)
% umidit magazzino 46 53 37 42 34 29 60 44 41 48 33 40 % umidit materiale 12 14 11 13 10 8 17 12 10 15 9 13

15

Determinare la retta di regressione di Y=% umidit nel materiale rispetto a X=% umidit nel magazzino. Stimare il contenuto percentuale di umidit nel materiale quando la percentuale di umidit nel magazzino risulta del 38%.

Esercizi di esame
Nel file esame Bio29_11A.xls sono riportati i livelli di nicotina nel sangue di ex fumatori nei 30 mesi successivi nei al momento in cui hanno smesso di fumare: Effettuare unanalisi di tipo statistico descrittivo sui dati del campione, stabilendo se si possa ipotizzare una diminuzione nella presenza di nicotina nel tempo.

16

You might also like