FUNZIONI DI REGRESSIONE LINEARE

 

* VERIFICA DI IPOTESI SU SINGOLO COEFFICIENTE          Ho:β1 = 0

 

Statistica t

È il valore riportato nell’OUTPUT di MICROFIT nella colonna T-RATIO                   T = β1^ – β1

      SE (β1^)

 

Il valore trovato lo si deve confrontare col valore critico e verificare se ricade o meno nella regione di accettazione.

 

P-value

E’ la probabilità di ottenere valori sfavorevoli ad Ho. Più è basso e più rifiuto Ho.

 

P< 0,10 rifiuto Ho con liv.signif. 10%       P< 0,05 rifiuto Ho con liv. signif. 5%       P< 0.01 rifiuto Ho con liv. signif. 1%

 

 

INTERVALLI DI CONFIDENZA

L’intervallo di confidenza di livello 95 % per β1 si costruisce:

 

β1^ +- 1,96 SE (β1^)    se il valore β1 ricade in questo intervallo ACCETTO Ho, se non rientra nell’intervallo RIFIUTO Ho.

 

L’effetto stimato di una variazione di X1 è data da β1 ∆X1, perciò l’intervallo di confidenza al 95% per la variazione stimata è data da:

 

β1^  ∆X1 + - 1,96 SE (β1^) ∆X1

ù

 

* VERIFICA DI IPOTESI CONGIUNTE       Ho:β1 = β2 = 0

 

Per tale verifica occorre utilizzare la statistica F. Se gli errore sono OMOSCHEDASTICI, posso utilizzare la statistica F CLASSICA.

 

1.REGRESSIONE VINCOLATA

È la regressione dove si impone l’ipotesi nulla.

Si eliminano dal modello i coefficienti sotto Ho.

2.REGRESSIONE NON VINCOLATA

E’la regressione di partenza, senza particolari restrizioni

 

=> STATISTICA F “CLASSICA” =                   F =       (SSRREST  - SSR UNREST ) /  q                

                                                                                  SSR UNREST  /  (n – KUNREST – 1)

 

 

q= nr restrizioni n= nr osservazioni         KUNREST = nr coefficienti regressione non vincolata senza βo

 

ALTRA FORMULA ALTERNATIVA  =                            (R2 UNREST  - R2 REST ) /  q                    

                                                                                  1 – R2 UNREST  /  (n – KUNREST – 1)

 

 

NB! La statistica F per l’intera regressione la si vede dall’output di MICROFIT

ù

 

FUNZIONI DI REGRESSIONE NON LINEARE

 

Una funzione non lineare è una funzione con pendenza NON COSTANTE, ovvero la pendenza dipende dal valore della X.

I modelli di regressione non lineare sono del tipo:                     Y = f (X1i  , X2i  , …., Xni  ) + ui   dove i=1,2,..n

 

EFFETTO SU Y DI UNA VARIAZIONE DI X

Quando la funzione di regressione è non lineare, la variazione attesa di Y ovvero ∆Y (la dicitura corretta sarebbe ∆E(Yi|Xi) ), associata alla variazione di ∆X1, tenendo costanti X2, …,Xk è data dalla differenza tra il valore della funzione prima e dopo la variazione di X1:

 

∆Y = f(X1 +  ∆ X1 + X2  + ….Xk ) -  f(X1 + X2  + ….Xk )

 

 

PROPRIETA’ DEI LOGARITMI

Proprietà tra i logaritmi e percentuali: la differenza tra il logaritmo di X + ∆X è il logaritmo di X approssimativamente ∆X / X, ovvero la variazione percentuale di X divisa per 100.

 

ln (X + ∆ X) – ln (X) ≈  ∆X / X                     Es:  ∆X= 2     X=10    ∆X/X= 2/10 = 0,2 variazione del 20%

 

 

CI SONO 3 DIVERSI MODI DI REGRESSIONE LOGARITIMICA:

 

1)      MODELLO LINEARE LOGARITMICO

 

Yi = β0 + β1 ln (Xi) + ui                       ∆Xi =>  ∆Yi   ???

 

Esempio: Testscore ^ = 557,80 + 36,42 ln (REDDITO)

Un incremento dell’1% del reddito del distretto è associato un incremento medio dei punteggi del test di 0,36 

 

=> ∆Yi = β1 * (∆X)   = 36,42 * 0,01   a parità degli altri fattori.

                          X

 

2)      MODELLO LOG – LINEARE

 

ln (Yi) = β0 + β1X1i + ui                       ∆Xi =>  ∆Yi   ???

 

=>  ∆Yi = β1 * (∆X)

        Y

 

Es: ln(Earning) = 2,453 + 0,0128 Age    all’aumentare di un anno di età il salario atteso aumenta in media circa 1,28 %   =>  0,0128 * 100 % a parità degli altri fattori

 

3)      MODELLO LOG – LOG

 

ln (Yi) = β0 + β1 ln (X1) + ui                 ∆Xi =>  ∆Yi   ???

 

=>  ∆Yi = β1 * (∆X)

        Y                X

 

Ad una variazione dell’1% è associata una variazione di Y di β1 %.   β1 è l’ELASTICITA’ di Y rispetto ad X.

Esempio: ln (Testscore) = 6,336 + 0,0544 ln (Income)

All’aumentare dell’1% del reddito è associata un incremento medio dello 0,0554% dei punteggi del test a parità degli altri fattori.

 

 

INTERAZIONE TRA VARIABILI

 

Nella regressione NON lineare l’effetto di una variabile indipendente è dipendente dalle variazioni degli altri regressori. L’interazione è un altro modo per far si che l’effetto di un regressore dipenda dagli altri.

 

VARIABILI BINARIE

 

Yi = β0 + β1  D1i  +  β2  D2i  + β3  D1i *  D2i + ui         D1i = 1 donna   0 uomo           D2i = 1 laureato  0 non laureat

 

EFFETTO DI ESSERE DONNA

 

β1 +  β3  D1i                 PER D1i          SE LAUREATA = β1 +  β3                SE NON LAUREATA  β1

 

EFFETTO DELLA LAUREA

 

β2 +  β3  D2i                 PER D2i          SE DONNA = β2 +  β3           SE UOMO  β2

 

 

VARIABILI CONTINUE E BINARIE

 

Yi = β0 + β1  X1i  +  β2  Di  + β3  X1i *  Di + ui            Di = 1 laureato  0 non laureato

 

 

∆E (Yi | Xi, Di)   =                  β1 +  β3  se Di = 1       β1 se Di = 0

         ∆Xi

 

Nell’esempio delle retribuzioni, β1 è l’effetto di un anno addizionale di esperienza lavorativa per i non laureati (Di = 0) e    β1 +  β3  è l’effetto corrispondente per i laureati.

Perciò  β3 è la differenza nell’effetto di un anno addizionale di esperienza lavorativa tra laureati e non laureati.

 

 

VARIABILI CONTINUE

 

Yi = β0 + β1  X1i  +  β2  X2i  + β3  X1i *  X2i + ui         X1i = anni di esperienza    X2i = anni istruzione

 

Senza interazione     ∆Yi = β1^             all’aumentare di un anno di esperienza il salario atteso aumenta di β1 a parità di anni di istruzione

 

Con interazione      ∆ Yi = β1 + β3 X2                  l’effetto sul salario di un anno in più di esperienza dipende anche dal numero di anni di istruzione.