Regressione a effetti fissi

BIBLIOGRAFIA

Una regressione a effetti fissi è una tecnica di stima impiegata in un contesto di dati panel che permette di controllare le caratteristiche individuali non osservate nel tempo che possono essere correlate con le variabili indipendenti osservate.

Immaginiamo di essere interessati alla relazione causale tra un vettore di variabili casuali osservabili x = (1, x1, x2, …, xK) ‘ e una variabile casuale dipendente y dove il vero modello lineare è della seguente forma:

yi= β ‘xi + μ i + ε i con i = 1, …, N

con μ che è una variabile casuale non osservata che caratterizza ogni unità di osservazione i e ε l’errore stocastico non correlato con x.

Quando μ è correlato con x non possiamo stimare in modo coerente il vettore dei parametri di interesse β usando gli Ordinary Least Squares perché l’ipotesi standard di assenza di correlazione tra il termine di errore e i regressori è violata. In un contesto cross-sectional, le strategie tipiche per risolvere il problema delle variabili omesse sono le variabili strumentali o l’inclusione di proxy per μ Tuttavia, quando i dati disponibili sono longitudinali, cioè quando contengono una dimensione cross-sectional e una dimensione time series, è possibile adottare metodi di stima alternativi noti in letteratura come tecniche “panel data”.

Assumendo di osservare ripetutamente N unità per T periodi di tempo, e che la variabile non osservabile μ sia invariante nel tempo, possiamo scrivere il nostro modello come:

y it = β’ x it + μ + ε; con i = 1, …, N e t = 1, …, T

A seconda della correlazione tra la variabile omessa μ e i regressori x, tecniche di stima alternative sono disponibili al ricercatore. Una regressione a effetti fissi permette una correlazione arbitraria tra μ e x, cioè E (x jitμ i ) ≠ 0, mentre le tecniche di regressione a effetti casuali non permettono tale correlazione, cioè si deve rispettare la condizione E (xjit μi ) = 0. Questa terminologia è in qualche modo fuorviante perché in entrambi i casi la variabile non osservabile è da considerarsi casuale. Tuttavia, la terminologia è così diffusa in letteratura che è stata accettata come standard.

Una regressione a effetti fissi consiste nel sottrarre la media temporale a ciascuna variabile del modello e stimare poi il modello trasformato risultante mediante Ordinary Least Squares. Questa procedura, nota come trasformazione “within”, permette di eliminare la componente non osservata e stimare coerentemente β. Analiticamente, il modello di cui sopra diventa

ỹ it = β’ x̃it + ε̃ it

dove ỹ it = y it – ȳ i con ȳ i = T -1 ΣT t = 1 y it (e lo stesso per x, μ, ed ε). Poiché un μ i è fisso nel tempo, abbiamo μ i μ̄ i = 0.

Questa procedura è numericamente identica all’inclusione di N – 1 dummy nella regressione, suggerendo intuitivamente che una regressione a effetti fissi tiene conto dell’eterogeneità individuale non osservata per mezzo di intercette specifiche individuali. In altre parole, le pendenze della regressione sono comuni a tutte le unità (i coefficienti di x1, x 2, …, x K) mentre l’intercetta può variare.

Un inconveniente della procedura a effetti fissi è che la trasformazione all’interno non consente di includere nella regressione variabili indipendenti invarianti nel tempo, perché vengono eliminate in modo simile alla componente fissa non osservata. Inoltre, è probabile che le stime dei parametri siano imprecise se la dimensione della serie temporale è limitata.

Sotto le ipotesi classiche, lo stimatore a effetti fissi è coerente (con N → ∞ e T fisso) sia nel caso di E (xjit μ i) = 0 che E (xjit μ i) ≠ 0, dove j = 1, …, K. È efficiente quando tutte le variabili esplicative sono correlate con μi Tuttavia, è meno efficiente dello stimatore a effetto casuale quando E (xjitμi ) = 0.

La proprietà di coerenza richiede la stretta esogeneità di x. Tuttavia, questa proprietà non è soddisfatta quando il modello stimato include una variabile dipendente ritardata, come in yit = α yit-1 + ‘xit + μi + εit .

Questo suggerisce l’adozione di variabili strumentali o tecniche di Metodo Generalizzato dei Momenti per ottenere stime coerenti. Tuttavia, una grande dimensione temporale T assicura la coerenza anche nel caso della specificazione dinamica di cui sopra.

A volte il modello vero include shock non osservati comuni a tutte le unità i, ma variabili nel tempo. In questo caso, il modello include una componente di errore aggiuntiva 6 che può essere controllata semplicemente includendo nell’equazione delle dummy temporali.

Una tipica applicazione di una regressione a effetti fissi è nel contesto delle equazioni salariali. Supponiamo di essere interessati a valutare l’impatto degli anni di istruzione in logs e sui salari in logs w quando l’abilità degli individui a non è osservata. Il vero modello è quindi

Wi = β0 + β1 ei + v i

dove vi = ai + εi Dato che l’abilità non osservata è probabilmente correlata all’istruzione, allora l’errore stocastico composito v è anche correlato con il regressore e la stima di β 1 sarà distorta. Tuttavia, poiché l’abilità innata non cambia nel tempo, se il nostro set di dati è longitudinale possiamo usare uno stimatore a effetto fisso per ottenere una stima coerente di β 1. Applicando la trasformazione all’interno all’equazione precedente ci ritroviamo con W̃it =βẽ1 it + ε̃ it

dove abbiamo eliminato la componente non osservata invariante nel tempo a i Essendo E (ε̃it εit ) = 0, il modello ora soddisfa le ipotesi classiche e possiamo stimarlo con gli Ordinary Least Squares.

Si veda anche Econometria Bayesiana; Regressione ad effetti casuali; Regressione; Analisi di regressione

BIBLIOGRAFIA

Arellano, Manuel. 2003. Econometria dei dati panel. Oxford:

Oxford University Press.

Baltagi, Badi H. 2001. Econometric Analysis of Panel Data. 2a ed. New York: Wiley.

Wooldridge, Jeffrey M. 2001. Econometric Analysis of Cross Section and Panel Data. Cambridge, MA: MIT Press.

Luca Nunziata

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.