BIBLIOGRAFI
En regression med fasta effekter är en estimeringsteknik som används i en paneldatamiljö och som gör det möjligt att kontrollera för tidsinvarianta, icke-observerade individuella egenskaper som kan vara korrelerade med de observerade oberoende variablerna.
Låt oss anta att vi är intresserade av orsakssambandet mellan en vektor av observerbara slumpmässiga variabler x = (1, x1, x2, …, xK) ’ och en beroende slumpmässig variabel y där den sanna linjära modellen är av följande form:
yi= β ’xi + μ i + ε i med i = 1, …, N
med μ som en icke-observerad slumpvariabel som karakteriserar varje observationsenhet i och ε det stokastiska felet som inte är korrelerat med x.
När μ är korrelerad med x kan vi inte konsekvent skatta vektorn av intressanta parametrar β med hjälp av Ordinary Least Squares eftersom standardantagandet om ingen korrelation mellan feltermen och regressorerna bryts. I en tvärsnittsmiljö är typiska strategier för att lösa detta problem med utelämnade variabler instrumentella variabler eller införande av proxies för μ. När de tillgängliga uppgifterna är longitudinella, dvs. när de innehåller både en tvärsnittsdimension och en tidsseriedimension, är det dock möjligt att använda alternativa skattningsmetoder som i litteraturen kallas paneldatateknik.
Antagen att vi upprepade gånger observerar N enheter under T tidsperioder och att den icke-observerbara variabeln μ är tidsinvariant, kan vi skriva vår modell som:
y it = β’ x it + μ + ε; med i = 1, …, N och t = 1, …, T
Avhängigt av korrelationen mellan den utelämnade variabeln μ och regressorerna x, finns det alternativa skattningstekniker tillgängliga för forskaren. En regression med fasta effekter tillåter godtycklig korrelation mellan μ och x, det vill säga E (x jitμ i ) ≠ 0, medan regressionstekniker med slumpmässiga effekter inte tillåter sådan korrelation, det vill säga villkoret E (xjit μi ) = 0 måste respekteras. Denna terminologi är på något sätt missvisande eftersom den icke observerbara variabeln i båda fallen ska betraktas som slumpmässig. Terminologin är dock så utbredd i litteraturen att den har accepterats som standard.
En regression med fasta effekter går ut på att subtrahera tidsmedelvärdet från varje variabel i modellen och sedan skatta den resulterande transformerade modellen genom Ordinary Least Squares. Detta förfarande, som är känt som ”within”-transformation, gör det möjligt att släppa den icke-observerade komponenten och konsekvent skatta β. Analytiskt blir ovanstående modell
ỹ it = β’ x̃it + ε̃ it
där ỹ it = y it – ȳ i med ȳ i = T -1 ΣT t = 1 y it (och samma sak för x, μ och ε). Eftersom en μ i är fast över tiden har vi μ i μ̄ i = 0.
Detta förfarande är numeriskt identiskt med att inkludera N – 1 dummies i regressionen, vilket intuitivt tyder på att en regression med fasta effekter tar hänsyn till oobserverad individuell heterogenitet med hjälp av individspecifika intercepts. Med andra ord är regressionens lutningar gemensamma för alla enheter (koefficienterna för x1, x 2, …, x K) medan interceptet tillåts variera.
En nackdel med förfarandet med fasta effekter är att inom-transformationen inte gör det möjligt att inkludera tidsinvarianta oberoende variabler i regressionen, eftersom de elimineras på samma sätt som den fasta icke-observerade komponenten. Dessutom är det troligt att parameterskattningarna är oprecisa om tidsseriedimensionen är begränsad.
Under klassiska antaganden är estimatorn för fasta effekter konsistent (med N → ∞ och T fast) i fallen både E (xjit μ i) = 0 och E (xjit μ i) ≠ 0, där j = 1, …, K. Den är effektiv när alla förklarande variabler är korrelerade med μi Den är dock mindre effektiv än estimatorn för slumpmässiga effekter när E (xjitμi ) = 0.
Konsistensegenskapen kräver att x är strikt exogen. Denna egenskap uppfylls dock inte när den uppskattade modellen innehåller en fördröjd beroende variabel, som i yit = α yit-1 + ’xit + μi + εit .
Detta tyder på att man bör använda instrumentella variabler eller tekniker med generaliserad metod för momenten för att få konsekventa skattningar. En stor tidsdimension T säkerställer dock konsistens även i fallet med den dynamiska specifikationen ovan.
Som ibland innehåller den sanna modellen icke-observerade chocker som är gemensamma för alla enheter i, men som är tidsvarierande. I detta fall innehåller modellen ytterligare en felkomponent 6 som kan kontrolleras genom att helt enkelt inkludera tidsdummies i ekvationen.
En typisk tillämpning av en regression med fasta effekter är i samband med löneekvationer. Låt oss anta att vi är intresserade av att bedöma effekten av utbildningsår i logaritmer e på löner i logaritmer w när individernas förmåga a inte observeras. Den sanna modellen är då
Wi = β0 + β1 ei + v i
där vi = ai + εi Med tanke på att den icke-observerade förmågan sannolikt är korrelerad med utbildning är det sammansatta stokastiska felet v också korrelerat med regressorn och skattningen av β 1 kommer att vara snedvriden. Eftersom medfödd förmåga inte förändras över tiden kan vi dock, om vår datamängd är longitudinell, använda en estimator med fast effekt för att få en konsekvent skattning av β 1 Genom att tillämpa within-transformationen på föregående ekvation hamnar vi på W̃it =βẽ1 it + ε̃ it
där vi har eliminerat den tidsinvarianta icke-observerade komponenten a i Att vara E (ε̃it εit ) = 0, uppfyller modellen nu de klassiska antagandena och vi kan skatta den med hjälp av vanliga minsta kvadrater.
Se även Bayesian Econometrics; Random Effects Regression; Regression; Regression; Regressionsanalys
BIBLIOGRAFI
Arellano, Manuel. 2003. Panel Data Econometrics. Oxford:
Oxford University Press.
Baltagi, Badi H. 2001. Ekonometrisk analys av paneldata. 2nd ed. New York: Wiley.
Wooldridge, Jeffrey M. 2001. Econometric Analysis of Cross Section and Panel Data. Cambridge, MA: MIT Press.
Luca Nunziata