Regressie met vaste effecten

BIBLIOGRAPHY

Een regressie met vaste effecten is een schattingstechniek die in een paneldatasetting wordt gebruikt en waarmee kan worden gecontroleerd voor tijdinvariante niet-waargenomen individuele kenmerken die kunnen correleren met de waargenomen onafhankelijke variabelen.

Laten we aannemen dat we geïnteresseerd zijn in het oorzakelijke verband tussen een vector van waarneembare willekeurige variabelen x = (1, x1, x2, …, xK) ‘ en een afhankelijke willekeurige variabele y waarbij het ware lineaire model de volgende vorm heeft:

yi= β ‘xi + μ i + ε i met i = 1, …, N

waarbij μ een niet-waarneembare willekeurige variabele is die elke eenheid van waarneming i karakteriseert en ε de stochastische fout die niet gecorreleerd is met x.

Wanneer μ met x gecorreleerd is, kunnen wij de vector van de parameters van belang β niet consistent schatten met behulp van de gewone kleinste kwadraten, omdat de standaardhypothese van geen correlatie tussen de foutterm en de regressoren wordt geschonden. In een transversale setting zijn instrumentele variabelen of het opnemen van proxy’s voor μ typische strategieën om dit probleem van de weggelaten variabelen op te lossen. Wanneer de beschikbare gegevens echter longitudinaal zijn, d.w.z. wanneer zij zowel een transversale als een tijdreeksdimensie bevatten, is het mogelijk alternatieve schattingsmethoden toe te passen die in de literatuur bekend staan als “panel data”-technieken.

Aannemende dat we herhaaldelijk N eenheden gedurende T perioden observeren en dat de niet-waarneembare variabele μ tijdinvariant is, kunnen we ons model schrijven als:

y it = β’ x it + μ + ε; met i = 1, …, N en t = 1, …, T

Afhankelijk van de correlatie tussen de weggelaten variabele μ en de regressoren x, staan de onderzoeker alternatieve schattingstechnieken ter beschikking. Een regressie met vaste effecten staat een willekeurige correlatie tussen μ en x toe, d.w.z. E (x jitμ i ) ≠ 0, terwijl bij een regressietechniek met willekeurige effecten een dergelijke correlatie niet is toegestaan, d.w.z. dat de voorwaarde E (xjit μi ) = 0 in acht moet worden genomen. Deze terminologie is enigszins misleidend omdat in beide gevallen de niet-waarneembare variabele als willekeurig moet worden beschouwd. De terminologie is echter zo wijdverbreid in de literatuur dat zij als standaard is aanvaard.

Een regressie met vaste effecten bestaat erin het tijdsgemiddelde van elke variabele in het model af te trekken en vervolgens het resulterende getransformeerde model te schatten met behulp van Ordinary Least Squares. Deze procedure, die bekend staat als “interne” transformatie, maakt het mogelijk de niet-waargenomen component te elimineren en β consistent te schatten. Analytisch wordt bovenstaand model

ỹ it = β’ x̃it + ε̃ it

waar ỹ it = y it – ȳ i met ȳ i = T -1 ΣT t = 1 y it (en hetzelfde voor x, μ, en ε). Omdat a μ i vast is in de tijd, hebben we μ i μ̄ i = 0.

Deze procedure is numeriek identiek aan het opnemen van N – 1 dummy’s in de regressie, wat intuïtief suggereert dat een regressie met vaste effecten voor niet-waargenomen individuele heterogeniteit rekent door middel van individuele specifieke intercepts. Met andere woorden, de hellingen van de regressie zijn gemeenschappelijk voor alle eenheden (de coëfficiënten van x1, x 2, …, x K), terwijl het intercept mag variëren.

Een nadeel van de fixed effects procedure is dat de within transformatie het niet mogelijk maakt om tijdsinvariante onafhankelijke variabelen in de regressie op te nemen, omdat die op dezelfde manier worden geëlimineerd als de vaste niet-waargenomen component. Bovendien zijn parameterschattingen waarschijnlijk onnauwkeurig als de tijdreeksdimensie beperkt is.

Onder klassieke aannamen is de schatter met vaste effecten consistent (met N → ∞ en T vast) in de gevallen van zowel E (xjit μ i) = 0 als E (xjit μ i) ≠ 0, waarbij j = 1, …, K. De schatter is efficiënt wanneer alle verklarende variabelen met μi gecorreleerd zijn. Hij is echter minder efficiënt dan de random-effectschatter wanneer E (xjitμi ) = 0.

De consistentie-eigenschap vereist de strikte exogeniteit van x. Aan deze eigenschap wordt echter niet voldaan wanneer het geschatte model een vertraagde afhankelijke variabele bevat, zoals in yit = α yit-1 + ‘xit + μi + εit .

Dit suggereert de toepassing van instrumentele variabelen of Generalized Method of Moments-technieken om consistente schattingen te verkrijgen. Een grote tijdsdimensie T zorgt echter voor consistentie, zelfs in het geval van de bovenstaande dynamische specificatie.

Soms omvat het werkelijke model niet-waargenomen schokken die alle eenheden i gemeen hebben, maar die in de tijd variëren. In dat geval bevat het model een extra foutencomponent 6 waarvoor kan worden gecontroleerd door eenvoudigweg tijddummies in de vergelijking op te nemen.

Een typische toepassing van een regressie met vaste effecten is in de context van loonvergelijkingen. Laten wij aannemen dat wij geïnteresseerd zijn in de beoordeling van het effect van opleidingsjaren in logs e op lonen in logs w wanneer de bekwaamheid van individuen a niet wordt waargenomen. Het ware model is dan

Wi = β0 + β1 ei + v i

waar vi = ai + εi Aangezien de niet-waargenomen bekwaamheid waarschijnlijk gecorreleerd is met de opleiding, is de samengestelde stochastische fout v ook gecorreleerd met de regressor en zal de schatting van β 1 vertekend zijn. Aangezien het aangeboren vermogen echter niet in de tijd verandert, kunnen we, als onze gegevensverzameling longitudinaal is, een schatter met een vast effect gebruiken om een consistente schatting van β 1 te verkrijgen. Als we de transformatie binnen de voorgaande vergelijking toepassen, krijgen we W̃it =βẽ1 it + ε̃ it

waarbij we de tijdinvariante niet-waargenomen component a i hebben geëlimineerd E (ε̃it εit ) = 0 zijn, voldoet het model nu aan de klassieke veronderstellingen en kunnen we het schatten met behulp van de gewone kleinste kwadraten.

ZIE OOK Bayesiaanse Econometrie; Random Effects Regressie; Regressie; Regressieanalyse

BIBLIOGRAFIE

Arellano, Manuel. 2003. Panel Data Econometrics. Oxford:

Oxford University Press.

Baltagi, Badi H. 2001. Econometrische analyse van paneldata. 2nd ed. New York: Wiley.

Wooldridge, Jeffrey M. 2001. Econometric Analysis of Cross Section and Panel Data. Cambridge, MA: MIT Press.

Luca Nunziata

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.