Régression à effets fixes

BIBLIOGRAPHIE

Une régression à effets fixes est une technique d’estimation employée dans un contexte de données de panel qui permet de contrôler les caractéristiques individuelles inobservées dans le temps qui peuvent être corrélées avec les variables indépendantes observées.

Supposons que nous nous intéressons à la relation causale entre un vecteur de variables aléatoires observables x = (1, x1, x2, …, xK) ‘ et une variable aléatoire dépendante y où le vrai modèle linéaire est de la forme suivante :

yi= β’xi + μ i + ε i avec i = 1, …, N

avec μ étant une variable aléatoire non observée caractérisant chaque unité d’observation i et ε l’erreur stochastique non corrélée avec x.

Lorsque μ est corrélé avec x, nous ne pouvons pas estimer de manière cohérente le vecteur des paramètres d’intérêt β en utilisant les moindres carrés ordinaires car l’hypothèse standard d’absence de corrélation entre le terme d’erreur et les régresseurs est violée. Dans un cadre transversal, les stratégies typiques pour résoudre ce problème de variable omise sont les variables instrumentales ou l’inclusion de proxies pour μ Cependant, lorsque les données disponibles sont longitudinales, c’est-à-dire lorsqu’elles contiennent une dimension transversale ainsi qu’une dimension de série temporelle, il est possible d’adopter des méthodes d’estimation alternatives connues dans la littérature sous le nom de techniques de « données de panel ».

En supposant que nous observons de manière répétée N unités pendant T périodes de temps, et que la variable inobservable μ est invariante dans le temps, nous pouvons écrire notre modèle comme:

y it = β’ x it + μ + ε ; avec i = 1, …, N et t = 1, …, T

Selon la corrélation entre la variable omise μ et les régresseurs x, des techniques d’estimation alternatives s’offrent au chercheur. Une régression à effets fixes permet une corrélation arbitraire entre μ et x, c’est-à-dire que E (x jitμ i ) ≠ 0, alors que les techniques de régression à effets aléatoires ne permettent pas une telle corrélation, c’est-à-dire que la condition E (xjit μi ) = 0 doit être respectée. Cette terminologie est en quelque sorte trompeuse, car dans les deux cas, la variable inobservable doit être considérée comme aléatoire. Cependant, cette terminologie est tellement répandue dans la littérature qu’elle a été acceptée comme standard.

Une régression à effets fixes consiste à soustraire la moyenne temporelle de chaque variable du modèle, puis à estimer le modèle transformé résultant par les moindres carrés ordinaires. Cette procédure, connue sous le nom de transformation « within », permet de laisser tomber la composante inobservée et d’estimer de manière cohérente les β. Analytiquement, le modèle ci-dessus devient

ỹ it = β’ x̃it + ε̃ it

où ỹ it = y it – ȳ i avec ȳ i = T -1 ΣT t = 1 y it (et de même pour x, μ et ε). Parce qu’un μ i est fixe dans le temps, nous avons μ i μ̄ i = 0.

Cette procédure est numériquement identique à l’inclusion de N – 1 dummies dans la régression, ce qui suggère intuitivement qu’une régression à effets fixes tient compte de l’hétérogénéité individuelle inobservée au moyen d’intercepts spécifiques aux individus. En d’autres termes, les pentes de la régression sont communes à toutes les unités (les coefficients de x1, x 2, …, x K) tandis que l’ordonnée à l’origine est autorisée à varier.

Un inconvénient de la procédure à effets fixes est que la transformation within ne permet pas d’inclure des variables indépendantes invariables dans le temps dans la régression, car elles sont éliminées de la même manière que la composante fixe non observée. En outre, les estimations des paramètres sont susceptibles d’être imprécises si la dimension de la série temporelle est limitée.

Sous les hypothèses classiques, l’estimateur à effets fixes est cohérent (avec N → ∞ et T fixe) dans les cas où E (xjit μ i) = 0 et E (xjit μ i) ≠ 0, où j = 1, …, K. Il est efficace lorsque toutes les variables explicatives sont corrélées avec μi Cependant, il est moins efficace que l’estimateur à effet aléatoire lorsque E (xjitμi ) = 0.

La propriété de cohérence requiert l’exogénéité stricte de x. Cependant, cette propriété n’est pas satisfaite lorsque le modèle estimé comprend une variable dépendante retardée, comme dans yit = α yit-1 + ‘xit + μi + εit .

Ceci suggère l’adoption de variables instrumentales ou de techniques de méthode des moments généralisés afin d’obtenir des estimations cohérentes. Cependant, une grande dimension temporelle T assure la cohérence même dans le cas de la spécification dynamique ci-dessus.

Parfois, le vrai modèle inclut des chocs non observés communs à toutes les unités i, mais qui varient dans le temps. Dans ce cas, le modèle inclut une composante d’erreur supplémentaire 6 qui peut être contrôlée en incluant simplement des dummies de temps dans l’équation.

Une application typique d’une régression à effets fixes est dans le contexte des équations de salaire. Supposons que l’on souhaite évaluer l’impact des années d’études en logarithme e sur les salaires en logarithme w lorsque la capacité des individus a n’est pas observée. Le vrai modèle est alors

Wi = β0 + β1 ei + v i

où vi = ai + εi Étant donné que la capacité inobservée est susceptible d’être corrélée avec l’éducation, alors l’erreur stochastique composite v est également corrélée avec le régresseur et l’estimation de β 1 sera biaisée. Cependant, puisque la capacité innée ne change pas au fil du temps, si notre ensemble de données est longitudinal, nous pouvons utiliser un estimateur à effet fixe pour obtenir une estimation cohérente de β 1. En appliquant la transformation within à l’équation précédente, nous aboutissons à W̃it =βẽ1 it + ε̃ it

où nous avons éliminé la composante inobservée invariable dans le temps a i Être E (ε̃it εit ) = 0, le modèle satisfait maintenant les hypothèses classiques et nous pouvons l’estimer par les moindres carrés ordinaires.

Voir aussi Économétrie bayésienne ; Régression à effets aléatoires ; Régression ; Analyse de régression

BIBLIOGRAPHIE

Arellano, Manuel. 2003. Économétrie des données de panel. Oxford:

Oxford University Press.

Baltagi, Badi H. 2001. Analyse économétrique des données de panel. 2e éd. New York : Wiley.

Wooldridge, Jeffrey M. 2001. Econometric Analysis of Cross Section and Panel Data. Cambridge, MA: MIT Press.

Luca Nunziata

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.