Regresión de efectos fijos

Una regresión de efectos fijos es una técnica de estimación empleada en un entorno de datos de panel que permite controlar las características individuales no observadas e invariables en el tiempo que pueden estar correlacionadas con las variables independientes observadas.

Supongamos que estamos interesados en la relación causal entre un vector de variables aleatorias observables x = (1, x1, x2, …, xK) ‘ y una variable aleatoria dependiente y donde el modelo lineal verdadero es de la siguiente forma:

yi= β ‘xi + μ i + ε i con i = 1, …, N

siendo μ una variable aleatoria no observada que caracteriza cada unidad de observación i y ε el error estocástico no correlacionado con x.

Cuando μ está correlacionado con x no podemos estimar consistentemente el vector de parámetros de interés β utilizando mínimos cuadrados ordinarios porque se viola el supuesto estándar de no correlación entre el término de error y los regresores. En un entorno transversal, las estrategias típicas para resolver este problema de las variables omitidas son las variables instrumentales o la inclusión de proxies para μ Sin embargo, cuando los datos disponibles son longitudinales, es decir, cuando contienen una dimensión transversal además de una serie temporal, es posible adoptar métodos de estimación alternativos conocidos en la literatura como técnicas de «datos de panel».

Suponiendo que observamos repetidamente N unidades durante T períodos de tiempo, y que la variable inobservable μ es invariante en el tiempo, podemos escribir nuestro modelo como:

y it = β’ x it + μ + ε; con i = 1, …, N y t = 1, …, T

Dependiendo de la correlación entre la variable omitida μ y los regresores x, el investigador dispone de técnicas de estimación alternativas. Una regresión de efectos fijos permite una correlación arbitraria entre μ y x, es decir, E (x jitμ i ) ≠ 0, mientras que las técnicas de regresión de efectos aleatorios no permiten dicha correlación, es decir, se debe respetar la condición E (xjit μi ) = 0. Esta terminología es en cierto modo engañosa porque en ambos casos la variable inobservable debe considerarse aleatoria. Sin embargo, la terminología está tan extendida en la literatura que se ha aceptado como estándar.

Una regresión de efectos fijos consiste en restar la media temporal de cada variable del modelo y luego estimar el modelo transformado resultante por mínimos cuadrados ordinarios. Este procedimiento, conocido como transformación «dentro», permite dejar de lado el componente no observado y estimar consistentemente β. Analíticamente, el modelo anterior se convierte en

ỹ it = β’ x̃it + ε̃ it

donde ỹ it = y it – ȳ i con ȳ i = T -1 ΣT t = 1 y it (y lo mismo para x, μ, y ε). Dado que a μ i es fijo a lo largo del tiempo, tenemos μ i μ̄ i = 0.

Este procedimiento es numéricamente idéntico a incluir N – 1 dummies en la regresión, lo que sugiere intuitivamente que una regresión de efectos fijos da cuenta de la heterogeneidad individual no observada mediante interceptos específicos del individuo. En otras palabras, las pendientes de la regresión son comunes en todas las unidades (los coeficientes de x1, x 2, …, x K), mientras que se permite que el intercepto varíe.

Una desventaja del procedimiento de efectos fijos es que la transformación interna no permite incluir variables independientes invariables en el tiempo en la regresión, porque se eliminan de forma similar al componente fijo no observado. Además, es probable que las estimaciones de los parámetros sean imprecisas si la dimensión de la serie temporal es limitada.

Bajo los supuestos clásicos, el estimador de efectos fijos es consistente (con N → ∞ y T fijo) en los casos tanto de E (xjit μ i) = 0 como de E (xjit μ i) ≠ 0, donde j = 1, …, K. Es eficiente cuando todas las variables explicativas están correlacionadas con μi Sin embargo, es menos eficiente que el estimador de efectos aleatorios cuando E (xjitμi ) = 0.

La propiedad de consistencia requiere la exogeneidad estricta de x. Sin embargo, esta propiedad no se satisface cuando el modelo estimado incluye una variable dependiente retardada, como en yit = α yit-1 + ‘xit + μi + εit .

Esto sugiere la adopción de técnicas de variables instrumentales o del Método Generalizado de Momentos para obtener estimaciones consistentes. Sin embargo, una dimensión temporal grande T asegura la consistencia incluso en el caso de la especificación dinámica anterior.

A veces el modelo verdadero incluye choques no observados comunes a todas las unidades i, pero variables en el tiempo. En este caso, el modelo incluye un componente de error adicional 6 que puede controlarse simplemente incluyendo variables ficticias de tiempo en la ecuación.

Una aplicación típica de una regresión de efectos fijos es en el contexto de las ecuaciones salariales. Supongamos que estamos interesados en evaluar el impacto de los años de educación en logs e sobre los salarios en logs w cuando no se observa la capacidad de los individuos a. El modelo verdadero es entonces

Wi = β0 + β1 ei + v i

donde vi = ai + εi Dado que es probable que la capacidad no observada esté correlacionada con la educación, entonces el error estocástico compuesto v también está correlacionado con el regresor y la estimación de β 1 estará sesgada. Sin embargo, dado que la capacidad innata no cambia con el tiempo, si nuestro conjunto de datos es longitudinal podemos utilizar un estimador de efectos fijos para obtener una estimación consistente de β 1 Aplicando la transformación interna a la ecuación anterior terminamos con W̃it =βẽ1 it + ε̃ it

donde hemos eliminado el componente no observado invariante en el tiempo a i Siendo E (ε̃it εit ) = 0, el modelo satisface ahora los supuestos clásicos y podemos estimarlo por mínimos cuadrados ordinarios.

SEA TAMBIÉN econometría bayesiana; regresión de efectos aleatorios; regresión; análisis de regresión

BIBLIOGRAFÍA

Arellano, Manuel. 2003. Econometría de datos de panel. Oxford:

Oxford University Press.

Baltagi, Badi H. 2001. Análisis econométrico de datos de panel. 2nd ed. New York: Wiley.

Wooldridge, Jeffrey M. 2001. Econometric Analysis of Cross Section and Panel Data. Cambridge, MA: MIT Press.

Luca Nunziata

Deja una respuesta

Tu dirección de correo electrónico no será publicada.