Inferencia causal vs. Estadística

El problema de los premios Nobel adictos al chocolate

El problema de los premios Nobel adictos al chocolate

Foto de Joanna Kosinska on Unsplash

Hay un famoso estudio que demostró que existe una fuerte correlación entre el consumo de chocolate de un país y el número de premios Nobel que provienen de ese país. Entonces, ¿dirías que el consumo de chocolate hace que la probabilidad de que uno se convierta en premio Nobel sea mayor y que empiece a consumir chocolate como un loco inmediatamente? Espero que no, sospecho que es razonable esperar que el chocolate no provoque que uno sea premio Nobel. Así que extraigamos dos variables de esta afirmación. B- Ser premio Nobel, A- consumir chocolate. El diagrama causal para esta afirmación sería básicamente así:

The arrow meaning that A causes B. As you can see, this is a very primitive causal diagram. Now we can come to the point, although we have strong correlation between chocolate consumption and Nobel prize winning, we can ask ourselves, is there some other variable, C, such as the country’s wealth that causes both Nobel prize winning and chocolate consumption, or is it the country’s educational system that causes both and so on. Let us imagine, as indeed is the case, that there is a common cause C for both. Then the causal diagram looks like this:

Now we can mention Reichenbach’s common cause principle which states that if variables A and B have a common cause, C, entonces cuando condicionamos en C, la correlación entre estas variables se borra, lo que significa que las distribuciones condicionales de las variables aleatorias que condicionan en la causa común se vuelven independientes. Bastante bien. Así que, en realidad, el diagrama causal que deberíamos mirar es el siguiente:

De esto se trata la causalidad, establecer que no hay una causa común que haga que A y B parezcan como si A causara B. Esta práctica ha sido bien establecida sin embargo en la comunidad médica en forma de ensayos médicos, mucho antes de que la gente comenzó a hablar de la inferencia causal. Entonces, ¿cómo establecemos esto? En primer lugar, vamos a llamar a un ensayo médico con un nombre más general y útil. Vamos a llamarlo experimento controlado. Los experimentos controlados son agradables, podemos actuar sobre una variable directamente y ver cómo cambian nuestras otras variables en nuestro diagrama causal. En un ensayo médico, esto sería tomar grupos de personas 1 y 2, el grupo 1 tomando el placebo y el grupo 2 tomando la medicina real a la enfermedad y observando los resultados. Naturalmente, en los ensayos médicos queremos que estas personas provengan de la misma distribución, es decir, que sean similares. En realidad, lo ideal sería que fuesen iguales, esto sería el ensayo médico perfecto que eliminaría cualquier otra causa común potencial, pero es poco realista esperar esto, un experimento controlado perfecto. Ahora se observan los resultados de los grupos y se determina en base a cierta confianza si el medicamento es eficiente para curar la enfermedad.

En lenguaje causal, esto se llama intervención. Si podemos tomar una variable y ponerla manualmente en un valor, sin cambiar nada más. Esto es básicamente afirmar que tomamos a las mismas personas antes de aplicar el placebo y el medicamento y luego aplicamos ambos, para ver si la enfermedad ha sido curada por el medicamento o por otra cosa. Por lo general, a la gente le resulta difícil diferenciar entre la intervención y el establecimiento de una probabilidad de realización de un evento a 1. La diferencia es que la intervención da lugar a dos diagramas causales diferentes sobre los que podemos calcular nuestras probabilidades y llegar a una conclusión sobre la estructura causal real del diagrama.

Por suerte, tenemos que agradecer al profesor Judea Pearl la invención del cálculo causal, por el que ha recibido el prestigioso premio Turing y probablemente será conocido más adelante como el fundador de la inferencia causal moderna. Sugeriría la lectura de sus libros sobre causalidad para profundizar en el tema:

1. El libro del porqué

2. Causalidad: Models, Reasoning and Inference

3. Causal Inference in Statistics: A Primer

Personalmente creo que el primero es bueno para un público general ya que también da una buena visión de la historia de la estadística y la causalidad y luego se adentra un poco más en la teoría detrás de la inferencia causal.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.