Kausale vs. Statistische Inferenz

Das Problem der schokoladensüchtigen Nobelpreisträger

Foto von Joanna Kosinska on Unsplash

Es gibt eine berühmte Studie, die gezeigt hat, dass es eine starke Korrelation zwischen dem Schokoladenkonsum eines Landes und der Anzahl der Nobelpreisträger aus diesem Land gibt. Würden Sie also sagen, dass der Schokoladenkonsum die Wahrscheinlichkeit erhöht, Nobelpreisträger zu werden, und sofort anfangen, wie verrückt Schokolade zu konsumieren? Ich hoffe nicht, denn ich vermute, dass man davon ausgehen kann, dass Schokolade nicht dazu führt, dass man ein Nobelpreisträger wird. Lassen Sie uns also zwei Variablen aus dieser Aussage herausziehen. B- Nobelpreisträger sein, A- Schokolade konsumieren. Das Kausaldiagramm für diese Aussage würde im Wesentlichen wie folgt aussehen:

The arrow meaning that A causes B. As you can see, this is a very primitive causal diagram. Now we can come to the point, although we have strong correlation between chocolate consumption and Nobel prize winning, we can ask ourselves, is there some other variable, C, such as the country’s wealth that causes both Nobel prize winning and chocolate consumption, or is it the country’s educational system that causes both and so on. Let us imagine, as indeed is the case, that there is a common cause C for both. Then the causal diagram looks like this:

Now we can mention Reichenbach’s common cause principle which states that if variables A and B have a common cause, C, dann wird, wenn wir auf C konditionieren, die Korrelation zwischen diesen Variablen ausgelöscht, was bedeutet, dass die bedingten Verteilungen der Zufallsvariablen, die auf die gemeinsame Ursache konditionieren, unabhängig werden. Das ist schön. Das eigentliche Kausaldiagramm, das wir betrachten sollten, sieht also wie folgt aus:

Das ist es, was Kausalität ausmacht, festzustellen, dass es keine gemeinsame Ursache gibt, die A und B so aussehen lässt, als würde A B verursachen. Diese Praxis hat sich in der medizinischen Gemeinschaft in Form von medizinischen Studien bereits etabliert, lange bevor die Menschen anfingen, über Kausalschlüsse zu sprechen. Wie können wir dies also feststellen? Zunächst einmal werden wir eine medizinische Studie mit einem allgemeineren, nützlichen Namen bezeichnen. Wir werden sie als kontrolliertes Experiment bezeichnen. Kontrollierte Experimente sind gut, denn wir können direkt auf eine Variable einwirken und sehen, wie sich unsere anderen Variablen in unserem Kausaldiagramm verändern. In einem medizinischen Versuch würde dies bedeuten, dass wir Gruppen von Personen 1 und 2 bilden, wobei Gruppe 1 das Placebo und Gruppe 2 das eigentliche Medikament gegen die Krankheit einnimmt und die Ergebnisse beobachtet werden. Bei medizinischen Studien wollen wir natürlich, dass diese Personen aus der gleichen Verteilung stammen, d. h. ähnlich sind. Im Idealfall wollen wir, dass sie gleich sind, das wäre der perfekte medizinische Versuch, der alle anderen möglichen gemeinsamen Ursachen ausschließt, aber das ist unrealistisch zu erwarten, ein perfektes kontrolliertes Experiment. Nun beobachtet man die Ergebnisse der Gruppen und stellt mit einiger Sicherheit fest, ob das Medikament bei der Heilung der Krankheit wirksam ist.

In der Kausalsprache nennt man dies eine Intervention. Wenn wir eine Variable nehmen und sie manuell auf einen Wert setzen können, ohne etwas anderes zu verändern. Das heißt im Grunde, dass wir dieselben Personen nehmen, bevor wir das Placebo und das Medikament anwenden, und dann beides anwenden, um zu sehen, ob die Krankheit durch das Medikament oder durch etwas anderes geheilt worden ist. Im Allgemeinen fällt es den Menschen schwer, zwischen einer Intervention und dem Setzen einer Wahrscheinlichkeit für das Eintreten eines Ereignisses auf 1 zu unterscheiden. Der Unterschied besteht darin, dass eine Intervention zu zwei verschiedenen Kausaldiagrammen führt, auf denen wir unsere Wahrscheinlichkeiten berechnen und eine Schlussfolgerung über die tatsächliche Kausalstruktur des Diagramms ziehen können.

Glücklicherweise haben wir Prof. Judea Pearl die Erfindung des Kausalkalküls zu verdanken, für die er den angesehenen Turing-Preis erhalten hat und wahrscheinlich weiterhin als Begründer der modernen kausalen Inferenz bekannt sein wird. Um tiefer in das Thema einzutauchen, empfehle ich die Lektüre seiner Bücher über Kausalität:

1. The Book of Why

2. Causality: Models, Reasoning and Inference

3. Causal Inference in Statistics: A Primer

Ich persönlich denke, dass das erste Buch gut für ein allgemeines Publikum geeignet ist, da es auch einen guten Einblick in die Geschichte der Statistik und der Kausalität gibt und dann ein wenig mehr auf die Theorie hinter der kausalen Inferenz eingeht.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.