Problém nositelů Nobelovy ceny závislých na čokoládě
Existuje jedna známá studie, která ukázala, že existuje silná korelace mezi spotřebou čokolády v dané zemi a počtem nositelů Nobelovy ceny, kteří z této země pocházejí. Řekli byste tedy, že konzumace čokolády způsobuje, že pravděpodobnost, že se člověk stane nositelem Nobelovy ceny, je vyšší, a začali byste okamžitě konzumovat čokoládu jako šílení? Doufám, že ne, mám podezření, že je rozumné očekávat, že čokoláda nezpůsobuje, že se člověk stane nositelem Nobelovy ceny. Vyčleňme tedy z tohoto tvrzení dvě proměnné. B- být nositelem Nobelovy ceny, A- konzumovat čokoládu. Kauzální diagram pro toto tvrzení by v podstatě vypadal takto:
The arrow meaning that A causes B. As you can see, this is a very primitive causal diagram. Now we can come to the point, although we have strong correlation between chocolate consumption and Nobel prize winning, we can ask ourselves, is there some other variable, C, such as the country’s wealth that causes both Nobel prize winning and chocolate consumption, or is it the country’s educational system that causes both and so on. Let us imagine, as indeed is the case, that there is a common cause C for both. Then the causal diagram looks like this:
Now we can mention Reichenbach’s common cause principle which states that if variables A and B have a common cause, C, pak když podmíníme C, korelace mezi těmito proměnnými se setře, což znamená, že podmíněná rozdělení náhodných veličin podmiňujících společnou příčinu se stanou nezávislými. Pěkné. Takže kauzální diagram, na který bychom se měli dívat, je vlastně následující:
O tom je právě kauzalita, zjištění, že neexistuje společná příčina, která způsobuje, že A a B vypadají, jako by A způsobovalo B. Tato praxe však byla dobře zavedena v lékařské komunitě v podobě lékařských studií, dávno předtím, než lidé začali mluvit o kauzálním vyvozování. Jak to tedy zjistíme? Nejprve budeme lékařskou studii nazývat obecnějším, užitečnějším názvem. Budeme ji nazývat kontrolovaný experiment. Řízené experimenty jsou příjemné, můžeme přímo působit na proměnnou a v našem kauzálním diagramu sledovat, jak se mění ostatní proměnné. V lékařském pokusu by to bylo tak, že bychom vzali skupiny lidí 1 a 2, 1 skupina 1 by brala placebo a skupina 2 by brala skutečný lék na nemoc a pozorovali bychom výsledky. V lékařských studiích samozřejmě chceme, aby tito lidé pocházeli ze stejného rozdělení, tj. aby si byli podobní. Vlastně v ideálním případě chceme, aby byli stejní, to by byl dokonalý lékařský pokus, který by vyloučil všechny další možné společné příčiny, ale to je nereálné očekávat, dokonalý kontrolovaný experiment. Nyní pozorujete výsledky skupin a na základě určité jistoty určíte, zda je lék účinný při léčbě nemoci.
V kauzálním jazyce se tomu říká intervence. Pokud můžeme vzít proměnnou a nastavit ji ručně na nějakou hodnotu, aniž bychom měnili cokoli jiného. To v podstatě znamená, že vezmeme stejné lidi před aplikací placeba a léku a pak aplikujeme obojí, abychom zjistili, zda nemoc vyléčil lék, nebo něco jiného. Obecně je pro lidi obtížné rozlišit mezi intervencí a nastavením pravděpodobnosti realizace události na hodnotu 1. Rozdíl je v tom, že výsledkem intervence jsou dva různé kauzální diagramy, na kterých můžeme spočítat naše pravděpodobnosti a dojít k závěru o skutečné kauzální struktuře diagramu.
Naštěstí můžeme za vynález kauzálního kalkulu poděkovat profesoru Judeovi Pearlovi, který za něj obdržel prestižní Turingovu cenu a pravděpodobně bude dále znám jako zakladatel moderní kauzální inference. Pro hlubší ponor do tématu bych doporučil přečíst si jeho knihy o kauzalitě:
1. Kniha Proč
2. Kauzalita: Příčinná souvislost: modely, zdůvodňování a odvozování
3. Kauzální odvozování ve statistice:
Osobně si myslím, že první z nich je vhodná pro široké publikum, protože poskytuje také dobrý náhled do historie statistiky a kauzality a pak se trochu více zabývá teorií, která stojí za kauzálním odvozováním
.