Causal vs. Inferência estatística

O problema dos vencedores do Prémio Nobel viciados em chocolate

Photo by Joanna Kosinska on Unsplash

Há um famoso estudo que mostrou que existe uma forte correlação entre o consumo de chocolate de um país e o número de vencedores do Prémio Nobel provenientes desse país. Então você diria que o consumo de chocolate faz com que a probabilidade de alguém se tornar um vencedor do Prêmio Nobel seja maior e começar a consumir chocolate como louco imediatamente? Espero que não, suspeito que é razoável esperar que o chocolate não faça com que alguém seja um ganhador de um Prêmio Nobel. Então, vamos extrair duas variáveis desta afirmação. B- Ser um vencedor do Prémio Nobel, A- consumir chocolate. O diagrama causal para esta declaração seria basicamente assim:

The arrow meaning that A causes B. As you can see, this is a very primitive causal diagram. Now we can come to the point, although we have strong correlation between chocolate consumption and Nobel prize winning, we can ask ourselves, is there some other variable, C, such as the country’s wealth that causes both Nobel prize winning and chocolate consumption, or is it the country’s educational system that causes both and so on. Let us imagine, as indeed is the case, that there is a common cause C for both. Then the causal diagram looks like this:

Now we can mention Reichenbach’s common cause principle which states that if variables A and B have a common cause, C, então quando condicionamos em C, a correlação entre essas variáveis é eliminada, o que significa que as distribuições condicionais das variáveis aleatórias condicionantes sobre a causa comum se tornam independentes. Muito bom. Então, na verdade, o diagrama causal que deveríamos estar observando é o seguinte:

É disto que se trata a causalidade, estabelecendo que não há uma causa comum que faça com que A e B pareçam como se A causasse B. Esta prática foi bem estabelecida na comunidade médica sob a forma de ensaios médicos, muito antes das pessoas começarem a falar sobre a inferência causal. Então, como estabelecemos isto? Primeiro, vamos chamar um ensaio médico com um nome mais geral e útil. Vamos chamar-lhe uma experiência controlada. Experimentos controlados são legais, podemos agir diretamente sobre uma variável e ver como nossas outras variáveis mudam em nosso diagrama causal. Num ensaio médico, isto seria tomar grupos de pessoas 1 e 2, 1 grupo 1 tomando o placebo e o grupo 2 tomando o medicamento actual para a doença e observando os resultados. Naturalmente, em ensaios médicos queremos que estas pessoas venham da mesma distribuição, ou seja, que sejam semelhantes. Na verdade, idealmente queremos que eles sejam iguais, este seria o ensaio médico perfeito que eliminaria qualquer outra causa potencial comum, mas isto é irrealista de se esperar, um ensaio controlado perfeito. Agora você observa os resultados dos grupos e determina com base em alguma confiança se o medicamento é eficiente na cura da doença.

Em linguagem causal, isto é chamado de intervenção. Se pudermos pegar uma variável e defini-la manualmente para um valor, sem alterar nada mais. Isto é basicamente afirmar que tomamos as mesmas pessoas antes de aplicarmos o placebo e o medicamento e depois aplicarmos ambos, para ver se a doença foi curada pelo medicamento ou por outra coisa qualquer. A diferença é que a intervenção resulta em dois diagramas causais diferentes nos quais podemos calcular as nossas probabilidades e chegar a uma conclusão sobre a estrutura causal real do diagrama.

Felizmente, temos a Prof. Judea Pearl a agradecer por inventar o cálculo causal, pelo qual ele recebeu o prestigioso prêmio Turing e provavelmente será conhecido mais adiante como o fundador da inferência causal moderna. Eu sugeriria a leitura de seus livros sobre causalidade para mergulhar mais profundamente no tema:

1. O Livro do Porquê

2. Causalidade: Modelos, Raciocínio e Inferência

3. Inferência Causal em Estatística: A Primer

Eu pessoalmente acho que a primeira é boa para um público em geral, pois também dá um bom vislumbre da história da estatística e da causalidade e depois vai um pouco mais para a teoria por detrás da inferência causal.

Deixe uma resposta

O seu endereço de email não será publicado.