Correlação e Causalidade: por que “andar junto” pode não provar nada?

Dois fenômenos podem caminhar lado a lado por anos – e ainda assim não ter relação causal. O problema é que a mente ama coincidências com cara de explicação: “aconteceu junto, logo foi por causa”. Em ciência (e fora dela), essa pressa produz diagnósticos ruins, políticas ruins e certezas barulhentas demais para pouca evidência.


O que são correlação e causalidade?

Correlação é uma associação: quando uma coisa varia junto com outra. Causalidade é outra conversa: é quando uma coisa produz (ou contribui para produzir) a outra.

Em termos diretos:

  • correlação diz: “andam juntas”;
  • causalidade diz: “uma empurra a outra” (sob certas condições).

A confusão nasce porque “andar junto” é visível, rápido e sedutor – enquanto “o que causa o quê” exige trabalho: hipóteses, controle, comparação, teste, réplica.

Por que correlação não prova causa?

Existem, pelo menos, quatro motivos clássicos para duas coisas se correlacionarem sem uma causar a outra:

  1. Causa invertida (o efeito vem antes)
    Você acha que A causa B, mas é B que causa A.
    Exemplo: “Pessoas doentes tomam mais remédios; logo, remédios causam doença.” O que acontece, na prática, é o contrário: a doença leva ao uso do remédio.
  2. Terceira variável (variável de confusão)
    A e B andam juntas porque uma terceira coisa, C, empurra ambas.
    Exemplo: “Quem toma mais sorvete sofre mais afogamentos.”
    O sorvete não puxa ninguém para o fundo. O calor (C) aumenta tanto o consumo de sorvete quanto a frequência em piscinas e praias.
  3. Coincidência (correlação espúria)
    Às vezes é só ruído que parece padrão – especialmente quando você testa muita coisa ao mesmo tempo.
    Exemplo típico em dados: você cruza dezenas de variáveis e “descobre” relações impressionantes… que somem quando o conjunto muda.
  4. Mistura de grupos (paradoxo do agregado)
    O padrão aparece quando você junta tudo, mas some (ou se inverte) quando separa por grupos relevantes.
    Isso acontece quando idade, renda, região, risco prévio ou acesso distorcem o “todo”.

O erro mais comum: “se correla, explica”

No cotidiano, a confusão costuma virar frase pronta:

  • “Desde que comecei X, minha vida melhorou.”
  • “Depois que tal governo entrou, tal indicador subiu.”
  • “Quando a gente faz Y, os resultados aumentam.”

Pode ser verdade. Mas, sem separar alternativas, isso ainda é só narrativa bem arrumada. E narrativa não é prova.

Exemplos cotidianos

Exemplo 1 — Saúde: o suplemento “milagroso”
“Quem usa o suplemento Z relata mais disposição.”
Pode ser o suplemento? Pode.
Mas também pode ser: gente mais ativa compra mais suplementos; quem está motivado muda treino e sono; o efeito é placebo; ou o grupo que respondeu ao questionário já era diferente do resto.

Sem controle, a frase só diz: “há um grupo diferente e ele fez uma coisa diferente”.

Exemplo 2 — Política/dados: o indicador que “melhorou”
“Depois que o prefeito assumiu, o emprego aumentou.”
Pode haver impacto local? Pode.
Mas também pode ser: ciclo econômico, investimentos que começaram antes, mudanças nacionais, sazonalidade, migração, abertura/fechamento de grandes empresas.

Sem comparar com cidades similares, sem olhar tendência anterior e sem isolar fatores, isso é post hoc (falsa causa) com terno.

Como a ciência tenta chegar mais perto da causa?

Causalidade não é adivinhação. Ela é inferência com disciplina.

Os caminhos mais comuns (sem tecnicismo gratuito):

  1. Experimento (ideal)
    Você controla condições e randomiza grupos. Se tudo é semelhante e só uma intervenção muda, o efeito fica mais rastreável.
  2. Quase-experimentos (mundo real)
    Nem sempre dá para experimentar. Então você compara “como se” fosse experimento: antes/depois com controle, grupos parecidos, mudanças naturais, diferenças em diferenças.
  3. Mecanismo (história plausível + testável)
    Não basta “andar junto”. Você precisa de um mecanismo que faça sentido e possa ser testado: como A poderia produzir B?
  4. Replicação e convergência
    Quando métodos diferentes apontam para o mesmo resultado, a hipótese causal ganha força. Um resultado sozinho, isolado e “novo demais” pede cautela.

Checklist rápido (anti-confusão correlação/causa)

Antes de aceitar “X causa Y”, pergunte:

  • Isso pode ser causalidade invertida?
  • Existe uma variável de confusão provável?
  • O efeito aparece em grupos diferentes ou depende de um grupo específico?
  • O resultado se mantém quando muda a amostra, o período ou o método?
  • Há mecanismo plausível e evidência convergente?
  • O tamanho do efeito é relevante ou só estatisticamente “bonito”?

Duas frases que salvam tempo (e reputação)

  1. Correlação é pista, não sentença.
  2. Causa exige controle – ou, no mínimo, comparação séria.

Conclusão: coincidência não é explicação

A mente gosta de fechar história rápido. Ciência tenta fazer o contrário: manter a história aberta até que ela aguente teste.

Por isso, aprender a diferenciar correlação de causalidade não é preciosismo; é defesa contra soluções fáceis, políticas apressadas e “descobertas” que só funcionam até a próxima planilha.

Leitura complementar

Se você quer entender como esses erros se disfarçam de lógica impecável (e como eles aparecem em discussões reais), vale ler: Falácias Lógicas: Tropeços ou Armadilhas?


Se esse texto te ajudou, compartilhe com alguém que lê gráfico como sentença – e chama coincidência de “prova”.


Deixe um comentário