Variabili confondenti
Le variabili confondenti sono quelle che influenzano altre variabili in un modo che produce associazioni spurie o distorte tra due variabili. Confondono la relazione “vera” tra due variabili.
Ad esempio, se abbiamo un’associazione tra due variabili (X e Y), e tale associazione è dovuta interamente al fatto che sia X che Y sono influenzati da una terza variabile (Z), allora diremmo che l’associazione tra X e Y è spuria e che è il risultato dell’effetto di una variabile confondente (Z)., Naturalmente, Z può essere una variabile confondente quando si tratta di questa particolare relazione, ma potrebbe non essere per altre relazioni.
Le variabili confondenti possono anche influenzare due variabili che hanno qualche connessione causale. Ad esempio, se X e Y sono associati e anche correlati causalmente (ad esempio, se X influisce su Y), l’associazione tra X e Y può riflettere non solo la loro connessione causale ma anche l’influenza di una terza variabile (Z) che influisce su entrambi., Quindi, l’associazione tra X e Y può esagerare l’effetto causale di X e Y perché l’associazione è gonfiata dall’effetto di Z su X e Y. In questo caso, potremmo dire che la relazione tra X e Y è confusa da Z, anche se non è una relazione puramente spuria.
Non tutti i ricercatori usano questi termini o li usano esattamente nel modo in cui li abbiamo definiti qui. Alcuni usano il termine “variabile spuria” o “variabile estranea” per riferirsi a una variabile che produce un’associazione puramente spuria tra altre due variabili., Il termine variabile confondente a volte è usato in modo più ristretto per riferirsi solo al secondo esempio che discutiamo sopra, dove una connessione causale tra X e Y è distorta dagli effetti di una terza variabile. Indipendentemente dalla terminologia utilizzata, i possibili effetti confondenti di una terza variabile sono riconosciuti da tutti. Quindi, dobbiamo sempre ricordare che la semplice associazione bivariata tra due variabili può essere del tutto non rappresentativa della vera connessione causale tra le variabili.