イスラエルのCOVID-19データとSimpsonのパラドックス

以下は Jeffrey Morris 氏による Israeli data: How can efficacy vs. severe disease be strong when 60% of hospitalized are vaccinated? という記事の要約である。

イスラエルのCOVID-19ダッシュボードのある時点のデータ:

年齢未接種人数 a接種人数 b未接種重症 c接種重症 d有効性 1-(d/b)/(c/a)
全年齢1302912563463421430167.5%

これを年齢層で分けてみる:

年齢未接種人数 a接種人数 b未接種重症 c接種重症 d有効性 1-(d/b)/(c/a)
50以上11168343501118431191.8%
50未満186078213351617129085.2%

どちらの年齢層でもワクチン有効性が高くなった。原文にはさらに細かく分けた計算結果も載っている。

これは、分割することにより傾向が著しくなる一種のSimpsonのパラドックスといえる。つまり、

接種 ─⊖→ 重症化

という関係が、年齢によって層別化しないと、年齢の交絡によって

高齢
⊕↙︎ ↘︎⊕
接種 ←⊕→ 重症化

のような逆方向の偽の相関に相殺されて、効果が低く見えてしまう。


Last modified: