統計的因果推論でデータから真実を見抜く
“Knowledge is the object of our inquiry, and men do not think they know a thing till they have grasped the ‘why’ of it (which is to grasp its primary cause)”
?Aristotle?
因果推論の歴史は古代ギリシャの哲学者アリストテレス(Aristotle)から始まり、哲学、科学、そして論理学のさまざまな分野で発展してきました。アリストテレスは、「原因となる行為には結果があり、結果となった行為には原因がある」という因果律を提唱しました。科学の目的は、出来事や現象の原因と結果を理解し、その関係性を説明することです。このため、因果推論は科学的な探求や理論形成において中核的な概念となっています。原因を理解することは、類似の状況やパターンを見つけ出し、未来を予測する上で有益です。
医学や科学研究では、因果関係を明らかにするためにランダム化比較試験(Randomized Controlled Trial、RCT)がゴールドスタンダートになります。RCTでは、ランダムに研究対象を処置群(treatment)と対照群(control)に分け、交絡因子の影響を制御する。例えば、ワクチンの有効性を評価するとき、ワクチン以外の要因の影響を排除するため、単純に接種前後を比較するのではなく、無作為に接種するグループと接種せず観察のみのグループを振り分けしなければなりません。
しかし、社会科学では法的?倫理的な制約や社会的規範のため、このような試験を実施することは難しい場合が多いです。例えば、結婚の効果を科学的に測定するために人々を無作為に「結婚するグループ」と「結婚しないグループ」に分けることは倫理的に困難です。同様に、出産の効果を検証するために無作為に人々を「出産するグループ」と「出産しないグループ」に分けることもできません。これらの課題は、特に結婚や育児に関する社会的課題において未解決のままです。
データサイエンスや人工知能は注目を集めていますが、データだけでは「原因」と「結果」を特定することはできません。例えば、都道府県別の警察官数と犯罪認知件数のデータがあった場合、データから「警察官数が増えると犯罪認知件数も増える」という関係が得られるかもしれません。しかし、これは正確な原因と結果の関係を示しているわけではなく、逆因果関係が存在する可能性があります。いわゆる、「犯罪の多い地域に警察官を増派する必要性がある」という解釈が合理的になるでしょう。因果関係をデータから厳密に抽出するためには、適切な統計モデルを選ぶことが不可欠です。
私の研究では、統計的因果推論の手法を使用し、(1)結婚?出産?育児が女性の労働に与える影響や(2)義務教育制度が労働市場に及ぼす短期?長期的な影響を定量的に分析してきました。特定の出来事や政策がもたらす影響を明らかにすることは、証拠に基づく政策立案(Evidence Based Policy Making, EBPM)において重要な役割を果たします。因果関係を正確に理解することで、社会政策や経済政策などの分野での意思決定に高品質なエビデンスを提供することができます。そして、最近では、労働経済学分野に留まらず、幼児教育?保育の無償化や無料公共交通制度(シルバーパスなど)に関する政策テーマにも取り組んでいます。
プロフィール
張俊超
博士(経済学)。専門は労働経済学、統計的因果推論。統計数理研究所を経て2021年4月から新潟大学経済科学部助教、2022年10月から同学部准教授。新潟大学若手教員スイングバイ?プログラム採用教員(1期)。
※記事の内容、プロフィール等は2024年1月時点のものです。