アメリカ留学体験記 in NYC

Nagaです。コロンビア大学国際公共政策大学院(通称SIPA)で2023年9月から学生をしています。

2024年春学期の履修コース② 〜Quantitative Analysis II for International and Public Affairs〜

コロンビア大学のSIPA (School of International and Public Affairs)で、2024年春学期に履修したコースの第二弾です。

今回は統計学です。前の学期(2023年秋学期)に履修したQantitative Analysis Iの応用バージョンで、政策とその政策効果の因果関係の分析に迫る因果推論について理解をより深めることができました。

基本情報

(※)SIPAのカリキュラムについてはこちらの記事をご覧ください。

コース内容

最初から最後まで、統計ソフトであるSTATAを使ってRegression analysis(回帰分析)を行います。

Regression Model

まず、Regression Modelを分析するにあたって避けては通れないOmitted Variable Biasや、Irrelevant Independent Variablesの影響を学びます。その後、実際のデータを使ってRegression Modelを自分で作る練習を、Problem setsなどを通して行うことになります。

Regression analysisにおいては、Outcome(政策の効果)とControl Variable(政策)の関係が線形でなければならないのですが、OutcomeもしくはControl Variableの関係が線形ではないことが多々あります。そこで、OutcomeもしくはControl VariableのLog(自然対数)をとったりY=a*X^2+bX+cの関係式にすることで、Outcome及びControl Variableの関係を線形に近づける、Linear-Log Model、Log-Linear Model、Log-Log Model及びPolynomial Modelを学びました。さらに、Multicollinearity、HeteroskedasticityやSerial Correlationなど、Regression Modelの分析において、その結果を歪める可能性がある要因についても理解を深めることができました。

因果関係を解明するための代表的な手法であるDifference-in-Differences(差の差分析)を学ぶことができたことも、このコースを履修するにあたって得た大きな収穫の1つです。この手法は、介入を受けたグループと受けなかったグループの間で、政策導入前とその後の結果を比較することで、その政策効果を評価するものです。これにより、検証方法と結果次第では、政策とその政策効果の因果関係を主張することができます。

Group Project

このコースの最大の特徴は、Final Examの代わりにGroup Projectがあることです。私の場合、Group Projectは私を含め4人で行い、まさに講義で学んだことと同様に、OutcomeとControl Variableの関係を分析しました。

全体的な流れとしては、まず、何を OutcomeとControl Variableにするか決め、その上でこれらがどのような関係にあるか仮説を立てます。次に、実際にこれらのデータを集め、STATAで分析します。最後に、分析した結果をプレゼンテーションで発表し、20ページ程度のレポートを提出します。

私のグループでは、児童虐待(Child abuse)と両親の教育レベル(Education level)の、2017年と2022年のパネルデータを分析しました。結果的に、「児童虐待と両親の教育レベルに相関関係(※)はないと考えられる」という結論に達しましたが、パネルデータの量を増やせばまた違った結論が得られたかもしれません。

自分自身でイチから仮説を組み立て、統計ソフトでデータを分析するというのは、データ分析を学ぶために留学した私にとって非常に貴重な経験でした。

(※)このコースでは因果関係を解明することまでは求められていないため、Group Projectではあくまで相関関係を分析しました。

※これまでに書いた記事はこちらから参照いただけます※