研究メモ ver.2

安藤道人(立教大学経済学部准教授)のブログ。旧はてなダイアリーより移行しました。たまに更新予定。

ジョン・ベイツ・クラーク賞と政策評価(policy evaluation)

今回の受賞者はMITの開発経済学者のEsther Dufloとのこと。1990年代以降、応用計量経済学の一大分野となった政策評価(またはプログラム評価)の手法を開発経済学の分野に応用し発展させていったことが評価されたようだ。不勉強ながら、私は彼女の論文ほとんど読んだことないが(QJEのDDについての論文はちょっと目を通したことがある。)、いずれちゃんと読む機会があるとは思う。

John Bates Clark Medal
http://www.vanderbilt.edu/AEA/honors_awards/clark_medal.htm
MITのサイト
http://econ-www.mit.edu/faculty/eduflo/short

政策評価」(policy evaluation)とは、より一般的な意味でも使われる言葉だからややこしいが、経済学では、労働経済学の分野を中心にAngrist、Card、Kruegerなどが1990年代に大きく発展させた計量経済分析の手法の総称であり、現在は公共経済学や開発経済学などの多くの分野で適用され、さらには政策分析だけでなく、近年の、レヴィットの「ヤバい経済学」のような様々な「風が吹けば桶屋が儲かる」的な斬新な研究の量産にも貢献している。

この分野の研究の一つの特徴は、多くの研究において、通常の人々が想像するような数式いっぱいの「経済学理論」も「計量経済学理論」も登場しないことだ(もちろんそうではないものもたくさんある。)。そして普通の人でも、丁寧に説明されれば、直感的なレベルで、分析手法についてかなりのところまで理解することが可能である。「回帰分析で他の影響をコントロールした結果。。。」とかいわれるとなんのこっちゃとなってしまう普通の人々でも、DD(Difference in Differences:差の差)やRD(Regression Discontinuity)、そしてIV(Instrumental Variables:操作変数法)でさえも、きちんと説明されればその意図・前提・妥当性について理解することができる。

大雑把にいえば、これらの研究は(計量経済学で最初にならう回帰分析も実は同じなのだが)、「もし○○だったらXXだったかもしれないのに。。。」という、同一人物(あるいは同一対象)では決して再現できず、実際には現実と比較不可能な「反実仮想」を(歴史にifはないというやつです)、似たような人々や対象のデータを使って再現し、現実と反実仮想を比較し、○○の効果を推定するという試みである。

例えば、双子の太郎君と次郎君がいて、まったく同じ遺伝子を持ち、同じ家庭に育ち、まったく同じ時間に同じご飯を食べて、同じ学校に通い、同じ部活で同じ競技をし、まったく同じ時間に寝て、同じ時間に起きるという生活をしているとする。なのに、中学1年から2年にかけて、太郎君は身長が15センチ伸びて、次郎君は身長が10センチしか伸びなかった。なぜか。

(以下の記述はDD(差の差)推定についての説明。統計・計量理論についてはぼかして書いているので、より厳密には最後の参考文献等見てください。もちろん、最後の参考文献を読むような人はどこが厳密でないのかもわかるのだろうが。。。)

実は太郎君はこの一年、寝る前に牛乳を毎日一杯飲んでいたのに対して、次郎君は飲んでいなかった。このとき、太郎君と次郎君の身長の伸びに影響を与える他のもの(遺伝子やご飯や部活や睡眠時間など)が全く一緒ならば、この一杯の牛乳(すなわちカルシウム)が太郎君と次郎君の身長の伸びの差(すなわち「差の差」=5cm)の唯一の原因であると考えることは十分に合理的だ。このとき私たちは、次郎君を「牛乳を飲まなかった場合の太郎君」に見たてて、実際の「牛乳を飲んだ太郎君」(現実)と「牛乳を飲まなかった場合の太郎君」(反実仮想)を比較して、牛乳の身長への効果(この場合は5cm)を計ることができる。

普通の回帰分析ならば、「遺伝やご飯や部活や睡眠時間などの他の影響をコントロールすると、牛乳(カルシウム)と身長の伸びには有意な相関がある」などというが、この「他の影響をコントロールする」というのがどうにも曖昧で説得力を欠いたり、この「有意な相関」が必ずしも「有意な因果関係」といえない場合があるのが難点だ。
この問題は「政策評価」分析でももちろん残るのだが、政策評価分析では、実際に社会実験をしたり、上記の例のように双子や兄弟姉妹のデータを使ったり、あるいは「他の影響」が存在しないことがもっともらしい状況のデータを使ったりすることによって、「反実仮想」の状況を作り出し、現実と反実仮想の差を見ることによって、現実と反実仮想との間の唯一の違いである「政策」(上記ではカルシウムの摂取)の効果(因果関係)をより厳密に推定しようとする。

もちろん、この方法は万能ではない。例えば、太郎君が寝る前に牛乳を飲むのは、実は太郎君が不眠症だからで(ホットミルクは寝つきを良くするといわれてるので)、牛乳を飲んでもなお、太郎君の毎日の睡眠時間は次郎君よりも1時間少なく、ベットで悶々としているかもしれない。この場合、太郎君の睡眠時間は次郎君よりも年間365時間少ないにもかかわらず、太郎君の身長は次郎君よりも5cm多く伸びたのだから、もし太郎君が次郎君と同じだけ寝られる子どもだった場合、太郎君は次郎君よりも7cm多く伸びたかもしれない。

この場合、牛乳のプラス効果が7cm、睡眠時間が少ないことによるマイナス効果が2cm、合計プラス5cmということになる。しかし上記では、牛乳の効果が5cmと誤って推定されてしまう。これは通常の回帰分析で「他の影響をコントロールする」ことに失敗すると推定結果が歪む場合があるのと同じで、「他の影響は全て同じで、従って、次郎君を「牛乳を飲まなかった太郎君」という反実仮想とみなすことができる」という前提が妥当でなければ、推定結果が歪むということである。

また、これまで牛乳=カルシウムとして議論してきたが、牛乳中のある成分には寝る前に飲むと実際に寝つきをよくする効果があり、そのため(前段落とは逆に)太郎君が次郎君よりも毎日1時間多く睡眠を取れている場合、太郎君と次郎君(あるいは牛乳を飲まなかった太郎君)との身長の伸びの差5cmは、カルシウムの摂取の有無だけではなくて睡眠時間の差にもよるかもしれない(例えばカルシウムの効果が3cm、睡眠時間の効果が2cmとか)。しかし牛乳にカルシウム以外の効果があることを見落とすと、誤って牛乳効果=カルシウム効果としてしまうことになる。

前述したように、こういう発想をベースにした研究は、労働経済学を中心に発達したが(職業訓練プログラムが労働者の将来の雇用や賃金に与える影響など)、公共経済学や開発経済学でもどんどん取り入れられつつあるし、自治体データや地域データを使った分析にも応用されている。私は読んだことはないが、国データを使った分析もあるようだ。

これらの展開についてエントリで整理できる能力はないのでこのへんで。上記の解説も、付け焼刃の知識でお勉強メモ的にざっと書いたので、間違い等あればご指摘ください。

政策評価」関連リンク

ウェブで読める日本語文献

川口大司(2008)「労働政策評価計量経済学
http://eforum.jil.go.jp/institute/zassi/backnumber/2008/10/pdf/016-028.pdf

黒澤昌子(2005)「積極労働政策の評価―レビュー」
https://www.mof.go.jp/f-review/r77/r77_197_220.pdf

集大成はこれ。

Mostly Harmless Econometrics: An Empirict's Companion

Mostly Harmless Econometrics: An Empirict's Companion

なんと全文のdraftがウェブに。これあったら本買う必要ないけど、いいのかな?一年前に知らずに買っちゃったけど。
http://homepage.fudan.edu.cn/~jfeng/teaching/labor_economics/Angrist_-_Mostly_Harmless_Econometrics.pdf

Esther Duflo関連リンク
ツイッターでtetteresearchさんがEsther Dufloおよび開発経済額における政策評価研究についていくつか日本語参考リンクを貼っているのでそれもメモ。また、政策評価の計量分析の問題点等について、私よりずっと信頼性があり、かつ専門性の高いつぶやきもある。
http://twitter.com/tetteresearch

青柳恵太郎「インパクト評価を巡る国際的動向」
http://www.fasid.or.jp/chosa/oda/report_pdf/report18_4.pdf
佐々木亮ODA分野における『エビデンスに基づく評価』の試み:「貧困アクションラボ」の動向」
http://www.idcj.or.jp/JES/jjes6_1sasakiryo.pdf
澤田康幸(2008)第6回「インフラは貧困削減に寄与するか? インドにおける大型ダムの効果」
http://www.rieti.go.jp/jp/projects/development_aid/column_06.html