陆方文:诺贝尔经济学奖表彰的实验方法及其在中国的运用
发文时间:2019-10-17

2019年的诺贝尔经济学奖颁发给了三位发展经济学家:阿比吉特·班纳吉(Abhijit V.Banerjee)、埃丝特·迪弗洛(Esther Duflo)、迈克尔·克雷默(Michael Kremer),以表彰他们“在减轻全球贫困方面的实验研究”。本次诺奖的关键词有两个:一是脱贫,二是实验。 说到脱贫,一些老百姓表示不服:最应该拿这个脱贫奖的应该是中国。2015年诺奖获得者安格斯·迪顿(Angus Deaton)就点名表扬中国所取得的脱贫成就。改革开放四十年来,中国贫困人口数量从1978年末的7.7亿人,下降到2017年末的3046多万人,对全球减贫的贡献率超七成。可是,这是经济学奖,不是经济奖,我们是“摸着石头过河”就过来了,石头长什么样,怎么摸石头,下次能否同样地摸石头,我们说不出很多所以然。 说到实验,一些学者也表示不服:中国有试点。那本文就重点来探讨一下试点和实验的关系,以及如何用实验的方法更好的发挥试点的作用、推进经济的进一步发展。


一、从试点到随机实地实验

“先试点后推广”,在中国改革开放和经济转型的历程中发挥过关键性的作用。一项改革特别是重要改革,先在局部进行试点探索,取得可以外推的可靠经验、形成广泛共识后,再把试点的经验和做法在面上推开,对于改革的稳妥推进具有重要意义。小岗村包产到户试点和深圳经济体制改革特区试点就是具有代表性和里程碑意义的试点范本。

新时代深化改革开放的实践,不仅没有削弱试点的意义,还对试点的质量提出了更高的要求。“试点是改革的重要任务,更是改革的重要方法。”试点的目的,是要为“为面上改革提供可复制可推广的经验做法”。新时期关于试点“可复制可推广”的要求,对传统的试点做法提出了重要的挑战,也正和本年度诺奖所表彰的随机实地实验方法(randomized field experiment,也被称为随机田野实验)相契合。

传统的试点方法,通常是在条件好的地方先试点,试点过程中为了显出试点成效有时候配套各种补充政策或者优惠措施,在试点效果评估和总结的时候选择有利指标而忽视不利结果,或者只是在部分受惠人群中询问是否满意。这就导致在实践当中也不乏试点非常成功但在推广时却阻力重重的现象。试点所存在的这些问题,用标准的学术术语来刻画就是:试点过程中的样本选择性偏误、干预措施不明确和结果评估偏误,威胁到了试点的可信性和试点经验的外推有效性。



二、随机实地实验的基本方法和优势

随机实地实验的基本过程一般包括五个步骤。

第一步,确定实验人群。以探讨节能宣传对居民消费影响的实验为例,因为涉及居民的能源消费,我们首先要确定进行实验的居民区:是一个小区还是若干个小区;若干个小区是集中在一起还是分布在城市不同方位,或者是在不同的城市。

第二步,进行随机分组。实验者需要将实验对象分成一个控制组以及一个或者多个干预组。随机分组的目的是通过消除实验前不同组别之间的系统性差异以实现不同组别之间的可比性。在这个例子中就是要求,如果没有实验干预的话,不同组之间的居民行为是可比的,这样我们就可以把干预后不同组之间的行为差异解释成干预的效果。随机分组是随机实地实验的关键环节。

第三步,开展实验干预。控制组的居民像他们往常一样的生活,而干预组的居民会受到明确界定的干预措施影响。举例来说,干预措施可能包括发放节能传单或者进行上门游说,宣传为公益而节能或者强调节约自我成本等等。基于媒介或内容的不同,可以形成不同的干预措施。干预措施可以是现实当中已有的政策或方法,也可以由研究人员自己创新设计。在实验中,干预的具体措施是明确界定的,同样被干预群组内的个体获得的干预是一样的,不会在实验过程中被随意更改。

第四步,数据收集。这可以通过问卷、实地检测和经济学游戏等多种手段实现。

第五步,也是最后一步,是对数据进行处理和分析,并得出结论。比如,克雷默及其合作者开展过一系列疟疾除虫的实验,他们的实验人群是学校里的学生,随机分组是在学校层面上进行,确保分在各组的学校和学生特征基本相同,他们最初的实验干预是提供相应的干预药片,干预组服用一次,控制不服用,对这些学生的其他生活和学习不做其他干预,经过一段时间之后,收集所有学生的学习和健康相关指标。最初的研究室探讨健康扶贫的影响,后续的研究进一步探讨在经历了免费提供的有效药片后,非洲人民是否改变认识、自觉地购买这一药片,即有了第一推动力之后、非洲人民是否走上了追求健康的道路上。班纳吉和迪弗洛则是在教育、健康、小微金融、学校管理、政府治理等非常广泛的领域开展随机实地实验研究。

随机实地实验的优势,分别体现在“随机”“实地”“实验”三个词上。对比起大多数基于观测性数据的研究,分组的随机性和实验干预措施的可设计性为随机实地实验带来两大优势:可信性优势和创新性优势。随机分组可以保障控制组和干预组的可比性,无论在过去还是在潜在的未来;因此控制组和干预组之间在干预实施后的差异都可以归因于干预措施。在基于观测数据的研究当中,由于遗漏变量、双向因果等问题的广泛存在,受到某种干预的个体和没有受到的个体之间常常不具有可比性。尽管越来越多的微观计量方法逐渐被开发出来,从一元回归到多元回归,进而到样本选择模型、固定效应模型、双重差分法、工具变量法、断点回归法等更高深的计量模型,试图解决研究对象的可比性问题,但各自存在着局限性。而在实验中,控制组和干预组安排的随机性,为实验结果的可信性提供了有力的保障。

除了可信性优势之外,人为的实验干预措施还产生了随机实地实验的第二个优势——创新性优势。有一些公众关心但现实当中还没有实施的政策,或者公众没有意识到但从理论中推导出的可能措施,如果仅仅依靠观察性研究是无法进行定量的政策评估的,但都可以通过设计相关的干预措施进行探讨。此外,有一些在现实当中无法分解的机制,也可以在实验中进行分解。干预措施的可设计性为实地实验提供了创新性的源泉。

在和其他实验的对比上,“实地”所带来的优势就是更加贴近现实。实地实验是在现实的实验人群、基于现实的生产生活活动而开展的现实的政策干预。

对比起大多数的政策试点,分组的随机性也是随机实地实验的重要优势。试点,常常是选择性样本,自发的、在条件好的、有积极性的地方先试点,但是他们的经验不一定适用于其他地方;而在实验中,每一类个体在干预组和控制组都有代表性。此外,实验干预措施的规范性以及结果评估的规范性,也是随机实地实验相对于试点的优势。在创新性优势上,随机实地实验和试点是一脉相承的,但试点可能更强一些,这主要因为后者没有对规范性做很强的要求。



三、随机实地实验在国内的发展现状和展望

当前,随机实地实验在国内已经逐步开展,但总体上还是研究不足。主要原因大概有四个方面。一是由于国内科研经费的投入、尤其对年轻人的投入相对比较小,难以为实施实验研究提供充足的经费保障。二是很多学者在对随机实地实验方法这一相对前沿的方法在认识上还存在着一些问题,不太了解,不知道如何具体实施。三是一些研究者仍然倾向于把随机实地实验简单地看成政策评估的工具,并没有把实验很好地融入到对理论的探讨和对机制的分析中去。四是政府和学者的合作比较有限,当然政府人员对试点的局限性和随机实地实验的优势也缺乏了解。

我国正经历着深刻转型和快速发展,各种问题和矛盾以及内在的规律性都在短时期内不断产生和暴露出来。转型期的各种制度创新和政策试点层出不穷,这就形成了一个天然的大实验场。这为随机实地实验方法的发展和应用提供了广阔的空间。但如果试点缺乏科学的设计和理论的支撑,没有控制和干预,试点主体的选择和政策措施存在模糊性,试点的数据采集和研究缺乏系统性,从而导致试点往往达不到预期的外部有效性。基于传统试点和随机实地实验的优势,我们推荐一个组合的实践方式,首先由个别的个体先行试点,在试点的基础上总结和提炼干预措施,然后在小面范围上开展规范的随机实地实验,最后在随机实地实验的经验和结果基础上,进行大面范围上的推广决策。藉此,我们希望随机实地实验的规范方法能够实现 “为面上改革提供可复制可推广的经验做法”,推进转型发展时期的制度和政策设计水平。


(作者陆方文为中国人民大学经济学院教授,美国加州伯克利大学经济学博士)