Desvousges,马修斯和火车(土地经济学,2015年)使用或有估值方法(CVM)进行加总测试(即WTP是否进行A + WTPB = WTPA + B?)。他们使用非参数Turnbull估计器,发现数据未通过加总检验。这表明CVM缺乏内部有效性。
从2016年9月开始,我开始在此文章上发表评论 一系列博客文章 质疑基础数据的有效性及其调查的实施。该评论经过了多轮审查,在Land Econ上提交,审查,修订和拒绝(由于对DMT答复的担忧),提交,审查,修订然后从《经济学》电子期刊中撤回,然后提交,审查并 接受出版 在生态经济学。该评论比博客文章更进一步,它表明尽管使用了WTP估计量的某些测试实际上支持了加法检验(尽管实现上存在缺陷,并且另一个假设检验更合适)。
Desvousges,马修斯和火车(生态经济学,即将出版)现在通过描述我犯的12个错误(12!)回复了我的评论。我同意我犯了他们名单上的错误之一。我通过检查两个愿意支付估计值的信心区间(整体与部分之和)是否重叠进行了加法检验。众所周知,置信区间可以重叠,但是检验的t统计量将表明均值差异在统计上是不同的。我犯的错误不是检查t统计量。这是一个令人尴尬的错误。最糟糕的是,我在商务统计课程中将此课程教给了本科生。我告诉他们不要犯这个错误,我've在发表的期刊文章中做到了。一世'm very embarrassed.
有很多原因(尽管不是借口)会导致此错误,我将在另一篇博客文章中对此进行描述。但是今天,让我指出我犯的另一个错误,该错误几乎与t统计量有关: 我使用了错误的置信区间。一世n 怀特海(2020) 我使用的是Delta方法的置信区间(来自方差-协方差矩阵的一阶泰勒级数展开式),它们是对称的。众所周知,参数比率(例如WTP)的分布不一定是对称的。当不精确地估计分母中的参数时,如Desvousges,Mathews和Train中的不对称性会变得更加严重(土地经济学,2015年)。另一个常见的方法是Krinsky-Robb(KR)置信区间。这些基于对估计参数的方差-协方差矩阵的仿真。在即将发表的博客文章中,我'图11表明KR置信区间非常宽。如此之大以至于各部分之和的WTP都位于整个WTP的置信区间内,从而支持了以下结论: 怀特海(2020)。一世'我也犯了这个错误,这让我感到很尴尬。
我最大的担忧是,除了我对Desvousges,Mathews和Train的重大错误(以及Delta方法置信区间错误)"Reply to Whitehead"他们不会非常重视自己的研究问题。相反,当我'我的论文有收到我的评论'尝试从评论中学习,然后尝试修正我的论文(例如,请参见 怀特海,土地经济,2004年)。 Desvousges,Mathews和Train采取的策略是,最好的防守是好的进攻。他们的态度似乎是,他们的数据并不比任何其他CVM数据集都要糟糕(特别是,他们在脚注3中指出了我15至30年前的数据)。我不'相信这种方法是推进经济科学的最佳方法。
我对Desvousges,Mathews和Train的评论(土地经济学,2015年)解决了三个主要问题:(1)数据存在缺陷/质量低下;(2)调查中实施的加法检验存在缺陷;(3)附加的统计检验不支持DMT(2015年) ) 结果。这些问题都没有被Desvousges,Mathews和Train(即将出版)所驳斥。相反,这些问题中的每一个都被Desvousges,Mathews和Train所混淆"Reply to Whitehead".
首先,我提供一个 更正 以上我的错误描述。其次,这是对我12岁的回应"mistakes":
(1)对数线性模型并非DTM所声称的那样毫无意义。对数线性模型和中位数WTP是解决负WTP的一种简单方法。这些模型的平均WTP是无限的,这不是功能形式的问题,而是数据问题。 DMT(2020)提供的WTP估算值总和的中位数在整个方案的WTP中位数的95%Krinsky-Robb置信区间内。 [这里更多]
(2)允许负支付意愿的线性投标模型是不合适的。如果在最低出价时,“是”答复的百分比小于50%,或者如果WTP估算值在统计上不准确,则此功能形式可能会产生负WTP。该模型的平均WTP的点估计在五个方案中的四个中提供了正的WTP估计。不利的WTP估计值来自麻烦的第二个方案数据(请参阅(4))。第三种情况从统计分布中生成负的WTP值。在统计加总测试中考虑这些因素支持了我的结果,即WTP部分的总和无法与整个方案在统计上区分开。 [这里更多]
(3)按照更正方法,当使用更合适的置信区间(KR)时,如果缺少人口统计学特征的受访者被舍弃,则加和测试通过。 [这里更多]
(4)加权数据不支持Desvousges,Mathews和Train(土地经济学,2015年)作为DMT声明。整个场景和第二个场景的加权数据为"roller coaster" and "耐克的swoosh +形状,而不是理论要求的向下倾斜。这表明加权数据揭示了受访者之间的一些不合理性。 DMT'的方法是在各种情况下强加被调查者的合理性。它们将成本系数限制为跨方案相等,以施加向下倾斜的成本效应。当隐藏统计上无关紧要的(过山车)和符号错误的(Nike swoosh)坡度系数时,这是不合适的。 [这里更多]
(5)DMT通知我在2016年的博客文章中使用Kristrom非参数估计量进行了加法检验(这里)。他们声称我"无意中放弃了观察"在进行这些计算时。放弃这些意见并不是 "inadvertant."在有问题的博客文章中,我使用了n = 950的样本量,这与DMT(2015)在其表5中使用的样本量相同(删除了缺少年龄变量的观察值)。
DMT(2020)报告说,使用Kristrom估计器和I"没有报告相关发现"因为我没有在Whitehead(2020)中包括这一点。这就引出了一个问题:在纸质评论中应该进行多少个附加测试?在Whitehead(2020)中,我使用文献中的某些标准模型提供了三个参数测试。然后,我用(a)加权数据和(b)完整的病例数据集(在剔除年龄和收入缺失的人后,n = 934)来考虑这些测试的稳健性。
(6)声称查普曼等人。 (2009年)数据和我自己的一些数据集(大约1992年至2011年)与Desvousges,Mathews和Train(土地经济学,2015年)的数据被夸大了。我在附录中显示了 怀特海(2020) 查普曼等。 (2009)在质量上远远优于Desvousges,Mathews和Train(土地经济学,2015年) 数据。使用上尾巴的长度作为质量度量,我发现自己的数据大部分位于Chapman和DMT数据之间(我的数据集之一是文字"off the chart"低质量离群值)。质量是样本量的增加函数。 [这里更多]
(7)Desvousges,Mathews和Train(2015)尚未提供其互联网调查供审核。我问了两次。比尔·德斯富格斯(Bill Desvousges)第一次让他的助手把查普曼(Chapman)等人寄给我。 (2009年)报告,其中包含他们的现场调查。我第二次问他是否将《经济学:电子期刊》的编辑通知了我。编辑告诉我说,他认为我拥有写复制纸所需要的一切,而不必再向Bill Desvousges发送电子邮件(我赢了't)。声称他们的调查将有关替代效果的信息传达给调查受访者的说法只是断言。提供调查以供审核将是直截了当的。
(8)DMT(2020)是正确的,指出"implicit claim"可能是糟糕的单词选择。在DMT(2015)中,他们的经验发现没有收入影响。但是,他们错误地(9)承认使用加权数据时存在统计上显着的收入系数。他们没有解释为什么他们选择强加这个"external"收入约束而不是纳入收入影响"internally"在调查方案中。内部/外部可能比隐式/显式更好的单词选择。
(9)使用具有加权数据的模型,发现我的统计学上显着的收入系数。 Desvousges,Mathews和Train(2020)指出,他们使用加权收入系数重新运行了模拟,并发现了相似的结果。但是,如果他们使用加权收入系数重新运行模拟,则应该使用加权WTP模型进行测试,但缺乏有效性(请参见上面的(4))。这"external"除非在将成本系数限制为相等的情况下进行收入检验,否则不能在对数据做出一致假设的模型中进行收入检验(这样做是为了掩盖统计上无关紧要和错误大小的成本系数)。
在怀特海(Whitehead,2020)中,人们也怀疑收入是否是正确的预算约束。我怀疑受访者在回答CVM问题时会考虑一些环境贡献预算。 DMT在脚注4中指出,这违反了微观经济学理论。我假设他们指的是新古典微观经济学,而忽略了行为经济学。即使如此,两阶段预算决策也与两阶段预算相一致,在该阶段中,家庭首先将收入分配给不同的预算类别,然后在预算约束下最大化次要效用函数(Deaton和Muellbauer,1980年),该理论导致了预算的发展。几乎理想的需求系统计量模型)。
(10)根据我对Desvousges,Mathews和Train(土地经济学,2015年)和缺少测量工具(请参阅(7))是一种单尾范围测试。这不是单尾加法测试。另请注意,CVM调查中提供的有关以下内容的任何信息:"substitute"受访者可以将环境商品解释为补充(参见Whitehead和Blomquist,WRR,1991年)。
(11)阿罗(Arrow)等人。 (1994年)遗憾地在NOAA小组的报告中使用了适当的术语(指范围效应的大小)。相反,他们认为合适的词是合理的范围效应。我在怀特海(Whitehead)(Ecol。Econ 2016)中指出了这一点,并提出了示波器弹性作为度量。鉴于进行合并测试有困难,与合并测试相比,示波器的弹性是一种更合理的合理性度量。
(12)我的Turnbull标准误差估算值与DMT不同's(2015)标准错误。我在Haab和McConnell(2002)中应用了汇总(平滑)数据的公式。 DMT(2020)报告说,他们使用原始数据来构建具有平滑数据WTP估计值的置信区间。我对标准误的估计大于DMT's(2020)。但是,似乎原始数据(未平滑)的标准误差应该大于平滑数据的标准误差。 DMT(2020)没有提供有关此估计的太多信息,因此很难多说。
欢迎发表评论!
最近评论