爱奇飞网

网站首页教育知识 >正文

是时候放弃零假设显着性检验了

开心的月饼 2023-12-14 09:00:09 教育知识

来自西北大学、宾夕法尼亚大学和科罗拉多大学的研究人员发表了一项新的《营销杂志》研究,建议放弃原假设显着性检验(NHST)作为统计分析和报告的默认方法。

是时候放弃零假设显着性检验了

该研究题为“‘统计显着性’和统计报告:超越二元”,作者为BlakeleyB.McShane、EricT.Bradlow、JohnG.Lynch,Jr.和RobertJ.Meyer。

零假设显着性检验(NHST)是市场营销以及更广泛的生物医学和社会科学中统计分析和报告的默认方法。在实践中,NHST涉及

假设所调查的干预措施与其他假设没有影响,

基于这些假设计算称为P值的统计度量,以及

将计算出的P值与任意阈值0.05进行比较。

如果P值小于0.05,则该效应被宣布为“统计显着”,拒绝没有效应的假设,并得出干预措施在现实世界中产生效应的结论。如果P值高于0.05,则表明效果“统计上不显着”,不拒绝没有效果的假设,并得出干预措施在现实世界中没有效果的结论。

对NHST的批评

尽管其默认角色,NHST长期以来一直受到统计学家和应用研究人员(包括营销人员)的批评。最突出的批评涉及将结果分为“统计显着”和“统计不显着”。

例如,作者、编辑和审稿人使用“统计(非)显着性”作为过滤器来选择要发布的结果。迈耶表示,“这造成了文献的扭曲,因为已发表的干预措施的影响在幅度上存在偏差。它还鼓励有害的研究实践,从而产生达到所谓统计显着性的结果。”

林奇补充道,“NHST没有基础,因为在现实世界中任何干预都没有精确的零效应,并且足够的样本量可以保证较小的P值和‘统计显着性’。换句话说,没有必要拒绝零效应的假设当它已经知道是假的时。”

也许对统计最普遍的滥用是确定某些统计指标(例如P值)相对于0.05的位置,并将其作为声明“统计(非)显着性”的基础,并从单个研究中得出一般性和某些结论。

“单项研究永远不是确定的,因此永远无法证明有效果或没有效果。研究的目的应该是以未经过滤的方式报告结果,以便以后可以根据多项研究的累积证据得出更一般的结论。NHST导致研究人员错误地做出一般性和某些结论,并错误地过滤结果,”布拉德洛说。

“不同研究的P值自然会有很大差异,”McShane解释道。例如,一项“具有统计学意义”的原始研究,观察到的P值为p=0.005(远低于0.05阈值),而一项“统计学上不显着”的复制研究,观察到的P值为p=0.194(远高于阈值0.05)。0.05阈值)彼此高度兼容,假设它们之间没有差异,观察到的P值是p=0.289。

他补充道,“然而,从‘统计(非)显着性’的角度来看,这两项研究似乎截然不同,因此存在矛盾,因为它们的分类不同。”

对统计分析的建议更改

作者提出了统计分析和报告的重大转变。具体来说,他们建议放弃NHST及其固有的P值阈值作为统计分析和报告的默认方法。他们的建议如下:

“统计(非)显着性”绝不能用作做出一般性和确定性结论的基础。

“统计(非)显着性”也不应该用作选择要发布的结果的过滤器。

相反,所有研究都应该以某种形式发表。

报告应侧重于通过点和区间估计来量化研究结果。考虑到用于计算它们的所有假设,传统区间估计内的所有值至少与数据合理地兼容;因此,单独选出一个特定值(例如null值)是没有意义的。

一般性结论应根据多项研究的累积证据得出。

研究需要持续地对待P值,并将其视为众多因素中的一个因素,包括先前证据、机制的合理性、研究设计、数据质量以及其他因研究领域而异的因素,需要共同考虑和整体整合。

研究人员还必须尊重这样一个事实,即这些结论必然是暂时的,并且随着新研究的进行可能会被修改。

在科学报告中很少需要做出决定,必要时最好留给最终用户,例如管理者和临床医生。

在这种情况下,应该使用决策分析来进行决策,该分析通过损失函数(通常在利益相关者之间差异很大)整合成本、收益和所有可能后果的概率,而不是通过应用于统计摘要的任意阈值,例如P-值(“统计(非)显着性”),除了工业质量控制等某些专门应用之外,不足以达到此目的。


版权说明:本站所有作品图文均由用户自行上传分享,仅供网友学习交流。若您的权利被侵害,请联系我们


标签:

站长推荐
栏目推荐
阅读排行