《表2案件信息对鉴定人决策的影响(按学科分类)》
3使用真实的p值代替原文中“不显著”的名称(h t t p://w w w.s o c s c i s t a t i s t i c s.c o m/p v a l u e s/f d i s t r i b u t i o n.a s p x),p值为双尾统计值。
如前文所述,我们发现有2项研究在参与者盲测和组间可比性方面存在严重缺陷。在其他的研究中,有些实验设计没有达到我们认为的“理想”状态,要么是因为没有报告重要的细节,要么是因为没有达到特定的标准。尽管大多数研究采用将参与者分成不同研究小组(或将分析样本随机排序)的实验设计,但部分研究并没有明确指出分配过程是随机的,而且没有任何一项研究提供有关随机分配程序的信息,该程序是随机临床试验中的推荐性做法(例如,见文献[60]中第8.9章“序列生成”中的介绍)。此外,随机化并不意味着一定具有可比性,特别是对于小样本数据而言,有很多研究并没有报告组别特征的数据。例如,参与者的经验水平可能是这些分析中要考虑的一个重要变量。提供每个研究小组中关于参与者经验水平的数据,而非仅提供整体性数据,对于确保组间可比性是十分重要的。不同研究中的盲测程度也各不相同,有些研究的设计方式是为了不让参与者知道某个样本是研究样本,而其他研究设计只是让参与者对特定假设或组别分配不知情。大多数研究报告了足够详细的描述性分析,以便确定实验效果的大小(例如,组间差异的程度)。使用某些特定的统计检验方法可能存在更大的问题,因为研究中可能没有对该统计方法进行完整描述,或者使用了错误的统计程序(例如,使用稀疏单元的卡方检验)。大多数研究没有讨论参与者的资格标准,以及有关参与者的选拔、招募过程的细节,包括参与率。
图表编号 | XD00188691000 严禁用于非法目的 |
---|---|
绘制时间 | 2020.12.25 |
作者 | 曹洪林、潘楚怡 |
绘制单位 | 司法文明协同创新中心,证据科学教育部重点实验室(中国政法大学)、中国政法大学证据科学研究院 |
更多格式 | 高清、无水印(增值服务) |