本文由医信融合团队成员“陈浩然”撰写,已同步至微信公众号“医信融合创新沙龙”与“研究生学生信”,更多精彩内容欢迎关注!

前言
五色令人目盲;五音令人耳聋;五味令人口爽;驰骋畋猎,令人心发狂;难得之货,令人行妨。
——老子
在科研的世界中,何尝不会遇到 “五色”、“五音”、“五味”,花花世界迷人眼,而最经常打交道的莫过于 P value 了,差异、富集、GSEA、预后分析……
在做分析的时候,P<0.05 仿佛给实验打上了一个合格证的标签,预示毕业有望,升职有望!而 P>0.05 的时候,就有点慌了,专家评审问起来怎么办?毕业答辩被指出怎么办?准备延期吗?在此之前,让咱们一起来想想对策。

1
P 值是什么
P 值是一个概率,一个介于 0 和 1 之间的数字,是在对数据进行统计测试后计算得出的。一般来说,P 值越小代表事件为小概率事件,在统计学上通常将阈值设置为 0.05,P<0.05,拒绝 H0,接受 H1,……。
当然,H0 和 H1 具体代表的事件这里就不谈了,可以举个栗子,比如统计学家在判断天空是否要下雨时,并不会直接判断会不会下雨,而是从反面分析,即列出两个事件:H0(天空不下雨),H1(天空下雨),如果判断出天空不下雨的概率 < 0.05,那么天空不下雨就是小概率事件,因此天空可能会下雨。
2
P 值一些误区
1. 为什么是 0.05?
0.05 被称为统计显著性水平。只是统计学家们公认的指标。这个世界上有很多人为定义的概念,脱离了这些概念,理解事物也没有太多差别
2. P<0.05 的结果一定好吗?
不一定。需要根据实际研究内容决定,比如下雨这件事,如果假设 H0(降雨量为 20mm),H1(降雨量为 19.99999999mm),最后计算出来 P<0.00001,so 降雨量很可能为 19.99999999mm,可是这对于出门需不需要带伞来说,又有什么意义呢?差异分析也是如此
3. P>0.05意味着没有影响;P<0.05)意味着有影响
P>0.05时,只能说明不拒绝H0,不能排除随机性或偶然性作为出现H1时候的解释
4.P 值为 0.001 意味着效果比 P 值为 0.03 时更好
这个影响因素有很多,单从统计学上肯定是不能解释的,不然统计学家早已成为各个领域的专家了。就好比由于多重比对之后,P 值其实是需要矫正的,而且一般来说,相同研究下样本量越大,P 值越小
5. 一项研究中,光参考 P 值就足够了吗?

当然不够。如果仅看 P 值的话,A 的 P 值显然要小,那么治疗效果一定好吗?显然是不一定的,这两项研究的结果可能代表真实的治疗效果或由于抽样误差而导致的随机波动。
这其中有三个影响因素:
• 效应量:效应量越大,随机波动的可能性越小。显然,研究 A 具有更大的效应量。巨大的影响似乎很重要,但仅靠它是不够的。
• 样本量:较大的样本量允许检测出较小的影响。如果研究 B 的样本量足够大,其较小的处理效果很可能是真实的。
• 数据的变异性:变异性越大,由于随机抽样误差,您就越有可能看到实验组之间的巨大差异。如果研究 A 中的变异性足够大,则其较大差异可能归因于随机误差而不是处理效应。
在某些情况下,研究 A 中的较大效应量可能是随机误差,而研究 B 中较小的效应量可能是真正的治疗效果。
看到这,我手里 P<0.05 又不香了,但是没关系,还有指标可以补救:置信区间
如果研究 C 的置信区间为 [-5,25] ,研究 D 的置信区间为 [8,12],那么我们将能获得一些非常有价值的信息。研究 C 的置信区间非常宽且包含 0。这个估计值不精确,我们不能排除没有治疗效果的可能性。我们没有从这项研究中学到任何东西。另一方面,研究 D 的估计值相对精确且具有统计学意义。
上述仅仅举个栗子,具体情况当然还需要具体分析,万一是样本拿错了捏。
3
P 值补救手册
当有的时候,P 值稍微大了一点点,又不想放弃这么辛苦分析的结果,那么在汇报的时候应该怎么汇报呢,不显著,但想用?那么我们就可以参考 SCI 上各位 “语言学家” 的说法,把想毕业的意思委婉表达出来。
篇幅有限,此处仅展示 20 个例子,完整的 509 条已按照 P 值大小排序,后台回复攻克 P 值即可领取。

DescriptionP_valuealmost marginally significant (p>0.05)0.05an elevated trend (p<0.05)0.05approached but did not quite achieve significance (p>0.05)0.05approached trend levels of significance (p0.05)0.05below (but verging on) the statistical significant level (p>0.05)0.05bordered on but was not less than the accepted level of significance (p>0.05)0.05closely approximating significance (p>0.05)0.05does not appear to be sufficiently significant (p>0.05)0.05hint of significance (p>0.05)0.05just tottering on the brink of significance at the 0.05 level0.05narrowly evaded statistical significance (p>0.05)0.05non-significant in the statistical sense (p>0.050.05not absolutely significant but very probably so (p>0.05)0.05not especially significant (p>0.05)0.05not numerically significant (p>0.05)0.05on the very borderline of significance (0.05<p<0.06)0.05only a little short of significance (p>0.05)0.05possibly significant (0.05<p>0.10)0.05scarcely significant (0.05<p>0.1)0.05
总的看下来,P 值又是一种具有欺骗性的指标了,但是何必拘泥于课本呢,所有的概念都是人为限定的,灵活应用其优点,用以指导研究,也是有价值的,而如何灵活应用呢?
1. P 值和置信区间等假设检验结果提供了除描述性统计之外的重要信息。
2. 需要正确解释统计结果。
3. 重要的结果必须被复制才能值得认可。
4. 要评估研究的质量,必须评估整个过程而不单单是 P 值。

感谢您的观看到最后,敬请批评指正!

参考材料:
1. P-Value: A Simple Explanation for Non-Statisticians(https://quantifyinghealth.com/p-value-explanation/)
2. What Can You Say When Your P-Value is Greater Than 0.05?(https://blog.minitab.com/en/understanding-statistics/what-can-you-say-when-your-p-value-is-greater-than-005)
图文:陈浩然
本文编辑:李晨龙