P值与z值/t值的联系与区别
1⃣️一句话总结
z值/t值: 是“信号强度计”。它衡量你观察到的效应(比如转化率提升)相对于背景噪音(数据波动)有多大。它是一个绝对值,值越大,说明效应越可能真实存在。
P值: 是“奇怪程度计”。它假设新功能完全没用(原假设为真),然后计算看到当前这么强(或更强)效应的概率。概率越小,说明原假设越可疑,效应越可能是真实的。
2⃣️在互联网A/B测试中,整个决策逻辑链是这样的:
计算Z值/T值: Z = (观测效应 - 原假设效应) / 标准误 。这量化了效应大小。
由Z值/T值得到P值:这个P值代表了在原假设下,出现当前或更极端结果的概率。
比较P值与显著性水平α:
如果 P值 ≤ α (例如 0.05): 结果具有“统计显著性”。我们拒绝原假设。结论是:“V2版本确实带来了显著的提升。” 在我们的案例中,P<0.0001 < 0.05,所以我们 confidently 宣布V2版本获胜。
如果 P值 > α (例如 0.05): 结果不显著。我们没有足够证据拒绝原假设。结论是:“目前没有发现V2版本有显著提升。” (注意:这不等于“V2和V1一样”,可能是样本量不够或效应太小)。
总结:Z值/T值是“发动机”,它驱动了P值的计算。而P值则是我们做出“上线”或“放弃”这个二进制决策的最终依据。 它们共同构成了数据驱动决策的科学基础。