它通常说没有差异、没有效果、没有超额能力,防止我们太快被故事打动。
Chapter 2.7 · 投资仪表盘
证据强到什么程度才可信
假设检验是一套有礼貌的怀疑流程:先不轻信,再看证据是否强到足以改变默认判断。
Scene
基金经理说自己能稳定跑赢市场
一位经理拿着业绩表说:看,我跑赢了。你不能立刻相信,也不能立刻否定。假设检验先设一个保守起点:他没有特殊能力。然后问,现有样本表现离这个起点有多远,远到不像普通运气了吗?
Mechanism
先看它怎么一步步发生
- 01 设默认判断
- 02 收集样本
- 03 计算证据强度
- 04 比较门槛
- 05 决定是否改口
如果在默认判断成立时,眼前结果非常罕见,我们才更有理由怀疑默认判断。
统计上显著,还要问经济上够不够大,能不能覆盖费用和交易成本。
Dashboard
把概念压成一张仪表盘
读这一节时,先盯住这些观察点。英文术语只是标签,真正要理解的是它在故事里承担什么功能。
| 观察点 | 英文术语 | 怎么理解 |
|---|---|---|
| 原假设 | null hypothesis | 默认认为没有特殊效果 |
| 备择假设 | alternative hypothesis | 你想支持的新判断 |
| p 值 | p-value | 默认成立时,当前证据有多罕见 |
| 错误类型 | type I / type II error | 误判有两种方向:冤枉或放过 |
Try it in the story
跑赢 2% 到底算不算本事
如果一年跑赢 2%,但收益波动很大、样本很短,这 2% 可能只是噪声。假设检验把超额收益、波动和样本长度放在同一张桌上讨论。
检验统计量的直觉
test statistic = estimate / standard error
Common traps
容易想错的地方
误区 1不显著就是没效果
校正:也可能是样本太少、噪声太大
为什么重要:没有证明出来,不等于证明不存在。
误区 2显著就是值得投
校正:还要看效果大小和成本
为什么重要:统计结论要回到投资现实。
What remains
读完检查
假设检验是一套管理怀疑的流程。
p 值衡量证据罕见程度,不是投资结论本身。
统计判断必须再经过经济意义这一关。
这节课在系统里的位置
模块问题
回到模块路线
2 投资的仪表盘
投资结果应该用哪些仪表来读?
上一站
2.6 从样本小心推断整体
知道从样本推断总体为什么会有误差。
现在学
2.7 证据强到什么程度才可信
下一站
2.8 变量之间的关系怎么量出来
理解假设检验和独立性检验的直觉。
本节拿走:假设检验是一套管理怀疑的流程。用回归理解变量之间的关系。