Chapter 2.7 · 投资仪表盘

证据强到什么程度才可信

假设检验是一套有礼貌的怀疑流程：先不轻信，再看证据是否强到足以改变默认判断。

Scene

基金经理说自己能稳定跑赢市场

一位经理拿着业绩表说：看，我跑赢了。你不能立刻相信，也不能立刻否定。假设检验先设一个保守起点：他没有特殊能力。然后问，现有样本表现离这个起点有多远，远到不像普通运气了吗？

Mechanism

先看它怎么一步步发生

01 设默认判断
02 收集样本
03 计算证据强度
04 比较门槛
05 决定是否改口

01 原假设是默认挡板

它通常说没有差异、没有效果、没有超额能力，防止我们太快被故事打动。

02 p 值看罕见程度

如果在默认判断成立时，眼前结果非常罕见，我们才更有理由怀疑默认判断。

03 显著不等于有用

统计上显著，还要问经济上够不够大，能不能覆盖费用和交易成本。

Dashboard

把概念压成一张仪表盘

读这一节时，先盯住这些观察点。英文术语只是标签，真正要理解的是它在故事里承担什么功能。

观察点	英文术语	怎么理解
原假设	`null hypothesis`	默认认为没有特殊效果
备择假设	`alternative hypothesis`	你想支持的新判断
p 值	`p-value`	默认成立时，当前证据有多罕见
错误类型	`type I / type II error`	误判有两种方向：冤枉或放过

Try it in the story

跑赢 2% 到底算不算本事

如果一年跑赢 2%，但收益波动很大、样本很短，这 2% 可能只是噪声。假设检验把超额收益、波动和样本长度放在同一张桌上讨论。

检验统计量的直觉 test statistic = estimate / standard error

Common traps

容易想错的地方

误区 1不显著就是没效果

校正：也可能是样本太少、噪声太大

为什么重要：没有证明出来，不等于证明不存在。

误区 2显著就是值得投

校正：还要看效果大小和成本

为什么重要：统计结论要回到投资现实。

What remains

读完检查

假设检验是一套管理怀疑的流程。

p 值衡量证据罕见程度，不是投资结论本身。

统计判断必须再经过经济意义这一关。

这节课在系统里的位置

模块问题

2 投资的仪表盘

投资结果应该用哪些仪表来读？

回到模块路线

上一站 2.6 从样本小心推断整体

知道从样本推断总体为什么会有误差。

现在学 2.7 证据强到什么程度才可信

理解假设检验和独立性检验的直觉。

本节拿走：假设检验是一套管理怀疑的流程。

下一站 2.8 变量之间的关系怎么量出来

用回归理解变量之间的关系。

度量工具

把金额、时间和不确定性放到同一把尺子上。

公式角色

公式不是结论，而是把直觉压成可比较数字。

组合前置

收益和风险最终都要回到组合层面判断。