Monte Carlo simulation 把不确定变量反复抽样,观察结果可能落在哪里。
Chapter 2.9 · 投资仪表盘
让很多种未来先试飞一遍
模拟和大数据不是答案机器,而是试飞场:先让很多未来飞一遍,再看哪种坏天气自己承受不起。
Scene
让教育金计划跑一万种明年
林先生想给孩子准备教育金,担心市场大跌。现实只会发生一次,但电脑可以根据假设生成一万条可能路径:有的顺风,有的逆风,有的半路暴跌。模拟不是告诉你哪条路一定发生,而是让你提前看到路网。
Mechanism
先看它怎么一步步发生
- 01 提出问题
- 02 设定假设
- 03 生成许多路径
- 04 观察结果分布
- 05 回到决策
Bootstrap 从已有样本里反复抽取,估计统计量有多不稳定。
数据多不等于理解深。问题不清楚,模型只是更快地产生噪声。
Dashboard
把概念压成一张仪表盘
读这一节时,先盯住这些观察点。英文术语只是标签,真正要理解的是它在故事里承担什么功能。
| 观察点 | 英文术语 | 怎么理解 |
|---|---|---|
| 模拟 | simulation | 根据假设生成许多可能未来 |
| Bootstrap | bootstrap | 从历史样本反复抽样 |
| 机器学习 | machine learning | 从大量数据里寻找模式 |
| 过拟合 | overfitting | 模型记住历史噪声,却解释不了未来 |
Try it in the story
为什么分布比单点预测更有用
一句话说“明年可能赚 8%”帮助有限;如果你看到大部分路径在 -5% 到 15%,最差 5% 路径可能跌 25%,你就更清楚这套计划是否能承受。
Common traps
容易想错的地方
误区 1模型复杂就更可靠
校正:复杂度不能替代好假设
为什么重要:错误假设会被电脑认真放大。
误区 2历史样本包含一切未来
校正:未来可能出现历史没见过的情景
为什么重要:模型输出要和常识、制度变化一起读。
What remains
读完检查
模拟帮助看见路径分布,不保证未来。
大数据工具要服务问题,而不是替代问题。
模型输出最终要回到目标、期限和风险承受能力。
这节课在系统里的位置
模块问题
回到模块路线
2 投资的仪表盘
投资结果应该用哪些仪表来读?
上一站
2.8 变量之间的关系怎么量出来
用回归理解变量之间的关系。
现在学
2.9 让很多种未来先试飞一遍
下一站
3.1 买卖一只股票时,市场内部发生了什么
理解模拟、bootstrap 和大数据的用途边界。
本节拿走:模拟帮助看见路径分布,不保证未来。理解订单、报价、买卖价差和成交。