![cover_image](https://mmbiz.qlogo.cn/mmbiz_jpg/R9krbX73kFsOBhQ4BKaiamib7Bqs4KvVib6KM9iblUHMOjrh3L0GicROz4at13GMHKjJZCiaIRTfBdf0OBYxlZ9pKGPA/0?wx_fmt=jpeg)
# 如何创造神迹:历史数据的证词
原创 沧海一土狗 [ 沧海一土狗 ](javascript:void\(0\);)
__ _ _ _ _
**
![](https://mmbiz.qpic.cn/mmbiz_jpg/R9krbX73kFsOBhQ4BKaiamib7Bqs4KvVib6kI2E0GdoYQKEGn2V1XqTyCebhZMbGztnVVRVrFrdpRRMcA4uvAkZkw/640?wx_fmt=jpeg)
文/沧海一土狗 ** ** **
**神奇的世界**
在我们的生活当中,充满着神奇的事情:在一个班里,遇到同年同月同日生且人生经历相似的同学;在一段时间内,一穿某个颜色的衣服,市场就会有不错的表现;甚至,神奇到觉得某个彩票号码要中大奖,结果真中了,但是,你并没有花2块钱来一注。
对于这些神奇到有些神秘的事情, **我们总有一些莫名地情愫**
,以至于我们会对它们作出反应:你会跟那个人关系特别好;你会特别中意一件衣服;你再也不敢无视自己脑子中迸发出来天马行空的数字。这样一种传统甚至可以追溯到西方宗教里的神迹、东方国度里的祥瑞。
人们看见事情就想解释,尤其是一些他们认为特别的事情,并且,他们认为这些神奇的事情一定说明什么。
**生日悖论的启示**
然而,事实上,很多看似神奇的事情,只是巧合,甚至连稀缺都算不上。为了说明这一点,我们引用一个数学上的悖论——生日悖论。
>
> 生日悖论,指如果一个房间里有23个或23个以上的人,那么至少有两个人的生日相同的概率要大于50%。这就意味着在一个典型的标准小学班级(30人)中,存在两人生日相同的可能性更高。对于60或者更多的人,这种概率要大于99%。
>
> ——摘自《百度百科》
具体推导过程就不介绍了,我们直接贴结果,( _ ps:数学推导可以不看,不影响阅读 _ )
![](https://mmbiz.qpic.cn/mmbiz_png/R9krbX73kFsOBhQ4BKaiamib7Bqs4KvVib6Bwsx5zLDh328bCvXic0wIJTCFHhGGPa0zDuoooaLgMmNiaZlenCdSTPQ/640?wx_fmt=png)
综上所述,当n比较小的时候,先验概率p起主要作用,所以,P(A)值接近于1,即1-P(A)趋近于0,至少有两个人生日同一天的概率是很低的。
然而,当n逐步扩大,n*(n-1)以 **非线性的方式增大** ,所以, **先验概率p起的作用会越来越小,最终沦为次要作用**
,当n大到一定程度,P(A)值接近于1,至少有两个人生日同一天是一件概率接近于1的事情。
人们的思考方式是线性的,而且,喜欢线性地运用先验概率p。但是,在某些情况下,实际“巧合”的概率是非线性变化的,这种非线性变化导致一种错觉:我们经常能碰到神迹——那一定是因为冥冥中有人在安排一切。
**造神的两个条件**
> 神迹之所以普遍有两个原因,1、我们喜欢神迹,并把他们挑出来;2、神迹的模式有太多的种类。
>
> ——土狗按
如果说生日悖论的案例有些拗口或者抽象,我们可以举白云的例子。一般意义而言,随便一朵白云,像一只土狗的概率是很低的,万分之一甚至亿万分之一。
但是,我们有两个非随机性的工具:1、 ** 筛选效应 **
,人是不会关注平平无奇的白云的,人们只会把他们觉得有意思的云挑出来,只要有足够多人,花足够长时间筛选,人们会挑出来越来越多的有意思的云,这会提高找到土狗白云的概率,即提高先验概率p;2、
**多模式效应** ,人们不会把白云的模式仅仅限于土狗,白马、大象、飞机、黄山的迎客松都可以,这会提高参数n,因为我们生活中的物品实在太多了。
在这两种机制的持续作用下,神迹最终发生了( _ 其实是被发现了 _ ),此外,由于互联网的发展, ** 每个人都可以透过别人的视角发现神迹 **
,先验概率p会变得很大,这会导致神迹一下子变得十分普遍、过剩。所以,只要你打开朋友圈、打开门户网站,四处都是神奇的事情。
**神迹的局限性**
记得以前在上计量经济学课程的时候,朱家祥老师一脸严肃的告诉我们这门学科的局限,
> 你只要用力地抽打你的数据,他总会开口的。
所以,神迹最大的缺陷在于,它是历史的,不是未来的,往往不可指定重现。避免筛选效应,我们需要抛开历史包袱;避免多模式效应,我们需要事先指定一种模式。
对神棍最有效的回击就是,
> 给你一天时间,再弄出( _实际是找出_ )一朵土狗云试试?
**历史规律的贫瘠**
现代人( _尤其是神秘的东方_ )并不怎么相信神灵的存在,所以,除了把神迹应用于神秘学之外,人们更多地把他应用于 **预测** 上,言必称历史规律。
坦率地说,在历史的长空中,寻找一片与我们当下有点相像的云是没有什么难度的,即便找到了也没什么好兴奋的。因为我们摆脱不了两个指控,
**1、寻找的历史跨度太长;2、相似点事先模糊,而非指定。** 也就是说,筛选效应和多模式效应都没能过滤掉。
我经常会听到这样的论调,今年的市场走势多么像哪一年。言下之意就是,我们可以按照那一年的历史走势预测未来。如果你表示不信,他们会把历史上两次走势一致的图形甩你脸上。
根据我们前面的讨论,只要数据足够多,相似点足够模糊,你总归会找到两片相似的历史云,但是,这说明不了任何问题。
关于历史规律的问题,我很欣赏马克-吐温的 ** 鸡贼 ** ,
> 历史不会重复自己,但会押着相同的韵脚。
也就是说,所谓的历史规律( _ 某种相似性 _ )往往没有什么卵用,只是看起来好玩罢了。
> 因为在你抽打历史的时候,他没办法为自己辩护。
>
> ——土狗按
**如何面对神迹洪流**
对于形形色色的故事、神迹以及历史规律,我们应该保持足够的淡定,把他当成一种 ** 乐趣 **
,而非指导行为的方向。或者,我们应该在内心保持一份睿智,这些神迹是否能通过筛选效应和多模式效应的检验?
纳西姆-塔勒布是个话痨,说不出王尔德那种优美的句式,但是关于这一点他有一句话说的不错,
> ** 存活者偏差取决于母群体的原始大小 **
> 。如果不知道曾有多少经理人尝试过且失败,我们没办法评估绩效记录的有效性。要是原始群体只有10个经理人,那么,我会毫不犹豫地把一半积蓄交给表现优异者。
> ** 如果原始群体有一万名经理人,我会对他们的操作成果视而不见。 **
避免被愚弄的办法也很简单,承认一些事情只是随机事件的结果,这些事件的结果无法解释,也不需要解释。
**更加深入的讨论**
对于历史数据,即便我们能逃过 筛选效应和多模式效应的检验,我们还将面临经济学家罗伯特-卢卡斯的一个悖论式的挑战,
> 如果人是有理性的动物,那么理性会引导他们从过去整理出可以预测的形态,并且 **有所对付** 。
这句话的意思是,被历史数据证明有效的预测方法,往往会因为人们的套利行为而失效。于是,关于人类的历史数据,我们可以有两种似乎等价的说法,1、有效的预测形态会持续到人们发现它;2、人们无法通过利用历史数据进行有效的预测。
综上所述,对于人类创造的历史数据,我们只能保持足够的警惕和谨慎,不要贸贸然地下结论,坑实在是太多了。
End
![](https://mmbiz.qpic.cn/mmbiz_png/R9krbX73kFvZne9KoMia5BGYpsicGD7mrhIvUznOpphpU914ZiamsyGEU67T1xSpnnr0OMrNK9TTzsibibeBkZOu8fA/640?wx_fmt=png)
预览时标签不可点
微信扫一扫
关注该公众号
****
****
× 分析
收藏