2007年12月5日星期三

因果

很多时候回头看,发现过去充满因果关联。但用这个因果来推断过去,多半还是错。这是我们无法避免的思维方式。因果,这两个字的时态,或许本来只是过去完成时而已。

最 近在用artifical neural network模拟physical model,做的越多,越是觉得很哲学。ANN的运算,是基于我们人对于事物的认知方式,先有一个初始的weight和bias,输入第一批数据,根据几 层的计算得到一个预测值,将它与目标值对比,得到误差项。根据不同的算法比如back-propagation,将这个误差返回,逐步修正初始的 weight和bias,然后代入第二批数据……

以上的过程,叫做training。

training容易出现几个问 题,一个是不足,一个是over-fit。套用我们的生活经验,前者是经验不足,后者是被生活过度摧残。前者的表现是,training结果很垃圾,连已 有的数据关系都无法计算出来,后者的表现是,现有的数据被完美地建立了关联,但是一旦出现新的数据,误差非常大。出现这样问题的模型,是毫无意义必须修正 的,而出现这两种问题的人,只会被生活淘汰到第二第三以及第N梯队。

解决模型的这个问题,通常有几个途径,比如选择合适且充足的 training data,能够cover所有的频段和值域,这样新的validation data再怎么出,也在这个训练范围之内,同时有一个非常复杂的网络,灵活多变到极致。这样出来的网络,好像是一个经验丰富的老人,受了足够的教育,有足 够多的挫折和失败,从而对生活尽在掌控。另外一种方法是,事先对ANN的内部构造有一定的了解,建立与可能的结构相似的结构,这样训练多快好省。我们身边 有这样的人,对事情的判断方式评估方式非常好,能够很快地接近答案,这样的网络,我们叫做grey box model,这样的人,往往都很聪明。

当 数据不足的时候,第一个方法就不能起到作用了,好比年轻人,事业的开始很重要,但是没有经验的人,走弯路是再正常不过的事情了,怎么可能仅仅靠几年的经验 就能够得到对社会正确的认识呢?如果还加上不愿意学习,思维方式僵化,那就基本上应该直接烧香了——倘若老天爷赏饭吃,那是最好,不然,就等着被生活的浪 花打得头晕眼花吧。

数据不足的时候,对系统内部情况进行分析后,仍然可以通过有限的数据,得到不差的模型。身边有这样的朋友,通过看书学 习,通过分析研究,思想和社会很合拍,能够最有效地修正观念的偏差,凡事都能抓住了关键,出现新情况也能够有正确的应对,因而不断成功。就好像一个好的 ANN的模型,能够得出和物理模型一样的结论,但是没有那么复杂构造的问题,运算的也要快很多。

可是,再完美的模型,都有范围,而总有那么一些数据,它们就是不在范围之内。新的学习又得开始,永远没有结束。

当 我们穷尽一生,经历风雨和挫折之后,或许会发现一些人生道理,但是,除了个别可以为他人借鉴,很多已经不再与时俱进。人的存在因此很悲凉,一个新的生命开 始的时候,它又必须重新开始,重新接受挫折和磨难,我们无法替将来的人避免什么磨难,我们甚至无法替自己做好足够的打算。

基于历史数据无法预知将来,想到金融里的有效市场假说,至少这个证明了,这个社会里,weak form的EMH是成立的吧……