154. 书看得太快不是件好事儿

2006-02-26 07:39:49

下午6点钟,买了两本书。Freakonomics,和Lenin,列宁的传记。最近传记看得不少。发现看的传记有点往回倒推的意思,从当代开始到了20世纪初。差不多了,再往前的,我也没了特别大的兴趣,除非是我特别有兴趣的人。

Freakonomics的书评不错,前一阵子纽约时报的书评上说到过。主要是说Levitt这个比较与众不同的经济学家,分析这个世界,如果你用经济学的原理去分析生活中的许多事儿,会发现很多事情和你脑子里想得不太一样。尤其是如何在众多的数据中,找到一组能够切中要害,说明问题的数据。

比如,怎么判断日本相扑运动是不是相互沟通,存在作弊行为?比如说知道自己铁定晋级的相扑手,是不是会有意让有危险要被降级的对手赢?

这个听上去有些像抓中国足球的黑哨,而且很容易被各种感情因素左右的问题。其实,是可以通过数据分析出的。

Levitt研究了两种不同情况。正常情况,和降级情况。这样的两组对手,在正常情况下,就是说,谁都还不知道自己会升级还是降级的情况下,面临降级危险的相扑手,胜率在40%左右。合理,因为他本来就比较弱。而在降级情况下,也就是他面临降级危险而对手已经铁定晋级的情况下,胜率骤然提高到70%!

当然,需要控制一个因素。就是大家也会说,面临降级危险的相扑手,理所应当地会拼,而对手不会。多些赢面也正常。但是,另一组数据发现,在这次交手之后的下次,他们相遇时,胜率忽然间会骤降到20%,而不是正常的40%。

说明这是个交换的行为。你让我好,我下回也给你好。这是作弊。不是拼命的问题。

这一类的东西,就是这本书的内容。包括,家里有把枪对于小孩危险,还是有个游泳池危险?答案是,游泳池比枪危险100倍。

是一本非常有趣的书,绝对的Page Turner。游泳池和枪的问题其实只是个非常小的perception的问题。书里大多数的问题,都需要好好动脑筋。其后果就是我从7点钟开始到现在,5个小时,看完了这本200来页的书。

读后感就是,这本书其实很容易读。所有用到的统计学知识和原理,从correlation到regression analysis,都是最基础的东西。重要的是,需要养成问问题的习惯。有很多问题都可以问问。

然后,最重要的是,是不是有数据可以用来分析?选择什么样的数据?选择正确的数据和分析的方式,是最重要的。不然,纯粹是做无用功。

很多问题也许问了之后,还是无解,因为没有合适的数据。

不过,互联网是干什么吃的?不就是提供了无数众多的数据吗?分析什么,怎么分析,重要之极。

书里也说,专家的意见未必怎么的。数据,而不是扯淡。逻辑,而不是想当然。

忽然想起,相扑肯定也有赌市的,不知道那些赌客们,以前用过Levitt的分析结果吗?如果没有,在这本书出来后,胜率之间和赔率,会发生什么变化?

应该会很有趣的一组数据。

[@more@]

153. 周六,床上

155. 不唱,我听总可以吧