听课随想:只要多想一想
昨天,Peter Ritchken课上不经意间讲到一个例子:
当年在南非读统计的时候,Peter的导师让他调查学校中抽大麻学生的百分比。而调查的方法采用的是面对面的interview。
在南非,抽大麻是非法的,但是据估计整个国家抽食人口在80%以上,这也就意味着Peter的interview方法不可能会成功——没人知道他是不是便衣警察。
在失败了好几天之后,Peter用了一个简单方法统计出了这个数据:
掷骰子
被调查者在调查前将要掷一个骰子,而结果只有被调查者知道,Peter不会知道。如果结果是1、2、3,被调查者答应不论被问到什么问题都回答”Yes”,如果结果是4、5、6被调查者答应据实回答。
假设被调查者回答了Yes,由于Peter不可能知道其是出于哪种情况作出的回答,也就无法判别被调查者是真的抽大麻,还是掷了1、2、3;也就避免了被调查者的担心。
这很容易算,假设最终有90%的人回答了Yes。
令A事件为“被调查者回答yes”,B事件为“投掷结果为4、5、6”
我们关心的是在投掷结果为456的情况下,被调查者回答Yes的概率,P(A|B)——也就是有效样本中真正抽食大麻人的频率。
P(A)=P(A|B)*P(B)+P(A|非B)*P(非B)
得出P(A|B)={P(A)-P(A|非B)*P(非B)}/P(B)
={0.9-1*0.5}/0.5
=80%
我不关心你作为一个“个人”抽不抽大麻;我只关心你作为一个“统计人”抽不抽大麻
而如果让我去设计这么一个实验,我感觉就远远没有那么简单了。
反过来解释一种方法总是比设计一种方法简单。我想,其中最主要的原因是:
在解释一种方法时,我们需要的只是关于该方法的知识,而知识相对是容易检索和掌握的。
而在设计一种方法时,我们不仅需要新的知识,更重要的是我们要知道需要的是什么样的知识——往往是需要从自己掌握了的技能中找到合适的。
反向检索永远比正向检索难,这就好比吃到一种水果去查这种水果的名字比知道水果的名字去查该水果味道难,听到一首歌的旋律去查歌名比知道歌名去了解这首歌的旋律难。
最大的体会是:凡事多想一想多记一记,最终都是会有好处的。
Recent Comments