在详细讨论之前,我先问大家一个问题:在你看来,一个调查了10万人的民意测验,和一个调查了1000人的民意测验,哪个结果更可信?根据你对这个问题的回答,我可以判断出你对民意测验的了解程度。如果你答:那肯定是10万人的民意测验更可信吧?那我就可以确定地知道:你对民意测验知之甚少。
正确答案是:在不解释抽样方法前,这个问题没法回答;如果采取了错误的抽样方法,那10万人的民意测验,也可能无法反映正确的民意;而如果采取了科学抽样方法,1000人的抽样,就足以对中国13亿人口进行一个质量非常不错的民意测验了。当然,在这之前,我们恐怕先要解释:为何在判断民意时,要进行“抽样调查”,而不太可能是“普查”。
假使今天我们要想理解13亿人的民意,那最“正确”的方法应该是对13亿人普查。问题是这样的成本无疑是巨大的,13亿次的访问以目前的技术条件来说不可能瞬间同时举行,就算不需要瞬时,也要耗费巨额的费用(想一想为何无论是中国还是美国,人口普查都只能十年来一次)。所以,需要考虑的是,如何在成本-效果之间得到一个可靠的平衡:花费要不算很大,而得到的结果又足够反映民意,这就是为什么要进行抽样调查。
既然要抽样,就会产生和总体的偏差:问1000人的意见,可能会无法代表13亿人的想法。我们要做的,就是在成本范围内,尽量缩小这个误差,这就需要用到科学的抽样方法。那哪些是科学的抽样方法呢?我们可以先排除掉不科学的抽样,其中有一些是我们日常读新闻时经常能看到的。比如,类似那个所谓“终身阿森纳球迷”(AFC4LIFE的意思是Arsenal FC For Life)网站的调查,就几乎可以肯定是在耍流氓。