02概率的运作TheWsofProbability
除了主观的、客观的和频率的理解方法,还有其他理解概率的视角。例如,一定要坚持将一个概率对应于某一个数字吗?我们是否可以说一个概率更大,或者一件事情的可信度比另外一件事情更高?我们真的必须提出一组公理——不言而喻的事实——并据此建立一套理论?
许多杰出的作者都认为建立两个独立的理解概率的方法是有用的,一个是可信度,另一个是古典概率。两者应该具有相同的逻辑规律,不自相矛盾,但两者对于概率是如何生成的和被理解的可以不同。任何理论都应该与古典观点一致,基于可重复实验都会给出等可能的结果,所以我们将着眼于这些案例,寻找概率必须遵循的规则。
加法定理
从洗好的牌堆里面取一张牌。我们认为抽到所有牌都是等可能的,所以求出任何事件的概率——例如抽到梅花、黑桃或者A——就是计算这些事件占总事件的比例。我们如何求出两个事件之中的每一个发生的概率呢?
如果两个事件的所有可能结果中没有任何相同,我们称这两个事件是相互排斥(mutuallyexclusive)或者不相容(disjoint)的。“抽到黑桃”和“抽到梅花”这两个事件是不相容的,但是“抽到黑桃”和“抽到A”这两个事件不是,因为“抽到黑桃A”同时属于这两个事件。当两个事件互斥,这两个事件中任何一个发生的结果总数就是其分别发生的结果数之和,所以我们有一个简单的结论:
当两个事件互斥时,至少一个事件发生的概率是两个事件各自发生概率的和。
这就是概率的加法定理(theAdditionalLaw)。它显然适用于所有我们能够以古典视角观察的试验:用袋子中的球作类比,这个定理可以被理解为抽中红或蓝球的结果总数是红球的总数和蓝球的总数之和。而且在任何可重复试验中——例如掷色子或者旋转轮盘赌轮——两个不相交事件的频率和一定是至少一个事件发生的频率。所以加法定理从频率角度看也成立。
一个持主观视角的人也能接受这个定理。否则,存在两个互斥事件,称为A和B,加法定理对它们不成立。这种情况下,主观主义者会面临三个赌局:一个赌事件A发生,一个赌事件B发生,一个赌事件A和B至少一个发生。而对他来说每个赌局都是公平的,他会接受,但他如果参与全部三个赌局,则必定会输钱。加法定理就禁止了这样的矛盾。
加法定理可以拓展到包含大量事件的集合中,前提是这些事件中任意两个都没有相同的结果——它们是两两不相交的(pairwisedisjoint)。即使一个事件包含了1000000种不同的结果,其发生的概率也仅仅是每种结果单独的概率的和。但是假设结果的个数不再有限,例如连续掷一枚硬币直到正面出现时掷硬币的次数。
这个试验可能的结果组成一个无限长的表{1,2,3,4,…},表中的每一个数值都对应着其非零的概率。正面出现时掷硬币次数为偶数的概率是多少?在{2,4,6,8,…}中的结果会让这个事件发生。我们能通过计算其概率和来计算这个事件的概率吗?
数学上这个加法计算没有很大困难,但这个操作已经超出了古典概型的范围,古典概型只能处理有限多个可能的结果。这种无限长的表中的事件概率的加法定理是不是概率在起作用,人们对此还没有达成共识。有利于将其包括到概率的范畴的是:我们也许可以得到更多种类事件的概率。不利于将其包括到概率的范畴的是:对这个事件的概率计算不是古典理论的一部分,我们需要在计算中小心会带来陷阱的步骤。这个问题没有正确或者错误的答案。
我是一个实用主义者,我满意于加法定理这样的拓展应用,而且我从没有对这样拓展带来的结果失望过。这种态度是大学中讲授这门学科的大多数教材中给出的标准诠释。但是德·菲内蒂从谨慎的角度建议避免进行这种拓展,有一部分人也这样认为。
乘法定理
掷一枚普通的硬币,你会预期猜对正面或者反面的次数是总次数的一半。洗牌之后预测牌堆顶的牌是红色或者黑色,你也会估计猜对的次数是总次数的一半。当你同时猜测掷硬币的结果和牌堆顶牌的颜色,有多大可能两个都正确?
假设做这种双重试验100次。预期你大约50次猜对掷硬币的结果,当你猜对之后,预期你继续在一半的次数中猜对牌的颜色。这意味着你大约有25次两个都猜对,看起来得到了25%或者14作为两个都猜对的概率。对这样的试验来说,两个都正确的概率就是将两个事件单独成立的概率相乘。
10个大小和材质均相同的球被标有数字0到9,它们中的任何一个被抽中都是完全随机的。所以球上写着较小数字(0~4)或者较大数字(5~9)是等可能的。其中5个数字用绿色写成,另外5个用蓝色写成,所以绿色和蓝色也是等可能的。我们猜颜色或猜数字较小还是较大都分别有50%的概率。那么球上既标有较小数字又是绿色数字的概率是多少?
前文关于硬币和扑克牌的论断意味着答案是14,但是想一会儿你就能发现这不对。在有10个球的情况下,不可能其中的14(2。5个)是较小的绿色数字!正确的答案取决于哪一些数字是绿色的,哪一些数字是蓝色的。不妨假设1至5是绿色,其余是蓝色。
这种情况下,10个数字里面有4个(1、2、3和4)是较小的绿色数字,所以前述事件的概率是0。4。但就像我们处理第一个问题时一样,我们也可以使用两步走的过程:100次重复试验中,我们预期得到较小数字50次。5个里面有4个较小数字是绿色的,所以在我们得到较小数字的情况下,我们预测绿色次数占45。总体上讲,我们预期得到较小的绿色数字40次,再次指向了0。4这一答案。
在硬币和扑克牌的问题中,掷硬币的结果对扑克牌的结果没有影响。我们不会因为得知了硬币掷出正面就改变头脑中抽到红色牌的概率——在给定第一个事件发生的条件下,另一个事件的条件概率(alprobability)就是它的正常的概率。如果这成立,这两个事件被称为是独立的(i),两个事件同时发生的概率就是两个事件单独发生的概率的乘积。
对于10个球的问题,两个事件同时发生的概率也作为乘积出现,其中第一个乘数是一个事件(较小数字)的概率,而第二个乘数是得到较小数字时得到绿色数字的条件概率。所以两个计算在形式上是相同的,唯一的不同就是第一个事件的结果会否影响第二个事件。这两个计算中,我们都用到了概率的乘法定理(theMultipliLaw):
两个事件同时发生的概率就是第一个事件发生的概率与第一个事件发生时第二个事件发生的概率的乘积。
独立性
我们用“独立的”这个术语来描述一种情况:第一个事件的发生并不影响我们对第二个事件概率的评估。假设这是成立的。但假如我们知道了第二个事件已经发生,这可能影响我们对第一个事件概率的评估吗?
不会。一个事件的发生与否不会影响另一个事件发生的概率,第二个事件是否发生也并不会影响第一个事件的概率。当两个事件中任何一个发生与否均不会对另一个事件的概率产生影响时,这两个事件是独立的。要计算两个事件同时发生的概率,就将它们各自的概率相乘。
彼此不相互影响的事无疑是独立事件,例如突尼斯今天下雨和巴黎新生儿的性别。但有时独立性并不明显。使用一个公正的普通色子,考虑事件“得到偶数”和“得到3的倍数”,它们的概率分别是12和13。只有得到6的时候两个事件同时发生,概率是16。因为12和13相乘等于16,这两个事件是独立的。得到偶数的概率并不会在我们得知是否得到3的倍数之后改变(反之亦然)。
现在,当你有一个8面色子或者10面色子的时候,考虑相同的问题,色子的每个面都分别被标记了1~8或者1~10。再进行相应的算术过程:你会发现在其中一种情况下两个事件是独立的,但是在另一种情况下不是。判断独立性时,直觉是有用的,但是并不总是足够的。
在两个因素并不独立的时候假设它们是独立的,是评估概率过程中最常犯的错误。假设在一所大学的研究生院中一半的学生是女生,并且15的学生学习工程学科。随机选择一个学生:这个学生是女生的概率会被认为是12,这个学生学习工程的概率会被认为是15。然而你会发现这个学生是个女工程师的概率远远小于这两个值的乘积——110。
具有重叠的事件