概率为0的事一定不会发生吗 ?
概率为1的事就一定会发生吗 ?
现实思维
如果有人突然让你给出一个关于概率的例子,你会举出什么样的例子呢 ?
要是我的话,大概会用六个面的骰子,或者两个面的硬币来讲 1⁄6 和 1⁄2 的概率。
当然啦,也可以用有20种结果的轮盘(Roulette)来举例。
为什么我们第一时间想到的都是这样的例子呢 ?
或者说,这些例子有什么共同点,让我们觉得它们容易作为例子呢 ?
我觉得,这是因为它们可能产生的结果有限,这几个系统的可能结果数量确实不多。
古典概型
巧的是,概率在历史上最早被定义时,也是基于这样的只产生有限个结果的系统。
在古典概型种,人们把可能结果所组成的集合称作概率空间(Sample Space),然后通过计算感兴趣的结果在空间中的比例,来定义和计算概率。
大概因为人能够同时思考的事不多,我们都喜欢跟有限数量(最好还是数量小)的事物打交道。
古代的人们把一天分成24个时辰。而随着科技的进步,现在的电子手表能精确到有限位数的毫秒。
无限
但并不是所有的事物都是有限的,我猜,古人大概在研究圆周率时,也意识到了无限这个概念。
比如,为了计算圆的面积,人们会把圆分成尽可能多的三角形,然后计算三角形面积的总和。
人们大概也意识到,这样做是不可能真正计算出圆的面积的,因为人无法无数个在圆上表示无数个三角形,现在的计算机也不行。无法被人类精确的PI值,也许代表着人类认知的局限,或者说人类目前的数学框架的局限,也可能我们的宇宙就是这样吧。
这大概为之后人们所发明的,用来表示和处理无限的工具,比如微积分和极限,打下了铺垫。
无限个可能
先回到概率的话题上,假设我们有一个机器,能从0和1间随机生成一个数。
用古典概型的思维分析,对于一个具体的数,比如0.5,获得它的概率是多少呢 ?
Hmmm, 既然0和1之间有无数个数,那么这个概率应该很小吧。0.00000001 么 ?
答案是0,对任何一个数都是0。
为什么呢 ?
因为0.5只是无数个可能性之一,按照当下对极限的定义和计算,当N无限趋近于∞时,1/n = 0
一丁点可能
仔细想象一下,如果我们运行这个机器,我们将到了一个数 X。
但我们分析时不是说,得到任意一个数(包括X)的概率是0吗,但你看,我们刚刚确实得到了X呀。难道我们 “得到X” 的概率不该是大于零的吗,哪怕很小 ?注意,这里我们这样思考时,只用了主观的直觉,而没有任何逻辑依据。
有逻辑的思考应该是,按照极限的计算,0和1间有无数个数,得到任意一个数的概率被计算为0。
也就是说,这种情形下,只知道一件事的概率为0,不能推断出它不可能发生。
另一个零
等一下,如果我问你,抛掷一个日常的6面骰子,数字7朝上的概率是多少?
回答也是0。
为什么呢 ?
因为数字7就不在概率空间里。具体来说,7不是所有(那6个)可能性中的任何一个。
也就是说,这里的零概率意味着一件事不可能发生。
不同的零
咦,同样是零概率,在表述不同的系统时,所表示的还有点不一样嘛。
你大概也已经注意到这其中的原因了,这取决于概率空间包含的结果是有限的还是无限的。
我们也可以从概率的公理来想这个问题。第二条公理说,所有可能性的概率总和为1。
当一个系统/过程可能发生的结果有限时,我们可以给每个结果分配具体的概率值,像分析骰子硬币那样。
当它有无限种可能发生的结果时,如果单个结果的概率不为零,它们的总和将是无穷大∞,而违背公理2。因此,单个可能事件的概率只能被定义为0。
壹呢
我们意识到零概率在不同系统中的含义时,我们大概也会去思考概率为壹(1)的情况。
假设我们将1个(比如0.5)或几个数(比如0.5,0.6)从那个生成随机数的机器中移除。
那么“生成一个0和1间的随机数”的总概率还是1吗 ?
是的。哪怕我们从中移除掉1亿个数,仍剩下无穷个可能的数,它们的总概率仍然是1。这是基于我们目前对无穷大的定义。
那么“它生成一个0和1间任意一个非0.5的数”的总概率是多少呢 ?
仍然是1。尽管它仍然有(一丁点的)可能将生成0.5,这时我们所讨论的事就没有发生。
也就是说,当概率空间有无数个结果时,仅从概率为1无法推断出一件事一定发生。
零壹之间
讨论完0和1,你也许会想,对于这样的概率空间,人们常常会怎样计算概率呢 ?
这里我们倒不如先思考下,如何看待包含无数结果的概率空间。
概率密度与质量
你可以把一个拥有无限个结果的概率空间,想像成一片区域,其中有无数个小点。
跟物理里的质点很像,概率空间的小点也并没有任何维度,不占任何空间体积,也没有质量。
而点的概率为0,却表示可能发生的结果。
再想想这个空间里那些连点都没有的区域 (不可能发生的事所组成),这些区域的’概率’也是0,同样不占体积,也没有质量诶。
Hmmm, 那么概率空间某处存在一个点或者不存在,又有什么区别呢 ?
历史上有过同样思考的人发明了这个概念:概率密度 - Probability Density。当然啦,为了与物理的密度对应,他们也发明了概率质量 - Probability Mass。
我们可以这样看待概率空间,代表可能结果的点存在概率密度,因为体积为0,概率质量也为零。而代表不可能发生事件的区域(或点)是没有概率密度的。
单个或若干个可能事件组成区域的概率质量也就是他们发生的概率的总和。
概率的积分
包含无数个可能性的概率空间,可以被看作是连续的区域。如果区域是一个二维平面,计算某概率空间中某区域中事件发生的概率就等于 区域的面积 x 密度。如果是三维的,则概率相当于体积 x 密度。
要注意的是,我们这里说的是概率质量。而物理中常讨论的平面,因为高为0,质量并不存在。
至于怎么计算面积和体积呢,可以根据形状使用已知公式。对于不规则形状的概率空间,则可以使用定积分。但这篇文章的目的不是介绍积分运算,所以我想之后有时间再补上用积分计算概率空间大小(比如面积或体积)的例子。
总结
要分析讨论某个事件的概率,应该先去了解它所在的概率空间,它是有限的还是无限的。
如果我们讨论的概率空间包含有限个结果,0概率意味着事件一定不发生,概率为1意味着事件一定发生。
对于一个包含无限个结果的概率空间,0概率不意味着事件不可能发生,概率为1也不能意味着事件一定发生。
人们把概率值与物理学中质量类比,还发明了概率密度,它存在于概率空间中可能发生事件的点上。而计算概率也被可视化成了计算面积或者体积。对于不规则形状的空间,我们常会用到微积分知识。
最后,不论概率空间的可能性数量是否有限,必定发生的事件概率一定为1,必定不发生的事件的概率一定是0。