Chapter 1-2¶
约 3092 个字 预计阅读时间 10 分钟
Knowledge¶
-
「事件」:如果事件
和事件 的交 ,那么称 和 互不相容。 -
「卡塔兰数」:Catalan 数列
可以应用于以下问题:- 有
个人排成一行进入剧场。入场费 5 元。其中只有 个人有一张 5 元钞票,另外 人只有 10 元钞票,剧院无其它钞票,问有多少种方法使得只要有 10 元的人买票,售票处就有 5 元的钞票找零? - 有一个大小为
的方格图左下角为 右上角为 ,从左下角开始每次都只能向右或者向上走一单位,不走到对角线 上方(但可以触碰)的情况下到达右上角有多少可能的路径? - 一个栈(无穷大)的进栈序列为
有多少个不同的出栈序列? - 由
个 和 个 组成的 个数 ,其部分和满足 ,有多少个满足条件的数列?
卡特兰数的递推式为
,其中 ,该递推关系的解为:关于 Catalan 数的常见公式:
- 有
-
「一维 Borel 点集」:记
为直线或实数全体,并称由一切形为 的有界左闭右开区间构成的集类所产生的 域为一维博雷尔 域,记之为 ,称 中的集为一维博雷尔点集。若 为任意实数,由于因此,
中包含一切开区间、闭区间、单个实数、可列个实数,以及由它们经过可列次逆并、交运算而得出的集合。这是相当大的一个集类,足够把实际问题中感兴趣的点集都包括在内。若不从左闭右开区间 出发,而从 或 ,或 ,甚至 出发,都将产生同一个 域,这里的一部分证明在下面的 Exercise Chapter 1 里。 -
「
维博雷尔点集」 以 记 维欧几里得空间,可以类似地定义 n 维博雷尔点集,它们是由一切 维矩形产生的 维博雷尔 域 中的集合,也可以把 中我们感兴趣的点集都包括在内。 -
「公理化概率定义」:定义在事件域
上的一个集合函数 称为概率,如果它满足如下三个要求:- 非负性:
, 对一切 ; - 规范性:
; -
可数可加性:若
, 且两两互不相容, 则
- 非负性:
-
「概率计算公式小结」(独立与互斥情况省略):
- 加法公式:
- 一般加法公式:
- 事件概率等式:
- 减法公式:
- 乘法公式:
- 乘法公式推广:
- 一般乘法公式:
- 全概率公式:
- 贝叶斯公式:
- 加法公式:
-
「伯努利实验」:我们将事件域取为
,这种只有两个可能结果的实验称为伯努利试验,在伯努利试验中,首先是要给出下面概率: , ,显然 , 且 。现在考虑重复进行 次独立的伯努利试验,这里的“重复”是指在每次试验中事件 ,从而事件 出现的概率都保持不变。这种试验称为 重伯努利试验,记作 。总之, 重伯努利试验有下面四个约定:- 每次试验至多出现两个可能结果之一:
或 ; 在每次试验中出现的概率 保持不变;- 各次试验相互独立;
- 共进行
次试验。
下面先给出
重伯努利试验的概率空间: 重伯努利试验 的样本点形如: ,其中 是 或 ,分别表示第 次试验中出现 或 ,显然这种样本点共有 个,这是一个有限样本空间。样本点也可以简记为 。例如, 表示前 次试验均出现事件 ,而第 次试验出现事件 ,简记为 。为了给定样本点
的概率,主要看其中 出现的次数。例如其中有 个 ,从而有 个 ,则利用试验的独立性则有一般事件的概率由它所含样本点的概率求和得到,这样一来,我们就已经对
重伯努利实验给定了概率空间。我们有时候也需要考虑可列重伯努利试验 ,这时样本空间不再有限,甚至不再可列,事实上这可以形成一个与 的一一对应,这种情况就不能将样本空间的任意子集都看作事件(测度论告诉我们的)。 - 每次试验至多出现两个可能结果之一:
-
「二项分布」:我们来确定
重伯努利试验中事件 出现 次的概率,这概率我们记之为 。若以 记 重伯努利试验中事件 正好出现 次这一事件,而以 表示第 次试验中出现事件 ,以 表示第 次试验中出现 ,则右边的每一项表示某
次试验中出现事件 ,在另外 次试验中出现 ,这种项共有 个,而且两两互不相容。由伯努利试验的每个样本点的概率可知 ,即注意到
, ,是二项式 展开式中 项的系数,因此称该分布为二项分布。 也是很容易检验的。特别地,我们将两点分布称为伯努利分布。 -
「几何分布」:现在讨论在伯努利试验中首次成功出现在第
次试验的概率,要使首次成功出现在第 次试验,必须而且只需在前 次试验中都出现事件 ,而第 次试验出现 ,因此这事件(记为 )可表示为利用试验的独立性,其概率为
记
, , 是几何级数的一般项,因此称为几何分布。 也是很容易验证的,这里省略证明。 -
「帕斯卡分布」:考虑伯努利试验,让我们考察要多长时间才会出现第
次成功:若第 次成功发生在第 次试验,则必然有 。让我们以
表示第 次成功发生在第 次试验这一事件,并以 记其概率, 发生当且仅当前面的 次试验中有 次成功、 次失败,而第 次试验的结果为成功,这两个事件的概率分别为 与 ,于是利用试验的独立性,得到:即
注意到
这里利用了推广的二项系数公式
和牛顿二项式 ; 称为帕斯卡分布。特别当 时,我们得到几何分布。 -
「泊松分布」:历史上,泊松分布来自于对二项分布的近似,其核心是下面的定理:在独立试验中,以
代表事件 在试验中出现的概率,它与试验总数 有关,如果 ,则当 时,Proof
记
,则由于对固定的
有以及
因此
这就完成了证明,并且有
我们将
称为泊松分布, 称为它的参数。 -
「泊松过程」:以接电话举例,泊松过程具有下面性质,且具有下面性质的一定是泊松过程:
-
平稳性:在
中来到的呼叫数只与时间间隔长度 有关而与时间起点 无关。若以 记在长度为 的时间区间中来到 个呼叫的概率,当然 对任何 成立。过程的平稳性表示了它的概率规律不随时间的推移而改变。
-
独立增量性(无后效性) 在
内来到 个呼叫这一事件与时刻 以前发生的事件独立。换言之,在对时刻 以前的事件发生情况所作的任何假定之下,计算出来的在 内发生 个呼叫的条件概率都等于同一事件的无条件概率。独立增量性表明在互不相交的时间区间内过程进行的相互独立性。 -
普通性 在充分小的时间间隔中,最多来到一个呼叫。即,若记
应有
,即普通性表明,在同一时间间隔内来两个或两个以上呼叫实际上是不可能的。
-
Chapter 1 Exercises¶
- 从装有号码
的球的箱子中有放回地摸了 次球,依次记下其号码,试求这些号码按严格上升次序排列的概率。 - 在上题中,这些号码按上升(不一定严格)次序排列的概率。
-
任意从数列
中不放回地取出 个数并按大小排列成 ,求 的概率。Answer
考虑
之下有几个小于 ,几个大于 就可以了。 -
在上题中,若采用有放回取数,这时
,求 的概率。Answer
其实是一个多项分布:从
中有放回地取 个数,这 个数可分为 3 类:小于 ,等于 ,大于 。以 记取到小于 的数的次数,以 记取到大于 的数的次数,则取到等于 的次数为 。在固定
的条件下,取到 个小于 的数, 个 , 个大于 的数的概率为:易见
可取 , 可取 ,于是所求概率为: -
利用概率论的想法证明下列恒等式:
其中
都是正整数,且 。Answer
设袋中有
只球,其中有 只是白球,其余为黑球。现不放回地从袋中逐个取球,则第 次才首次取得白球的概率为因为袋中只有
只白球,其余为黑球,所以第 1 次或第 2 次⋯⋯或至少到第 次必取得白球,因此必有即
等式两边同乘以
得 -
某班有
个士兵,每人各有一支枪,这些枪外形完全一样,在一次夜间紧急集合中,若每人随机地取走一支枪,问恰好有 个人拿到自己的枪的概率。Answer
在
个士兵中任意选出 个士兵来有 种选法。一组指定的
个士兵都拿到自己的枪的概率为为了求剩下的
个士兵都没有拿到自己的枪的概率,我们需要求其均拿到了自己的枪的概率:我们求一般情况下的,若一共有 个士兵,设 ,则由容斥原理得,“至少有一个士兵拿到自己的枪”的概率为
所以,一个士兵都没有拿到自己的枪的概率为
于是,恰好有
个士兵拿到自己枪的概率为 -
考试时一共有
个签, 个学生有放回抽签,在全抽完之后至少有一张考签没有被抽到的概率为多少?Answer
还是容斥原理,设
,则 -
证明
域的交仍然是 域。Answer
设
是 域,记 。(i)
, ,所以 ,即 ;(ii) 若
,则 , 。由于 是 域,得 , ,所以 ,从而有 ;(iii) 若
, ,则 , 。由于 是 域,所以 , ,即 。所以
是 域。 -
包含一切形为
的区间的最小 域是一维 Borel 域。Answer
一维 Borel
域 是由左闭右开区间类产生的 域,设 是由形如 区间类产生的 域。因为
, 是 域,所以 ,因此有 。又由于
, 是 域,所以 ,因此有 。于是有
-
证明:概率论定义中的三个条件可以使用下面两个条件代替:
(i)
, 对一切 ;(ii) 若
, 两两互不相容,且 则 。Answer
概率定义的三个条件为:
1. 非负性: , 对 ;
2. 规范性: ;
3. 可列可加性:若 , 当 , 则显然 (i) 与 (1) 是等价的。
若
, 两两互不相容,且
则由 (2)(3) 可推出 即 (ii) 成立。反之,当 (ii) 成立,则由
可得
,因此 (2) 成立,再由
可得
,若 , 且两两互不相容,则 由 (ii) 可得
加上前面的结论,得出 所以有 即可列可加性成立。 -
甲有
枚硬币,乙有 枚硬币,投掷后比较,求 的概率。Answer
若记
,由对称性仍有 。但这里
,不过由于 ,故知 ,又故
由
得
Chapter 2 Exercises¶
-
设一个家庭中有
个小孩的概率为这里
, ,若认为生一个小孩为男孩或女孩是等可能的,求证一个家庭有 个男孩的概率为 。Answer
设
, 。由于假定生男孩或生女孩是等可能的,所以有 ,由全概率公式得这里用到了一个小技巧:一般组合数有下面公式
换成更容易记忆的形式:
这个公式嘎嘎有用,需要记忆。
-
对称随机游走:甲、乙均有
个硬币,全部掷完后分别计算掷出的正面数,试求两人掷出的正面数相等的概率。Answer
利用二项分布,得
-
帕斯卡分布视角下的分赌注问题:甲、乙两个赌徒按某种方式下注赌博,设甲在每局中取胜的概率为
,他们说定先胜 局者将赢得全部赌注,但进行到甲胜 局,乙胜 局( )时,由于不得不中止,试问如何分配这些赌注才公平合理?Answer
以
及 分别记甲及乙为达到最后胜利所须再胜的局数,我们可以把分赌注问题归结为如下概率问题:在伯努利试验中,求在出现 次 之前出现 次 的概率。若以
记上述概率,则它为甲最终取胜的概率,那么赌注以 分配是公平合理的。现在,若利用帕斯卡分布,则容易写出答案或
另外,容易证明,再赌
局一定可以决定胜负。因此甲为取得最终胜利只须而且必须在后续的 局中至少胜 局。这样,利用二项分布可以知道,可以证明这三个答案确实是一致的,但是答案真的太长了。
-
带有吸收壁的随机游走:设质点每隔单位时间分别以概率
和 向正的或负的方向移动一个单位。假定其在时刻 时,位于 ,而在 及 处各有一个吸收壁,我们要求质点 被吸收或在 被吸收的概率。Answer
我们用的是差分方程法。
若以
记质点的初始位置为 而最终在 点被吸收的概率。显然 , 。如果某时刻质点位于
,这里 ,则它要被 吸收,有两种方式来实现:一种是接下去一次移动是向右的而最终被 吸收;另一种是接下去一次移动是向左的而最终被 吸收。所以按全概率公式有这样,我们得到了关于
的一个二阶差分方程,再用边界条件就可以求解。利用这个差分方程系数的特殊性,比较方便的解法是把这个差分方程改写成若记
,则又能写成下面分两种情况求解:
(i).
,即 的场合,也即对称随机游动的场合。这时 ,因此,若记则
由于
,故有特别地
(ii).
,即 的场合这时
从而
由于
,故有因此
特别地
若以
记质点自 出发而在 点被吸收的概率,同样可以列出差分方程及边界条件
类似地可以求得,当
时而在
的场合不管在什么场合,都有