跳转至

Chapter 1-2

约 3092 个字 预计阅读时间 10 分钟

Knowledge

  • 「事件」:如果事件 A 和事件 B 的交 AB=,那么称 AB 互不相容。

  • 「卡塔兰数」:Catalan 数列 Hn 可以应用于以下问题:

    1. 2n 个人排成一行进入剧场。入场费 5 元。其中只有 n 个人有一张 5 元钞票,另外 n 人只有 10 元钞票,剧院无其它钞票,问有多少种方法使得只要有 10 元的人买票,售票处就有 5 元的钞票找零?
    2. 有一个大小为 n×n 的方格图左下角为 (0,0) 右上角为 (n,n),从左下角开始每次都只能向右或者向上走一单位,不走到对角线 y=x 上方(但可以触碰)的情况下到达右上角有多少可能的路径?
    3. 一个栈(无穷大)的进栈序列为 1,2,3,,n 有多少个不同的出栈序列?
    4. n+1n1 组成的 2n 个数 a1,a2,,a2n,其部分和满足 l=1kal0 (k=1,2,3,,2n),有多少个满足条件的数列?

    卡特兰数的递推式为 Hn=i=0n1HiHni1(n2),其中 H0=1,H1=1,该递推关系的解为:

    Hn=1n+1(2nn)(n2,nN+)

    关于 Catalan 数的常见公式:

    Hn={i=1nHi1Hnin2,nN+1n=0,1
    Hn=Hn1(4n2)n+1
    Hn=(2nn)(2nn1)
  • 「一维 Borel 点集」:记 R1 为直线或实数全体,并称由一切形为 [a,b) 的有界左闭右开区间构成的集类所产生的 σ 域为一维博雷尔 σ,记之为 B1,称 B1 中的集为一维博雷尔点集。若 x,y 为任意实数,由于

    {x}=n=1[x,x+1n)(x,y)=[x,y){x}[x,y]=[x,y)+{y}(x,y]=[x,y]{x}

    因此,B1 中包含一切开区间、闭区间、单个实数、可列个实数,以及由它们经过可列次逆并、交运算而得出的集合。这是相当大的一个集类,足够把实际问题中感兴趣的点集都包括在内。若不从左闭右开区间 [a,b) 出发,而从 (a,b](a,b),或 [a,b],甚至 (,x] 出发,都将产生同一个 σ 域,这里的一部分证明在下面的 Exercise Chapter 1 里。

  • n 维博雷尔点集」Rnn 维欧几里得空间,可以类似地定义 n 维博雷尔点集,它们是由一切 n 维矩形产生的 n 维博雷尔 σ Bn 中的集合,也可以把 Rn 中我们感兴趣的点集都包括在内。

  • 「公理化概率定义」:定义在事件域 F 上的一个集合函数 P 称为概率,如果它满足如下三个要求:

    1. 非负性:P(A)0, 对一切 AF
    2. 规范性:P(Ω)=1
    3. 可数可加性:若 AiF, i=1,2, 且两两互不相容, 则

      (1.5.1)P(i=1Ai)=i=1P(Ai)
  • 「概率计算公式小结」(独立与互斥情况省略):

    • 加法公式:P(AB)=P(A)+P(B)P(AB)
    • 一般加法公式:P(A1A2An)=i=1nP(Ai)1i<jnP(AiAj)++(1)n1P(A1A2An)
    • 事件概率等式:P(A)=1P(A)
    • 减法公式:P(AB)=P(A)P(AB)
    • 乘法公式:P(AB)=P(A)P(B|A)
    • 乘法公式推广:P(A1A2An)=P(A1)P(A2|A1)P(A3|A1A2)P(An|A1A2An1)
    • 一般乘法公式:P(A1A2An)=i=1nP(Ai)1i<jnP(AiAj)++(1)n1P(A1A2An)
    • 全概率公式:P(B)=i=1nP(Ai)P(B|Ai)
    • 贝叶斯公式:P(Ai|B)=P(Ai)P(B|Ai)i=1nP(Ai)P(B|Ai)
  • 「伯努利实验」:我们将事件域取为 F={,A,A,Ω},这种只有两个可能结果的实验称为伯努利试验,在伯努利试验中,首先是要给出下面概率:P(A)=pP(A)=q,显然 p0,q0, 且 p+q=1。现在考虑重复进行 n 次独立的伯努利试验,这里的“重复”是指在每次试验中事件 A,从而事件 A 出现的概率都保持不变。这种试验称为 n 重伯努利试验,记作 En。总之,n 重伯努利试验有下面四个约定:

    1. 每次试验至多出现两个可能结果之一:AA
    2. A 在每次试验中出现的概率 p 保持不变;
    3. 各次试验相互独立;
    4. 共进行 n 次试验。

    下面先给出 n 重伯努利试验的概率空间:n 重伯努利试验 En 的样本点形如:(A1^,A2^,,An^),其中 Ai^AiAi,分别表示第 i 次试验中出现 AA,显然这种样本点共有 2n 个,这是一个有限样本空间。样本点也可以简记为 A1^A2^An^。例如,(A1,A2,,An1,An) 表示前 n1 次试验均出现事件 A,而第 n 次试验出现事件 A,简记为 A1A2An1An

    为了给定样本点 (A1^,A2^,,An^) 的概率,主要看其中 A 出现的次数。例如其中有 lA,从而有 nlA,则利用试验的独立性则有

    P(A1^A2^An^)=P(A1^)P(A2^)P(An^)=plqnl

    一般事件的概率由它所含样本点的概率求和得到,这样一来,我们就已经对 n 重伯努利实验给定了概率空间。我们有时候也需要考虑可列重伯努利试验 E,这时样本空间不再有限,甚至不再可列,事实上这可以形成一个与 [0,1] 的一一对应,这种情况就不能将样本空间的任意子集都看作事件(测度论告诉我们的)。

  • 「二项分布」:我们来确定 n 重伯努利试验中事件 A 出现 k 次的概率,这概率我们记之为 b(k;n,p)。若以 Bkn 重伯努利试验中事件 A 正好出现 k 次这一事件,而以 Ai 表示第 i 次试验中出现事件 A,以 A¯i 表示第 i 次试验中出现 A¯,则

    Bk=A1A2AkA¯k+1A¯n++A¯1A¯2A¯nkAnk+1An

    右边的每一项表示某 k 次试验中出现事件 A,在另外 nk 次试验中出现 A¯,这种项共有 (nk) 个,而且两两互不相容。由伯努利试验的每个样本点的概率可知 P(Bk)=(nk)pkqnk,即

    b(k;n,p)=(nk)pkqnk,k=0,1,2,,n

    注意到 b(k;n,p)k=0,1,2,,n,是二项式 (q+p)n 展开式中 pk 项的系数,因此称该分布为二项分布。k=0nb(k;n,p)=1 也是很容易检验的。特别地,我们将两点分布称为伯努利分布

  • 「几何分布」:现在讨论在伯努利试验中首次成功出现在第 k 次试验的概率,要使首次成功出现在第 k 次试验,必须而且只需在前 k1 次试验中都出现事件 A¯,而第 k 次试验出现 A,因此这事件(记为 Wk)可表示为

    Wk=A¯1A¯2A¯k1Ak

    利用试验的独立性,其概率为

    P(Wk)=P(A¯1)P(A¯2)P(A¯k1)P(Ak)=qk1p

    g(k;p)=qk1pk=1,2,g(k;p) 是几何级数的一般项,因此称为几何分布。k=1g(k;p)=1 也是很容易验证的,这里省略证明。

  • 「帕斯卡分布」:考虑伯努利试验,让我们考察要多长时间才会出现第 r 次成功:若第 r 次成功发生在第 ζ 次试验,则必然有 ζr

    让我们以 Ck 表示第 r 次成功发生在第 k 次试验这一事件,并以 f(k;r,p) 记其概率,Ck 发生当且仅当前面的 k1 次试验中有 r1 次成功、kr 次失败,而第 k 次试验的结果为成功,这两个事件的概率分别为 (k1r1)pr1qkrp,于是利用试验的独立性,得到:

    P(Ck)=(k1r1)pr1qkrp=(k1r1)prqkr

    f(k;r,p)=(k1r1)prqkr,k=r,r+1,

    注意到

    k=rf(k;r,p)=k=r(k1r1)prqkr=l=0(r+l1r1)prql=l=0(r+l1l)prql=l=0(rl)(1)lprql=pr(1q)r=1

    这里利用了推广的二项系数公式 (ak)=(a+k1k)(1)k 和牛顿二项式 (a+b)α=n=1(αn)xαnynf(k;r,p) 称为帕斯卡分布。特别当 r=1 时,我们得到几何分布。

  • 「泊松分布」:历史上,泊松分布来自于对二项分布的近似,其核心是下面的定理:在独立试验中,以 pn 代表事件 A 在试验中出现的概率,它与试验总数 n 有关,如果 npnλ,则当 n 时,

    b(k;n,pn)λkk!eλ
    Proof

    λn=npn,则

    b(k;n,pn)=(nk)pnk(1pn)nk=n(n1)(nk+1)k!(λnn)k(1λnn)nk=λkk!(11n)(12n)(1k1n)(1λnn)nk

    由于对固定的 k

    limnλnk=λk,limn(1λnn)nk=eλ

    以及

    limn(11n)(12n)(1k1n)=1

    因此

    limnb(k;n,pn)=λkk!eλ

    这就完成了证明,并且有

    k=0p(k;λ)=k=0λkk!eλ=eλeλ=1

    我们将 p(k;λ)=λkk!eλ 称为泊松分布λ 称为它的参数。

  • 「泊松过程」:以接电话举例,泊松过程具有下面性质,且具有下面性质的一定是泊松过程:

    1. 平稳性:在 [t0,t0+t) 中来到的呼叫数只与时间间隔长度 t 有关而与时间起点 t0 无关。若以 Pk(t) 记在长度为 t 的时间区间中来到 k 个呼叫的概率,当然 k=0Pk(t)=1 对任何 t>0 成立。

      过程的平稳性表示了它的概率规律不随时间的推移而改变。

    2. 独立增量性(无后效性)[t0,t0+t) 内来到 k 个呼叫这一事件与时刻 t0 以前发生的事件独立。换言之,在对时刻 t0 以前的事件发生情况所作的任何假定之下,计算出来的在 [t0,t0+t) 内发生 k 个呼叫的条件概率都等于同一事件的无条件概率。独立增量性表明在互不相交的时间区间内过程进行的相互独立性。

    3. 普通性 在充分小的时间间隔中,最多来到一个呼叫。即,若记

      ψ(t)=k=2Pk(t)=1P0(t)P1(t)

      应有 ψ(t)=o(t),即

      limt0ψ(t)t=0

      普通性表明,在同一时间间隔内来两个或两个以上呼叫实际上是不可能的。

Chapter 1 Exercises

  1. 从装有号码 1,2,,N 的球的箱子中有放回地摸了 n 次球,依次记下其号码,试求这些号码按严格上升次序排列的概率。
  2. 在上题中,这些号码按上升(不一定严格)次序排列的概率。
  3. 任意从数列 1,2,,N不放回地取出 n 个数并按大小排列成 x1<x2<<xn,求 xm=M 的概率。

    Answer

    考虑 xm=M 之下有几个小于 M,几个大于 M 就可以了。

  4. 在上题中,若采用有放回取数,这时 x1x2xm,求 xm=M 的概率。

    Answer

    其实是一个多项分布:从 1,2,,N 中有放回地取 n 个数,这 n 个数可分为 3 类:小于 M,等于 M,大于 M。以 k1 记取到小于 M 的数的次数,以 k2 记取到大于 M 的数的次数,则取到等于 M 的次数为 nk1k2

    在固定 k1,k2 的条件下,取到 k1 个小于 M 的数,nk1k2Mk2 个大于 M 的数的概率为:

    n!k1!k2!(nk1k2)!(M1)k1(NM)k2Nn

    易见 k1 可取 0,1,2,,m1k2 可取 0,1,2,,nm,于是所求概率为:

    k1=0m1k2=0nmn!k1!k2!(nk1k2)!(M1)k1(NM)k2Nn
  5. 利用概率论的想法证明下列恒等式:

    1+AaA1+(Aa)(A1)(A1)(A2)++(Aa)(A1)21(A1)(A2)(a+1)a=Aa.

    其中 A,a 都是正整数,且 A>a

    Answer

    设袋中有 A 只球,其中有 a 只是白球,其余为黑球。现不放回地从袋中逐个取球,则第 k 次才首次取得白球的概率为

    p1=aA,pk=a(Aa)(Aa1)(Aak+2)A(A1)(A2)(Ak+1),k=2,,Aa+1

    因为袋中只有 a 只白球,其余为黑球,所以第 1 次或第 2 次⋯⋯或至少到第 Aa+1 次必取得白球,因此必有

    1=p1+p2++pAa+1

    1=aA+a(Aa)A(A1)++a(Aa)(A1)21A(A1)(a+1)a

    等式两边同乘以 Aa

    1+AaA1+(Aa)(A1)(A1)(A2)++(Aa)(A1)21(A1)(A2)(a+1)a=Aa
  6. 某班有 N 个士兵,每人各有一支枪,这些枪外形完全一样,在一次夜间紧急集合中,若每人随机地取走一支枪,问恰好有 k (0kN) 个人拿到自己的枪的概率。

    Answer

    N 个士兵中任意选出 k 个士兵来有 (Nk) 种选法。

    一组指定的 k 个士兵都拿到自己的枪的概率为

    1N(N1)(Nk+1)

    为了求剩下的 Nk 个士兵都没有拿到自己的枪的概率,我们需要求其均拿到了自己的枪的概率:我们求一般情况下的,若一共有 N 个士兵,设 Ai={第 i 个士兵拿到自己的枪},i=1,2,,N,则

    P(Ai)=(N1)!N!=1NP(AiAj)=(N2)!N!=1N(N1),ijP(A1A2AN)=1N!

    由容斥原理得,“至少有一个士兵拿到自己的枪”的概率为

    P(A1A2AN)=i=1NP(Ai)1i<jNP(AiAj)++(1)N1P(A1A2AN)=(N1)1N(N2)1N(N1)++(1)N1(NN)1N!=112!++(1)N11N!=k=1N(1)k1k!

    所以,一个士兵都没有拿到自己的枪的概率为

    1l=1Nk(1)l1l!=l=0Nk(1)ll!

    于是,恰好有 k 个士兵拿到自己枪的概率为

    P[k]=(Nk)1N(N1)(Nk+1)l=0Nk(1)ll!
  7. 考试时一共有 N 个签,n (nN) 个学生有放回抽签,在全抽完之后至少有一张考签没有被抽到的概率为多少?

    Answer

    还是容斥原理,设 Ai={第 i 张考签没有被抽到},i=1,2,,N,则

    P({})=P(A1A2AN)=i=1NP(Ai)1i<jNP(AiAj)++(1)N1P(A1A2AN)=i=1N(N1)(N1)nNn(N2)(N2)nNn++(1)N1(NN1)1Nn+0=i=1N1(1)i1(Ni)(Ni)nNn
  8. 证明 σ 域的交仍然是 σ 域。

    Answer

    Ft (tT)σ 域,记 F=tTFt

    (i) tTΩFt,所以 ΩtTFt,即 ΩF

    (ii) 若 AF,则 AFttT。由于 Ftσ 域,得 tTAFt,所以 AtTFt,从而有 AF

    (iii) 若 AiFi=1,2,,则 tTAiFt。由于 Ftσ 域,所以 tTi=1AiFt,即 i=1AitTFt=F

    所以 Fσ 域。

  9. 包含一切形为 (,x) 的区间的最小 σ 域是一维 Borel σ 域。

    Answer

    一维 Borel σB=σ{[a,b)} 是由左闭右开区间类产生的 σ 域,设 B~=σ(,x) 是由形如 (,x) 区间类产生的 σ 域。

    因为 [a,b)=(,b)(,a)Bσ 域,所以 [a,b)B~,因此有 BB~

    又由于 (,x)=n=1[xn,xn+1)Bσ 域,所以 (,x)B,因此有 B~B

    于是有 B~=B

  10. 证明:概率论定义中的三个条件可以使用下面两个条件代替:

    (i) P(A)0, 对一切 AF;

    (ii) 若 AiF,i=1,2,, 两两互不相容,且 i=1Ai=Ωi=1P(Ai)=1

    Answer

    概率定义的三个条件为:
    1. 非负性:P(A)0, 对 AF;
    2. 规范性:P(Ω)=1;
    3. 可列可加性:若 AiF,i=1,2,,AiAj=, 当 ij, 则 P(i=1Ai)=i=1P(Ai)

    显然 (i) 与 (1) 是等价的。

    AiF,i=1,2,, 两两互不相容,且
    i=1Ai=Ω 则由 (2)(3) 可推出 1=P(Ω)=P(i=1Ai)=i=1P(Ai) 即 (ii) 成立。

    反之,当 (ii) 成立,则由 Ω=Ω+++ 可得
    P()=0,因此 (2) 成立,再由
    Ω=B+B+++ 可得
    P(B)+P(B)=1,若 AiF,i=1,2,, 且两两互不相容,则 i=1Ai+i=1Ai=Ω 由 (ii) 可得
    i=1P(Ai)+P(i=1Ai)=1 加上前面的结论,得出 P(i=1Ai)+P(i=1Ai)=1 所以有 P(i=1Ai)=i=1P(Ai) 即可列可加性成立。

  11. 甲有 n+2 枚硬币,乙有 n 枚硬币,投掷后比较,求 A={甲正>乙正} 的概率。

    Answer

    若记 B={甲反>乙反},由对称性仍有 P(A)=P(B)

    但这里 AB,不过由于 AB=,故知 P(AB)=P(Ω)=1,又

    AB={甲正=乙正+1,甲反>乙反}={甲正乙正=1,甲反乙反=1}={甲正乙正=1}

    P(AB)=k=0nP{甲正=k+1,乙正=k}=k=0n(n+2k+1)(nk)122n+2=k=0n(n+2n+1k)(nk)122n+2=(2n+2n+1)122n+2

    1=P(A)+P(B)P(AB)

    P(A)=12[1+(2n+2)(n+1)22n+2]

Chapter 2 Exercises

  1. 设一个家庭中有 n 个小孩的概率为

    pn={αpn,n11αp1p,n=0

    这里 0<p<1, 0<α<1pp,若认为生一个小孩为男孩或女孩是等可能的,求证一个家庭有 k (k1) 个男孩的概率为 2αpk(2p)k+1

    Answer

    An={一个家庭中有 n 个孩子},n=1,2,Bk={该家庭中有 k 个男孩,k1}。由于假定生男孩或生女孩是等可能的,所以有 P(Bk|An)=(nk)(12)n,由全概率公式得

    P(Bk)=n=kP(An)P(Bk|An)=n=kαpn(nk)(12)n=αn=k(k+ik)(p2)k+i=α(p2)ki=0(k+ii)(p2)i=α(p2)kk=0(k1i)(p2)i=α(p2)k1(1p2)k+1=2αpk(2p)k+1

    这里用到了一个小技巧:一般组合数有下面公式

    (nk)={1,k=00,(0n<k)(k<0<n)(1)k(|n|+k1k),(n<0)(k>0)(1)n+k(|k|1|n|1),(n<0)(k<0)

    换成更容易记忆的形式:

    (ak)=(a+k1k)(1)k.

    这个公式嘎嘎有用,需要记忆。

  2. 对称随机游走:甲、乙均有 n 个硬币,全部掷完后分别计算掷出的正面数,试求两人掷出的正面数相等的概率。

    Answer

    利用二项分布,得

    p=k=0n(nk)(12)k(12)nk(nk)(12)k(12)nk=(12)2nk=0n(nk)2=(12)2nk=0n(nk)(nnk)=(2nn)(12)2n
  3. 帕斯卡分布视角下的分赌注问题:甲、乙两个赌徒按某种方式下注赌博,设甲在每局中取胜的概率为 p,他们说定先胜 t 局者将赢得全部赌注,但进行到甲胜 r 局,乙胜 s 局(r<t,s<t)时,由于不得不中止,试问如何分配这些赌注才公平合理?

    Answer

    n=trm=ts 分别记甲及乙为达到最后胜利所须再胜的局数,我们可以把分赌注问题归结为如下概率问题:在伯努利试验中,求在出现 mA 之前出现 nA 的概率。

    若以 p 记上述概率,则它为甲最终取胜的概率,那么赌注以 p:1p 分配是公平合理的。现在,若利用帕斯卡分布,则容易写出答案

    p=k=0m1(n+k1k)pnqk

    p=k=0(m+k1k)pkqm

    另外,容易证明,再赌 n+m1 局一定可以决定胜负。因此甲为取得最终胜利只须而且必须在后续的 n+m1 局中至少胜 n 局。这样,利用二项分布可以知道,

    p=k=nn+m1(n+m1k)pkqn+m1k

    可以证明这三个答案确实是一致的,但是答案真的太长了。

  4. 带有吸收壁的随机游走:设质点每隔单位时间分别以概率 pq=1p 向正的或负的方向移动一个单位。假定其在时刻 t=0 时,位于 x=a,而在 x=0x=a+b 处各有一个吸收壁,我们要求质点 x=0 被吸收或在 x=a+b 被吸收的概率。

    Answer

    我们用的是差分方程法。

    若以 qn 记质点的初始位置为 n 而最终在 x=a+b 点被吸收的概率。显然 q0=0qa+b=1

    如果某时刻质点位于 x=n,这里 1na+b1,则它要被 x=a+b 吸收,有两种方式来实现:一种是接下去一次移动是向右的而最终被 x=a+b 吸收;另一种是接下去一次移动是向左的而最终被 x=a+b 吸收。所以按全概率公式有

    qn=pqn+1+qqn1,n=1,2,,a+b1

    这样,我们得到了关于 qn 的一个二阶差分方程,再用边界条件就可以求解。利用这个差分方程系数的特殊性,比较方便的解法是把这个差分方程改写成

    p(qn+1qn)=q(qnqn1),n=1,2,,a+b1

    若记 cn=qn+1qn,r=qp,则又能写成

    cn=rcn1,n=1,2,,a+b1

    下面分两种情况求解:

    (i). r=1,即 p=q=12 的场合,也即对称随机游动的场合。这时 cn=cn1,因此,若记

    qn+1qn=qnqn1==q1q0=d

    qn=q0+nd

    由于 q0=0,qa+b=1,故有

    qn=na+b

    特别地

    qa=aa+b

    (ii). r1,即 pq 的场合

    这时

    cn=rcn1=r2cn2==rnc0

    从而

    qnq0=k=0n1(qk+1qk)=k=0n1ck=k=0n1rkc0=1rn1rc0

    由于 q0=0,qa+b=1,故有

    1ra+b1rc0=1

    因此

    qn=1rn1ra+b

    特别地

    qa=1ra1ra+b=1(qp)a1(qp)a+b

    若以 pn 记质点自 n 出发而在 0 点被吸收的概率,同样可以列出差分方程

    pn=ppn+1+qpn1,n=1,2,,a+b1

    及边界条件

    p0=1,pa+b=0

    类似地可以求得,当 p=q=12

    pa=ba+b

    而在 pq 的场合

    pa=1(pq)b1(pq)a+b(qp)a(qp)a+b1(qp)a+b

    不管在什么场合,都有

    pa+qa=1