本文将对概率论和数理统计的经典知识点做一个简要的总结和归纳。

相关传送门:线性代数复习趣题摘记-概率和期望

概率相关的定义

统计三大分布

基础不等式

马尔科夫不等式 Markov inequality:对于非负随机变量 XX 和定值 aa

P(Xa)μaP(X \ge a) \le \frac{\mu}{a}

证明:对 XX 的概率密度函数积分即可。

切比雪夫不等式 Chebyshev Inequality:假设随机变量 XX 总体均值为 μ\mu,总体方差为 σ2\sigma^2

P(Xμc)σ2c2P(|X-\mu| \ge c) \le \frac{\sigma^2}{c^2}

证明:取 X=(Xμ)2,a=c2X'=(X-\mu)^2,a'=c^2 带入马尔科夫不等式即得证。

c=kσc=k\sigma 立得推论:

P(Xμkσ)1k2P(|X-\mu| \ge k\sigma) \le \frac{1}{k^2}

相比于马尔科夫不等式,切比雪夫不等式额外利用了方差的信息,得到了更准确的界。

大数定律

大数定理 条件 效果
弱大数定律 期望存在 样本均值依概率收敛于期望
强大数定律 期望存在 样本均值趋向于期望
马尔科夫大数定律 期望存在,和的方差是关于 n2n^2 的无穷小量 样本均值趋向于期望
切比雪夫大数定律 期望存在,方差独立且有共同上界 样本均值趋向于期望
辛钦大数定律 期望存在,独立同分布 样本均值趋向于期望

定义 {X1,X2,,Xn}\{X_1,X_2,\dots,X_n\} 是随机变量序列。若 E(x)\mathbb E(x) 存在则记为 μ\mu,如果 D(x)\mathbb D(x) 存在则记为 σ2\sigma^2

弱大数定律 weak law of large numbers:若 {Xn}\{X_n\} 的数学期望存在,则样本均值 Xn\overline X_n 依概率收敛于 μ\mu,记作 XnPμ\overline X_n \overset{P}{\longrightarrow} \mathbb \mu。即:

ε>0:limnP{Xnμ<ε}=1\forall\varepsilon>0: \lim_{n\rightarrow\infty}P\left\{ \left| \overline X_n-\mu \right| < \varepsilon \right\} = 1

强大数定律 strong law of large numbers:若 {Xn}\{X_n\} 的数学期望存在,则样本均值 Xn\overline X_n 趋向于 μ\mu。即:

P{limnXn=μ}=1P\left\{ \lim_{n\rightarrow\infty} \overline X_n=\mu \right\} =1

需要注意的是,(强弱)大数定律的表达式是 P=1P=1,即允许极少数离群点。

马尔科夫大数定律:若 {Xn}\{X_n\} 的满足以下性质,则其服从弱大数定律。

limn1n2D(i=1nXi)=0\lim_{n\to\infty}\frac1{n^2}\mathbb D\left(\sum_{i=1}^nX_i\right)=0

切比雪夫大数定律:若 {Xn}\{X_n\} 独立且方差有共同的上界,则其服从弱大数定律。

证明:因为 {Xn}\{X_n\} 独立,将马尔科夫大数定律的方差项各自拆开并替换成上界 CC 即可得证。

辛钦大数定律 Khinchin’s Law of Large numbers:若 {Xn}\{X_n\} 独立同分布数学期望存在,则其服从弱大数定律。

中心极限定理 Central Limit Theorem:若 {X1,X2,,Xn}\{X_1,X_2,\dots,X_n\} 是独立同分布的随机变量序列,且 E(X)=μ\mathbb E(X)=\muD(X)=σ2>0\mathbb D(X)=\sigma^2>0,则 nn 足够大时 Xn\overline X_n 近似服从正态分布 N(μ,σ2n)N\left(\mu,\frac{\sigma^2}n\right),即

limnP(Xnμσ/n<a)=Φ(a)=a12πet2/2dt\lim_{n\to\infty}P\left(\frac{\overline X_n-\mu}{\sigma/\sqrt n}<a\right)=\Phi(a)=\int_{-\infty}^a\frac1{\sqrt{2\pi}}e^{-t^2/2}dt

上述定理全称是林德伯格-勒维 Lindeberg-Levy 中心极限定理,是最常见的中心极限定理。此外还有:

  • 棣莫弗-拉普拉斯 De Moivre-Laplace 中心极限定理(二项分布中心极限定理),讨论了二项分布特例。
  • 林德伯格-费勒 Lindeberg-Feller 中心极限定理,不再要求独立同分布,是一个条件较弱的中心极限定理。
  • 李雅普诺夫 Lyapunov 中心极限定理,是林德伯格中心极限定理的强化版本(或者说是推论)。