Processing math: 25%
TOC
CHAT
Hyplus目录

概率论与数理统计(1):常用公式大全

概统部分常用公式大全(无随机过程)

数学基础系列文章:

参考讲义:

习题:

课程:

  • 【网盘群】2024考研友资料38群 - 张宇基础30讲 - 概率6讲

目录 [隐藏]

1 随机事件与概率

1.1 事件的运算律

(1)交换律:AB=BAAB=BA

(2)结合律:A(BC)=(AB)CA(BC)=(AB)C

(3)分配律:A(BC)=(AB)(AC)A(BC)=(AB)(AC)

(4)德摩根律(对偶律):AB=ABAB=AB

1.2 概率的五大计算公式

1.2.1 加法公式

P(AB)=P(A)+P(B)P(AB)
P(ABC)=P(A)+P(B)+P(C)P(AB)P(BC)P(AC)+P(ABC)

1.2.2 减法公式

P(BA)=P(B)P(AB)

1.2.3 乘法公式

P(A)>0,P(AB)=P(BA)P(A)
P(B)>0,P(AB)=P(AB)P(B)
P(AB)>0,P(ABC)=P(CAB)P(BA)P(A)=P(CAB)P(AB)P(B)

1.2.4 全概率公式

P(A)=ni=1P(ABi)P(Bi)

其中BiBj= (ij)ni=1Bi=Ω

1.2.5 贝叶斯公式

P(BjA)=P(ABj)P(Bj)ni=1P(ABi)P(Bi)

其中BiBj= (ij)ni=1Bi=Ω

注:上述公式中事件Bi的个数可以是可列个

1.3 事件的独立性

AB独立P(AB)=P(A)P(B)
A,B,C两两独立{P(AB)=P(A)P(B)P(BC)=P(B)P(C)P(AC)=P(A)P(C)
A,B,C相互独立{P(AB)=P(A)P(B)P(BC)=P(B)P(C)P(AC)=P(A)P(C)P(ABC)=P(A)P(B)P(C)

1.4 独立的性质与结论

(1)若事件A,B相互独立,则ABABAB也相互独立。

(2)独立的等价说法:若0<P(A)<1,则

A,B独立P(AB)=P(A)P(B)P(B)=P(BA)P(B)=P(BA)P(BA)=P(BA)

(3)若A1,A2,,Am,B1,B2,,Bn相互独立,则f(A1,A2,,Am)g(B1,B2,,Bn)也相互独立,其中f(),g()分别表示对相应事件作任意事件运算。

(4)若P(A)=0P(A)=1,则A与任何事件B都相互独立。

1.5 独立、互斥、互逆的关系

(1)AB互斥 AB互斥,但反之不一定成立

(2)AB互斥(或互逆)且均为非零概率事件 AB不独立

(3)AB相互独立且均为非零概率事件 AB不互斥

注:一般情况下,独立和互斥无关,独立推不出互斥,互斥也推不出独立


2 一维随机变量及其分布

离散型 - 分布律
连续型 - 密度函数

2.1 分布函数

2.1.1 定义

X为随机变量,x为任意实数,称函数F(x)=P{Xx} (xR)为随机变量X分布函数,或称X服从F(x)分布,记为XF(x)

2.1.2 性质

(1)非负性:0F(x)1

(2)规范性:F()=0,F(+)=1

(3)单调不减性:x1<x2,F(x1)F(x2)

(4)右连续性:F(x0+0)=F(x0)

2.1.3 应用——求概率

(1)P{Xa}=F(a)

(2)P{X<a}=F(a0)

(3)P{X=a}=F(a)F(a0)

2.2 密度函数

2.2.1 定义

对于连续型随机变量X,其分布函数可表示为

F(x)=xf(t)dt (xR)

其中f(x)非负可积,称f(x)X概率密度函数,记为Xf(x)

2.2.2 性质

(1)非负性:f(x)0 (<x<+)

(2)规范性:+f(x)dx=1

(3)对于任意实数a<bP{a<Xb}=baf(x)dx

(4)对于连续型随机变量XP{X=x}=0,xR

(5)连续型随机变量的分布函数F(x)是连续函数

(6)在f(x)的连续点处,有F(x)=f(x)

2.3 常见的离散型分布

2.3.1 0-1分布

XB(1,p)

P{X=k}=pk(1p)1k (k=0,1)
EX=p, DX=p(1p)

2.3.2 二项分布

XB(n,p)

P{X=k}=Cknpk(1p)nk (k=0,1,,n)
EX=np, DX=np(1p)

2.3.3 泊松分布

XP(λ) (λ>0)

P{X=k}=λkk!eλ (k=0,1,2,)
EX=λ, DX=λ

2.3.4 几何分布

XG(p)

P{X=k}=p(1p)k1 (0<p<1, k=1,2,)
EX=1p, DX=1pp2

2.3.5 超几何分布

XH(N,M,n)

P{X=k}=CkMCnkNMCnN (k=0,1,,min{n,M})

2.4 常见的连续型分布

2.4.1 均匀分布

XU(a,b)

f(x)={1ba,a<x<b0,其他
F(x)={0,xaxaba,a<x<b1,xb
EX=a+b2, DX=(ba)212

2.4.2 指数分布

XE(λ) (λ>0)

f(x)={λeλx,x>00,其他
F(x)={1eλx,x00,x<0
EX=1λ, DX=1λ2

2.4.3 正态分布

2.4.3.1 一般正态分布

XN(μ,σ2) (<x<+, σ>0)

f(x)=12πσe(xμ)22σ2
EX=μ, DX=σ2

2.4.3.2 标准正态分布

XN(0,1) (<x<+)

ϕ(x)=12πex22
Φ(x)=12πxet22dt
2.4.3.2.1 性质

Φ(x)=1Φ(x)Φ(0)=12P{Xa}=2Φ(a)1

2.4.3.2.2 上α分位点

XN(0,1),对于给定的α (0<α<1),若uα满足条件P{X>uα}=α,则称uα为标准正态分布的α分位点

标准正态分布与一般正态分布的关系:正态分布XN(μ,σ2)通过线性变换Z=Xμσ变为标准正态分布,即进行标准化变量

2.5 一维随机变量函数的分布

2.5.1 离散型→离散型

设离散型随机变量X的概率分布为P{X=xi}=pi (i=1,2,),则X的函数Y=g(X)也是离散型随机变量,其概率分布为P{Y=g(xi)}=pi (i=1,2,),即

Y[g(x1)g(x2)p1p2]

若有若干个g(xi)值相同,则合并诸项为一项g(xk),并将相应概率相加作为Yg(xk)值的概率。

2.5.2 连续型→连续型(混合型)

设连续型随机变量X的分布函数、概率密度分别为FX(x),fX(x),随机变量Y=g(X)X的函数,则其分布函数和概率密度可用分布函数法求得:

FY(y)=P{Yy}=P{g(X)y}=g(x)yfX(x)dx

FY(y)连续,且除有限个点外,FY(y)存在且连续,则Y的概率密度为fY(y)=FY(y)


3 多维随机变量及其分布

3.1 联合分布函数

3.1.1 定义

F(x,y)=P{Xx,Yy} (<x<+,<y<+)

称为二维随机变量(X,Y)联合分布函数,它表示随机事件{Xx}{Yy}同时发生的概率。

3.1.2 性质

(1)非负性:对于任意实数x,yR0F(x,y)1

(2)规范性:

F(,y)=

(3)单调不减性:F(x,y)F(x,y)分别关于xxyy单调不减

(4)右连续性:F(x,y)F(x,y)分别关于xxyy具有右连续,即

F(x,y)=F(x+0,y), F(x,y)=F(x,y+0), x,yRF(x,y)=F(x+0,y),\ F(x,y)=F(x,y+0),\ x,y\in \mathbb{R}

3.2 二维离散型随机变量及其分布

若二维随机变量(X,Y)(X,Y)可能的取值为有限对或可列无穷多对实数,则称(X,Y)(X,Y)二维离散型随机变量

3.2.1 联合分布律

P{X=xi,Y=yj}=pij (i,j=1,2,)pij0i=1+j=1+pij=1P\{X=x_i,Y=y_j\}=p_{ij}\ (i,j=1,2,\cdots)\\
p_{ij}≥0\\
\sum\limits_{i=1}^{+\infty}\sum\limits_{j=1}^{+\infty}p_{ij}=1

3.2.2 边缘分布律

P{X=xi}=j=1+P{X=xi,Y=yj}=j=1+pij=pi (i=1,2,)P{Y=yj}=i=1+P{X=xi,Y=yj}=i=1+pij=pj (j=1,2,)P\{X=x_i\}=\sum\limits_{j=1}^{+\infty}P\{X=x_i,Y=y_j\}=\sum\limits_{j=1}^{+\infty}p_{ij}=p_{i\cdot}\ (i=1,2,\cdots)\\
P\{Y=y_j\}=\sum\limits_{i=1}^{+\infty}P\{X=x_i,Y=y_j\}=\sum\limits_{i=1}^{+\infty}p_{ij}=p_{\cdot j}\ (j=1,2,\cdots)

3.2.3 条件分布律

对于给定的jj,若P{Y=yj}>0 (j=1,2,)P\{Y=y_j\}>0\ (j=1,2,\cdots),则称

P{X=xiY=yj}=P{X=xi,Y=yj}P{Y=yj}=pijpj, i=1,2,P\{X=x_i|Y=y_j\}=\frac{P\{X=x_i,Y=y_j\}}{P\{Y=y_j\}}=\frac{p_{ij}}{p_{\cdot j}},\ i=1,2,\cdots

为在Y=yjY=y_j的条件下随机变量XX的条件概率分布。

对于给定的ii,若P{X=xi}>0 (i=1,2,)P\{X=x_i\}>0\ (i=1,2,\cdots),则称

P{Y=yjX=xi}=P{X=xi,Y=yj}P{X=xi}=pijpi, j=1,2,P\{Y=y_j|X=x_i\}=\frac{P\{X=x_i,Y=y_j\}}{P\{X=x_i\}}=\frac{p_{ij}}{p_{i\cdot}},\ j=1,2,\cdots

为在X=xiX=x_i的条件下随机变量YY的条件概率分布。

3.3 二维连续型随机变量及其分布

设二维随机变量(X,Y)(X,Y)的联合分布函数为F(x,y)F(x,y),如果存在非负可积的二元函数f(x,y)f(x,y),使得对任意实数x,yx,y,有F(x,y)=xyf(u,v)dudvF(x,y)=\int_{-\infty}^x\int_{-\infty}^y f(u,v)\text{d}u\text{d}v,则称(X,Y)(X,Y)二维连续型随机变量,称函数f(x,y)f(x,y)为二维随机变量(X,Y)(X,Y)的概率密度函数或联合密度函数

3.3.1 性质

(1)f(x,y)0 (<x<+,<y<+)f(x,y)≥0\ (-\infty\lt x\lt +\infty,-\infty\lt y\lt +\infty)

(2)++f(x,y)dxdy=1\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty} f(x,y)\text{d}x\text{d}y=1

(3)设DD为平面xOyxOy上任一区域,则点(x,y)(x,y)落在DD内的概率为

P{(X,Y)D}=Df(x,y)dσP\{(X,Y)\in D\}=\iint\limits_{D}f(x,y)\text{d}\sigma

(4)若f(x,y)f(x,y)在点(x,y)(x,y)处连续,则有f(x,y)=2F(x,y)xyf(x,y)=\frac{\partial^2F(x,y)}{\partial x\partial y}

3.3.2 边缘密度函数

fX(x)=+f(x,y)dyfY(y)=+f(x,y)dxf_X(x)=\int_{-\infty}^{+\infty}f(x,y)\text{d}y\\
f_Y(y)=\int_{-\infty}^{+\infty}f(x,y)\text{d}x

3.3.3 条件密度函数

fY(y)>0f_Y(y)>0时,称fXY(xy)=f(x,y)fY(y)f_{X|Y}(x|y)=\frac{f(x,y)}{f_Y(y)}为在条件Y=yY=yXX的条件密度函数。

fX(x)>0f_X(x)>0时,称fYX(yx)=f(x,y)fX(x)f_{Y|X}(y|x)=\frac{f(x,y)}{f_X(x)}为在条件X=xX=xYY的条件密度函数。

3.4 常见的二维连续型分布

3.4.1 二维均匀分布

3.4.1.1 定义

GG是平面上有界可求面积的区域,其面积为G|G|,若二维随机变量具有密度函数

f(x,y)={1G,(x,y)G0,(x,y)Gf(x,y)=\begin{cases}
 \frac{1}{|G|}, & (x,y)\in G \\
 0, & (x,y) \notin G
\end{cases}

则称(X,Y)(X,Y)在区域GG上服从二维均匀分布。

3.4.1.2 性质

(X,Y)(X,Y)在各平行于坐标轴的矩形区域D={(x,y)axb,cyd}D=\{(x,y)|a≤x≤b,c≤y≤d\}上服从二维均匀分布,则其两个分量X,YX,Y是独立的,且分别服从区间[a,b],[c,d][a,b],[c,d]上的一维均匀分布。

3.4.2 二维正态分布

3.4.2.1 定义

如果二维连续型随机变量(X,Y)(X,Y)的概率密度为

f(x,y)=12πσ1σ21ρ2exp{12(1ρ2)[(xμ1)2σ122ρ(xμ1)(yμ2)σ1σ2+(yμ2)2σ22]} (<x<+,<y<+)f(x,y)=\frac{1}{2\pi \sigma_1 \sigma_2 \sqrt{1-\rho^2}}\exp\{ \frac{-1}{2(1-\rho^2)} [\frac{(x-\mu_1)^2}{\sigma_1^2} - \frac{2\rho(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}+\frac{(y-\mu_2)^2}{\sigma_2^2} ]\}\  (-\infty\lt x\lt +\infty,-\infty\lt y\lt +\infty)

其中μ1,μ2,σ1>0,1<ρ<1\mu_1,\mu_2,\sigma_1>0,-1<\rho<1均为常数,则称(X,Y)(X,Y)服从参数为μ1,μ2,σ1,σ2,ρ\mu_1,\mu_2,\sigma_1,\sigma_2,\rho的二维正态分布,记为(X,Y)N(μ1,μ2,σ12,σ22,ρ)(X,Y)\sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)

3.4.2.2 性质

(1)XN(μ1,σ12),YN(μ2,σ22)X\sim N(\mu_1,\sigma_1^2),Y\sim N(\mu_2,\sigma_2^2)

(2)XXYY独立的充分必要条件为ρ=0\rho=0

(3)XXYY的非零线性组合服从一维正态分布,且
XXYY不独立时

k1X+k2YN(k1μ1+k2μ2,k12σ12+k22σ22+2k1k2ρσ1σ2)k_1X+k_2Y\sim N(k_1\mu_1+k_2\mu_2,k_1^2\sigma_1^2+k_2^2\sigma_2^2+2k_1k_2\rho\sigma_1\sigma_2)

XXYY独立时

k1X+k2YN(k1μ1+k2μ2,k12σ12+k22σ22)k_1X+k_2Y\sim N(k_1\mu_1+k_2\mu_2,k_1^2\sigma_1^2+k_2^2\sigma_2^2)

(4)若(X1,X2)(X_1,X_2)服从二维正态分布,且行列式abcd0\begin{vmatrix} a & b\\ c &d \end{vmatrix}≠0,则(aX1+bX2,cX1+dX2)(aX_1+bX_2,cX_1+dX_2)也服从二维正态分布。

3.5 二维随机变量的独立性

3.5.1 定义

(1)若对于任意实数x,yx,y,有F(x,y)=FX(x)FY(y)F(x,y)=F_X(x)F_Y(y),则称XXYY相互独立。

(2)若对于任意i,j=1,2,i,j=1,2,\cdots,有P{X=xi,Y=yj}=P{X=xi}P{Y=yj}P\{X=x_i,Y=y_j\}=P\{X=x_i\}P\{Y=y_j\},则称二维离散型随机变量XXYY相互独立。

(3)若对于任意实数x,yx,y,有f(x,y)=fX(x)fY(y)f(x,y)=f_X(x)f_Y(y),则称二维连续型随机变量XXYY相互独立。

3.5.2 性质

(1)若XXYY相互独立,f(x)f(x)g(x)g(x)为连续函数,则f(X)f(X)g(Y)g(Y)也相互独立。

(2)若X1,X2,,Xn,Y1,Y2,,YmX_1,X_2,\cdots,X_n,Y_1,Y_2,\cdots,Y_m相互独立,f()f(\cdot)nn元连续函数,g()g(\cdot)mm元连续函数,则f(X1,X2,,Xn)f(X_1,X_2,\cdots,X_n)g(Y1,Y2,,Ym)g(Y_1,Y_2,\cdots,Y_m)也相互独立。

3.6 二维随机变量函数的概率分布

3.6.1 离散型

已知(X,Y)(X,Y)的概率分布为

P{X=xi,Y=yj}=pij, i,j=1,2,P\{X=x_i,Y=y_j\}=p_{ij},\ i,j=1,2,\cdots

Z=g(X,Y)Z=g(X,Y)的分布律为

P{Z=zk}=P{g(X,Y)=zk}=g(xi,yj)=zkP{X=xi,Y=yj}P\{Z=z_k\}=P\{g(X,Y)=z_k\}=\sum\limits_{g(x_i,y_j)=z_k}P\{X=x_i,Y=y_j\}

3.6.2 连续型

3.6.2.1 一般方法:分布函数法

设二维连续型随机变量(X,Y)(X,Y)的概率密度函数为f(x,y)f(x,y),则随机变量Z=g(X,Y)Z=g(X,Y)的分布函数和概率密度函数为

FZ(z)=P{Zz}=P{g(X,Y)z}=g(x,y)zf(x,y)dxdyfZ(z)=FZ(z)F_Z(z)=P\{Z≤z\}=P\{g(X,Y)≤z\}=\iint\limits_{g(x,y)≤z}f(x,y)\text{d}x\text{d}y\\
f_Z(z)=F_Z'(z)

3.6.2.2 公式法:卷积公式

设二维连续型随机变量(X,Y)(X,Y)的概率密度为f(x,y)f(x,y),则随机变量Z=X+YZ=X+Y的密度函数为

fZ(z)=+f(x,zx)dx=+f(zy,y)dyf_Z(z)=\int_{-\infty}^{+\infty}f(x,z-x)\text{d}x=\int_{-\infty}^{+\infty}f(z-y,y)\text{d}y

XXYY独立,则Z=X+YZ=X+Y的密度函数公式称为卷积公式,即

fXfY=+fX(x)fY(zx)dx=+fX(zy)fY(y)dyf_X * f_Y=\int_{-\infty}^{+\infty}f_X(x)f_Y(z-x)\text{d}x=\int_{-\infty}^{+\infty}f_X(z-y)f_Y(y)\text{d}y

4 随机变量的数字特征

4.1 期望

4.1.1 一维随机变量的期望

4.1.1.1 离散型

设随机变量XX的分布律为P{X=xi}=pi (i=1,2,)P\{X=x_i\}=p_i\ (i=1,2,\cdots),若级数i=1xipi\sum\limits_{i=1}^{\infty}x_ip_i绝对收敛,则称

EX=i=1xipiEX=\sum\limits_{i=1}^{\infty}x_ip_i

为随机变量XX的数学期望。

4.1.1.2 连续型

设连续型随机变量XX的概率密度为f(x)f(x),若积分+xf(x)dx\int_{-\infty}^{+\infty}xf(x)\text{d}x绝对收敛,则称

EX=+xf(x)dxEX=\int_{-\infty}^{+\infty}xf(x)\text{d}x

XX的数学期望。

4.1.1.3 随机变量函数的期望

XX是一个随机变量,g(x)g(x)为连续实函数,令Y=g(X)Y=g(X)

4.1.1.3.1 离散型

XX的分布律为P{X=xi}=pi (i=1,2,)P\{X=x_i\}=p_i\ (i=1,2,\cdots),则

EY=E[g(X)]=i=1g(xi)piEY=E[g(X)]=\sum\limits_{i=1}^{\infty}g(x_i)p_i
4.1.1.3.2 连续型

XX的密度函数为fX(x)f_X(x),则

EY=E[g(X)]=+g(x)fX(x)dxEY=E[g(X)]=\int_{-\infty}^{+\infty}g(x)f_X(x)\text{d}x

4.1.2 二维随机变量的期望

4.1.2.1 离散型

(X,Y)(X,Y)的概率分布为P{X=xi,Y=yj}=pij (i,j=1,2,)P\{X=x_i,Y=y_j\}=p_{ij}\ (i,j=1,2,\cdots),则

EX=ixipi=ijxipijEY=jyjpj=ijyipijEX=\sum\limits_{i}x_ip_{i\cdot}=\sum\limits_{i}\sum\limits_{j}x_ip_{ij}\\
EY=\sum\limits_{j}y_jp_{\cdot j}=\sum\limits_{i}\sum\limits_{j}y_ip_{ij}

4.1.2.2 连续型

(X,Y)(X,Y)的联合概率密度为ϕ(x,y)\phi(x,y),则

EX=+xfX(x)dx=++xf(x,y)dxdyEY=+yfY(y)dy=++yf(x,y)dxdyEX=\int_{-\infty}^{+\infty}xf_X(x)\text{d}x=\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}xf(x,y)\text{d}x\text{d}y\\
EY=\int_{-\infty}^{+\infty}yf_Y(y)\text{d}y=\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}yf(x,y)\text{d}x\text{d}y\\

4.1.2.3 随机变量函数的期望

(X,Y)(X,Y)为二维随机变量,g(x,y)g(x,y)为二元连续实函数,令Z=g(X,Y)Z=g(X,Y)

4.1.2.3.1 离散型

(X,Y)(X,Y)的联合分布律为P{X=xi,Y=yj}=pij (i,j=1,2,)P\{X=x_i,Y=y_j\}=p_{ij}\ (i,j=1,2,\cdots),则

EZ=E[g(X,Y)]=i=1j=1g(xi,yj)pijEZ=E[g(X,Y)]=\sum\limits_{i=1}^{\infty}\sum\limits_{j=1}^{\infty}g(x_i,y_j)p_{ij}
4.1.2.3.2 连续型

(X,Y)(X,Y)的联合密度函数为f(x,y)f(x,y),则

EZ=E[g(X,Y)]=++g(x,y)f(x,y)dxdyEZ=E[g(X,Y)]=\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}g(x,y)f(x,y)\text{d}x\text{d}y

4.1.3 期望的性质

(1)E(C)=CE(C)=CE(EX)=EXE(EX)=EX

(2)E(CX)=CEXE(CX)=CEX

(3)E(k1X±k2Y)=k1EX±k2EYE(k_1X\pm k_2Y)=k_1EX\pm k_2EY

(4)若XXYY相互独立,则有E(XY)=EXEYE(XY)=EXEY

4.2 方差

4.2.1 定义

XX是一个随机变量,若E(XEX)2E(X-EX)^2存在,则称DX=E(XEX)2DX=E(X-EX)^2XX方差,称DX\sqrt{DX}标准差均方差

DX=EX2(EX)2DX=EX^2-(EX)^2

解题时,常用此公式计算EX2=DX+(EX)2EX^2=DX+(EX)^2

4.2.2 方差的性质

(1)D(C)=0D(C)=0D(EX)=0D(EX)=0D(DX)=0D(DX)=0

(2)D(CX)=C2DXD(CX)=C^2DX

(3)D(C1X+C2)=C12DXD(C_1X+C_2)=C_1^2DX

(4)D(X±Y)=DX+DY±2cov(X,Y)D(X\pm Y)=DX+DY \pm 2\text{cov}(X,Y)

(5)若X,YX,Y相互独立,则D(X±Y)=DX+DYD(X\pm Y)=DX+DY

4.2.3 标准化变量

设随机变量XX具有数学期望EX=μEX=\mu、方差DX=σ20DX=\sigma^2≠0,记

X=XμσX^*=\frac{X-\mu}{\sigma}

则称XX^*XX的标准化变量。

显然,EX=0EX^*=0DX=1DX^*=1,且XX^*无量纲。

4.3 协方差

4.3.1 定义

cov(X,Y)=E[(XEX)(YEY)]\text{cov}(X,Y)=E[(X-EX)(Y-EY)]

常用如下公式计算

cov(X,Y)=EXYEXEY\text{cov}(X,Y)=EXY-EXEY

4.3.2 协方差的性质

(1)cov(X,Y)=cov(Y,X)\text{cov}(X,Y)=\text{cov}(Y,X)

(2)cov(X,X)=DX\text{cov}(X,X)=DX

(3)cov(aX,bY)=abcov(X,Y)\text{cov}(aX,bY)=ab\text{cov}(X,Y)

(4)cov(X,C)=0\text{cov}(X,C)=0

(5)cov(k1X1±k2X2,Y)=k1cov(X1,Y)±k2cov(X2,Y)\text{cov}(k_1X_1\pm k_2X_2,Y)=k_1\text{cov}(X_1,Y)\pm k_2\text{cov}(X_2,Y)

(6)若XXYY相互独立,则cov(X,Y)=0\text{cov}(X,Y)=0

4.4 相关系数

4.4.1 定义

ρXY=cov(X,Y)DXDY\rho_{XY}=\frac{\text{cov}(X,Y)}{\sqrt{DX}\sqrt{DY}}

4.4.2 相关系数的性质

(1)ρXY1|\rho_{XY}|≤1

(2)ρXY=1P{Y=aX+b}=1 (a0)|\rho_{XY}|=1\Leftrightarrow P\{Y=aX+b \}=1\ (a≠0),且当a>0a>0时,ρXY=1\rho_{XY}=1a<0a<0时,ρXY=1\rho_{XY}=-1

4.4.3 不相关的等价说法

ρXY=0cov(X,Y)=0EXY=EXEYD(X±Y)=DX+DY\rho_{XY}=0\Leftrightarrow \text{cov}(X,Y)=0\Leftrightarrow EXY=EXEY \Leftrightarrow D(X\pm Y)=DX+DY

4.4.4 不相关与独立的关系

(1)X,YX,Y相互独立 \Rightarrow XXYY不相关,反之不成立

(2)若(X,Y)N(μ1,μ2;σ12,σ22;ρ)(X,Y)\sim N(\mu_1,\mu_2;\sigma_1^2,\sigma_2^2;\rho),则XXYY独立 \Leftrightarrow XXYY不相关

4.5 其他数字特征

X,YX,Y为随机变量

4.5.1 k阶(原点)矩

EXk, k=1,2,EX^k,\ k=1,2,\cdots存在,则称它为XXkk阶(原点)矩

4.5.2 k阶中心矩

E[(XEX)k], k=1,2,E[(X-EX)^k],\ k=1,2,\cdots存在,则称它为XXkk阶中心矩

4.5.3 k+l阶混合(原点)矩

E(XkYl), k,l=1,2,E(X^kY^l),\ k,l=1,2,\cdots存在,则称它为X,YX,Yk+lk+l阶混合(原点)矩

4.5.4 k+l混合中心矩

E[(XEX)k(YEY)l], k,l=1,2,E[(X-EX)^k(Y-EY)^l],\ k,l=1,2,\cdots存在,则称X,YX,Yk+lk+l阶混合中心矩

4.6 切比雪夫不等式

设随机变量XX的期望EXEX、方差DXDX都存在,则对任意ϵ>0\epsilon>0均有

P{XEXϵ}DXϵ2P\{|X-EX|≥\epsilon\}≤\frac{DX}{\epsilon^2}

P{XEX<ϵ}1DXϵ2P\{|X-EX|\lt \epsilon\}≥1-\frac{DX}{\epsilon^2}

5 大数定律与中心极限定理

5.1 依概率收敛

对于随机变量序列X1,X2,,Xn,X_1,X_2,\cdots,X_n,\cdots和常数aa,如果对于任意给定的正数ϵ\epsilon,有

limnP{Xna<ϵ}=1\lim\limits_{n\rightarrow \infty} P\{|X_n-a|<\epsilon\}=1

则称随机变量序列X1,X2,,Xn,X_1,X_2,\cdots,X_n,\cdots依概率收敛aa,记作XnPaX_n \xrightarrow{P}a

5.2 大数定律

5.2.1 切比雪夫大数定律

设随机变量X1,X2,,Xn,X_1,X_2,\cdots,X_n,\cdots相互独立,数学期望EXiEX_i和方差DXiDX_i均存在,且方差DXiDX_i有公共上界,即存在常数CC,使DXiC (i=1,2,)DX_i≤C\ (i=1,2,\cdots),则对于任意给定的正数ϵ\epsilon,总有

limnP{1ni=1nXi1ni=1nEXi<ϵ}=1\lim\limits_{n\rightarrow \infty}P\{|\frac{1}{n}\sum\limits_{i=1}^nX_i-\frac{1}{n}\sum\limits_{i=1}^nEX_i|<\epsilon \}=1

上式表明:当nn很大时,相互独立方差有公共上界的随机变量的平均值1ni=1nXi\frac{1}{n}\sum\limits_{i=1}^nX_i依概率收敛于其数学期望1ni=1nEXi\frac{1}{n}\sum\limits_{i=1}^nEX_i

5.2.2 伯努利大数定律

nAn_Ann次独立重复试验中事件AA发生的次数,pp是事件AA在每次试验中发生的概率,则对于任意正数ϵ\epsilon,有

limnP{nAnp<ϵ}=1\lim\limits_{n\rightarrow \infty}P\{|\frac{n_A}{n}-p|<\epsilon \}=1

上式表明:当nn很大时,随机事件AA发生的频率nAn\frac{n_A}{n}依概率收敛于事件AA的概率pp,因此在试验次数充分大时,可以用频率来近似代替概率。

5.2.3 辛钦大数定律

设随机变量X1,X2,,Xn,X_1,X_2,\cdots,X_n,\cdots相互独立,服从相同的分布,具有数学期望EXi=μ (i=1,2,)EX_i=\mu\ (i=1,2,\cdots),则对于任意给定的正数ϵ\epsilon,总有

limnP{1ni=1nXiμ<ϵ}=1\lim\limits_{n\rightarrow \infty}P\{|\frac1n \sum\limits_{i=1}^nX_i-\mu|<\epsilon \}=1

上式表明:当nn很大时,独立同分布的随机变量的平均值1ni=1nXi\frac1n\sum\limits_{i=1}^nX_i依概率收敛于其数学期望μ\mu

5.3 中心极限定理

5.3.1 列维-林德伯格中心极限定理

设随机变量X1,X2,,Xn,X_1,X_2,\cdots,X_n,\cdots相互独立,服从相同的分布,具有数学期望EXi=μEX_i=\mu和方差DXi=σ2>0 (i=1,2,)DX_i=\sigma^2>0\ (i=1,2,\cdots),则对于任意实数xx,有

limnP{i=1nXinμnσx}=Φ(x)\lim\limits_{n\rightarrow \infty}P\{\frac{\sum\limits_{i=1}^n X_i-n\mu}{\sqrt n \sigma}≤x \}=\Phi(x)

上式表明:在定理条件下,当nn充分大时,i=1nXi\sum\limits_{i=1}^nX_i以正态分布为极限分布。

5.3.2 棣莫弗-拉普拉斯中心极限定理

设随机变量XnX_n服从参数为n,p (0<p<1, n=1,2,)n,p\ (0\lt p\lt 1,\ n=1,2,\cdots)的二项分布,即XnB(n,p)X_n\sim B(n,p),则对于任意实数xx,有

limnP{Xnnpnp(1p)x}=Φ(x)\lim\limits_{n\rightarrow \infty}P\{\frac{X_n-np}{\sqrt{np(1-p)}}≤x\}=\Phi(x)

上式表明:当重复实验次数足够多时,二项分布以正态分布极限分布。


6 数理统计

6.1 重要统计量

6.1.1 样本均值

X=1ni=1nXi, 观测值 x=1ni=1nxi\overline X=\frac1n \sum\limits_{i=1}^nX_i,\text{ 观测值 }\overline x=\frac1n \sum\limits_{i=1}^n x_i
EX=μ, DX=σ2nE\overline X=\mu,\ D\overline X=\frac{\sigma^2}{n}

6.1.2 样本方差

S2=1n1i=1n(XiX)2, 观测值 s2=1n1i=1n(xix)2S^2=\frac{1}{n-1}\sum\limits_{i=1}^n(X_i-\overline X)^2,\text{ 观测值 }s^2=\frac{1}{n-1}\sum\limits_{i=1}^n(x_i-\overline x)^2
ES2=σ2ES^2=\sigma^2

6.1.3 样本标准差

S=1n1i=1n(XiX)2, 观测值 s=1n1i=1n(xix)2S=\sqrt{\frac{1}{n-1}\sum\limits_{i=1}^n(X_i-\overline X)^2},\text{ 观测值 }s=\sqrt{\frac{1}{n-1}\sum\limits_{i=1}^n(x_i-\overline x)^2}

6.1.4 样本k阶原点矩

Ak=1ni=1nXik, 观测值 ak=1ni=1nxik (k=1,2,)A_k=\frac1n \sum\limits_{i=1}^n X_i^k,\text{ 观测值 }a_k=\frac1n \sum\limits_{i=1}^n x_i^k\ (k=1,2,\cdots)

如果总体的XXkk阶原点矩EXk=μk (k=1,2,)EX^k=\mu_k\ (k=1,2,\cdots)存在,则当nn\rightarrow \infty时,有

Ak=1ni=1nXikPEXk (k=1,2,)A_k=\frac1n \sum\limits_{i=1}^n X_i^k \xrightarrow{P}EX^k\ (k=1,2,\cdots)

6.1.5 样本k阶中心矩

Bk=1ni=1n(XiX)k, 观测值 bk=1ni=1n(xix)k (k=2,3,)B_k=\frac1n\sum\limits_{i=1}^n(X_i-\overline X)^k,\text{ 观测值 }b_k=\frac1n\sum\limits_{i=1}^n(x_i-\overline x)^k\ (k=2,3,\cdots)

6.1.6 顺序统计量

设总体XX的分布函数为F(x)F(x)X1,X2,,XnX_1,X_2,\cdots,X_n是来自总体XX的样本,则统计量X(n)=max(X1,X2,,Xn)X_{(n)}=\max(X_1,X_2,\cdots,X_n)X(1)=min(X1,X2,,Xn)X_{(1)}=\min(X_1,X_2,\cdots,X_n)的分布函数分别为

FX(n)(x)=P{max(X1,X2,,Xn)x}=[F(x)]nFX(1)(x)=P{min(X1,X2,,Xn)x}=[1F(x)]nF_{X_{(n)}}(x)=P\{\max(X_1,X_2,\cdots,X_n)≤x\}=[F(x)]^n\\
F_{X_{(1)}}(x)=P\{\min(X_1,X_2,\cdots,X_n)≤x\}=[1-F(x)]^n

6.2 三大分布

6.2.1 卡方分布

χ2\chi^2分布(Chi-square Distribution)

6.2.1.1 典型模式

设随机变量X1,X2,,XnX_1,X_2,\cdots,X_n相互独立,且均服从标准正态分布N(0,1)N(0,1),则随机变量χ2=X12+X22++Xn2\chi^2=X_1^2+X_2^2+\cdots+X_n^2服从自由度为nnχ2\chi^2分布,记作χ2χ2(n)\chi^2\sim \chi^2(n)

6.2.1.2 性质

Xχ2(n1),Yχ2(n2)X\sim \chi^2(n_1),Y\sim \chi^2(n_2),且X,YX,Y相互独立,则X+Yχ2(n1+n2)X+Y\sim \chi^2(n_1+n_2)

6.2.1.3 数字特征

Eχ2=n, Dχ2=2nE\chi^2=n,\ D\chi^2=2n

6.2.1.4 上α分位点

χ2χ2(n)\chi^2\sim \chi^2(n),对于任意给定的α (0<α<1)\alpha\ (0\lt \alpha \lt 1),称满足条件P{χ2>χα2(n)}=αP\{\chi^2\gt \chi_{\alpha}^2(n)\}=\alpha的点χα2(n)\chi_{\alpha}^2(n)χ2(n)\chi^2(n)α\alpha分位点

6.2.2 t分布

tt分布

6.2.2.1 典型模式

设随机变量XN(0,1),Yχ2(n)X\sim N(0,1),Y\sim \chi^2(n),且X,YX,Y相互独立,则随机变量t=XY/nt=\frac{X}{\sqrt{Y/n}}服从自由度为nntt分布,记作tt(n)t\sim t(n)

6.2.2.2 性质

tt分布的概率密度f(x)f(x)是偶函数,且有limnf(x)=12πex22\lim\limits_{n\rightarrow \infty}f(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}},即当nn充分大时,t(n)t(n)分布近似于N(0,1)N(0,1)分布。

6.2.2.3 上α分位点

tt(n)t\sim t(n),对于任意给定的α (0<α<1)\alpha\ (0\lt \alpha \lt 1),称满足条件P{t>tα(n)}=αP\{t\gt t_{\alpha}(n)\}=\alpha的点tα(n)t_{\alpha}(n)t(n)t(n)α\alpha分位点

6.2.3 F分布

FF分布

6.2.3.1 典型模式

设随机变量Xχ2(m),Yχ2(n)X\sim \chi^2(m),Y\sim \chi^2(n),且X,YX,Y相互独立,则随机变量F=X/mY/nF=\frac{X/m}{Y/n}服从自由度为(m,n)(m,n)FF分布,记为FF(m,n)F\sim F(m,n)

6.2.3.2 性质

FF(m,n)F\sim F(m,n),则1FF(n,m)\frac1F \sim F(n,m)

6.2.3.3 上α分位点

FF(m,n)F\sim F(m,n),对于任意给定的α (0<α<1)\alpha\ (0\lt \alpha \lt 1),称满足条件P{F>Fα(m,n)}=αP\{F\gt F_{\alpha}(m,n)\}=\alpha的点Fα(m,n)F_{\alpha}(m,n)F(m,n)F(m,n)α\alpha分位点

6.3 一个正态总体的抽样分布

X1,X2,,XnX_1,X_2,\cdots,X_n是来自正态总体XN(μ,σ2)X\sim N(\mu,\sigma^2)的样本,样本均值为X\overline X,样本方差为S2S^2,则有

(1)XN(μ,σ2n),Xμσ/nN(0,1)\overline X\sim N(\mu,\frac{\sigma^2}{n}),\frac{\overline X-\mu}{\sigma / \sqrt n}\sim N(0,1)

(2)X\overline XS2S^2相互独立,且(n1)S2σ2χ2(n1)\frac{(n-1)S^2}{\sigma^2}\sim \chi^2(n-1)

(3)XμS/nt(n1)\frac{\overline X-\mu}{S/\sqrt n}\sim t(n-1)

(4)1σ2i=1n(Xiμ)2χ2(n)\frac1{\sigma^2}\sum\limits_{i=1}^n(X_i-\mu)^2\sim \chi^2(n)

6.4 两个正态总体的抽样分布

XN(μ1,σ12),YN(μ2,σ22)X\sim N(\mu_1,\sigma_1^2),Y\sim N(\mu_2,\sigma_2^2)X1,X2,,Xn1X_1,X_2,\cdots,X_{n_1}Y1,Y2,,Yn2Y_1,Y_2,\cdots,Y_{n_2}分别来自总体XXYY的样本,且两个样本相互独立,则有

(1)(XY)(μ1μ2)σ12n1+σ22n2N(0,1)\frac{(\overline X-\overline Y)-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}\sim N(0,1)

(2)若σ12=1σ22\sigma_1^2=1\sigma_2^2,则(XY)(μ1μ2)Swσ12n1+σ22n2t(n1+n22)\frac{(\overline X-\overline Y)-(\mu_1-\mu_2)}{S_w\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}} \sim t(n_1+n_2-2),其中Sw2=(n11)S12+(n21)S22n1+n22S_w^2=\frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}

(3)1σ12i=1n1(Xiμ1)2/n11σ22j=1n1(Yjμ2)2/n2F(n1,n2)\frac{\frac1{\sigma_1^2} \sum\limits_{i=1}^{n_1}(X_i-\mu_1)^2/n_1}{\frac1{\sigma_2^2} \sum\limits_{j=1}^{n_1}(Y_j-\mu_2)^2/n_2}\sim F(n_1,n_2)

(4)S12/σ12S22/σ22F(n11,n21)\frac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2}\sim F(n_1-1,n_2-1)

6.5 矩估计

6.5.1 原理

样本的kk阶原点矩依概率收敛于总体的kk阶原点矩。

6.5.2 解题步骤

待估参数为kkθ1,θ2,,θk\theta_1,\theta_2,\cdots,\theta_k
(1)求出总体的kk阶原点矩μk=EXk (k=1,2,)\mu_k=EX^k\ (k=1,2,\cdots)

(2)令样本的kk阶原点矩Ak=1ni=1nXikA_k=\frac1n \sum\limits_{i=1}^nX_i^k等于总体的kk阶原点矩,即令

EXk=1ni=1nXik (k=1,2,)EX^k=\frac1n \sum\limits_{i=1}^n X_i^k\ (k=1,2,\cdots)

(3)解上面的方程组,得θi\theta_i的矩估计量为θ^i(X1,X2,,Xn)\hat \theta_i(X_1,X_2,\cdots,X_n),则θi\theta_i的矩估计值为θ^i(x1,x2,,xn)\hat \theta_i(x_1,x_2,\cdots,x_n)

注:当待估参数为1个时,通常令EX=1ni=1nXiEX=\frac1n \sum\limits_{i=1}^n X_i,即可解得θ\theta的矩估计量与相应的矩估计值。

6.6 最大似然估计法

6.6.1 似然函数和最大似然估计

6.6.1.1 X为离散型随机变量

设总体XX的分布律为P{X=ai}=p(ai;θ), i=1,2,P\{X=a_i\}=p(a_i;\theta),\ i=1,2,\cdotsX1,X2,,XnX_1,X_2,\cdots,X_n为取自XX的样本,则X1,X2,,XnX_1,X_2,\cdots,X_n的联合分布律

L(x1,x2,,xn;θ)=i=1np(xi;θ), xiai (i=1,2,)中的某个数L(x_1,x_2,\cdots,x_n;\theta)=\prod\limits_{i=1}^np(x_i;\theta),\ x_i为a_i\ (i=1,2,\cdots)中的某个数

称为似然函数L(x1,x2,,xn;θ)L(x_1,x_2,\cdots,x_n;\theta)关于θ\theta的最大值点θ^\hat \theta称为θ\theta最大似然估计

6.6.1.2 X为连续型随机变量

设总体XX的密度函数为f(x;θ)f(x;\theta)X1,X2,,XnX_1,X_2,\cdots,X_n为取自XX的样本,则

L(x1,x2,,xn;θ)=i=1nf(xi;θ)L(x_1,x_2,\cdots,x_n;\theta)=\prod\limits_{i=1}^nf(x_i;\theta)

称为似然函数L(x1,x2,,xn;θ)L(x_1,x_2,\cdots,x_n;\theta)关于θ\theta的最大值点θ^\hat \theta称为θ\theta最大似然估计

注:上述两种中的θ\theta可以是多个待估参数(θ1,θ2,,θk)(\theta_1,\theta_2,\cdots,\theta_k)

6.6.2 最大似然估计的解题步骤

待估参数为kk(θ1,θ2,,θk)(\theta_1,\theta_2,\cdots,\theta_k)

(1)写出似然函数

L(x1,x2,,xn;θ1,θ2,,θk)=i=1np(xi;θ1,θ2,,θk) (离散型)L(x1,x2,,xn;θ1,θ2,,θk)=i=1nf(xi;θ1,θ2,,θk) (连续型)L(x_1,x_2,\cdots,x_n;\theta_1,\theta_2,\cdots,\theta_k)=\prod\limits_{i=1}^np(x_i;\theta_1,\theta_2,\cdots,\theta_k)\text{               (离散型)}\\
L(x_1,x_2,\cdots,x_n;\theta_1,\theta_2,\cdots,\theta_k)=\prod\limits_{i=1}^nf(x_i;\theta_1,\theta_2,\cdots,\theta_k)\text{               (连续型)}

(2)取对数lnL\ln L

(3)若lnL\ln Lθ1,θ2,,θk\theta_1,\theta_2,\cdots,\theta_k可微,求偏导数lnLθi, i=1,2,,k\frac{\partial \ln L}{\partial \theta_i},\ i=1,2,\cdots,k;判断方程组lnLθi=0\frac{\partial \ln L}{\partial \theta_i}=0是否有解。若有解则其解即为所求最大似然估计;若无解则要概率极大似然估计的意义(使似然函数取得最大值),此时,估计值常在θi\theta_i的边界点上达到。

注:对于只有一个未知参数只需将步骤(3)中求偏导变为一元函数求导即可

6.7 估计量的评选标准

6.7.1 无偏性

如果θ\theta的估计量θ^(X1,X2,,Xn)\hat \theta(X_1,X_2,\cdots,X_n)的数学期望Eθ^E\hat \theta存在,且Eθ^=θE\hat \theta=\theta,则称θ^(X1,X2,,Xn)\hat \theta(X_1,X_2,\cdots,X_n)是未知参数θ\theta无偏估计量

6.7.2 有效性

θ^1(X1,X2,,Xn)\hat \theta_1(X_1,X_2,\cdots,X_n)θ^1(X1,X2,,Xn)\hat \theta_1(X_1,X_2,\cdots,X_n)都是未知参数θ\theta的无偏估计量,若Dθ^1Dθ^2D\hat\theta_1≤D\hat\theta_2,且至少对于某一个θΘ\theta\in \Theta不等号成立,则称θ^1(X1,X2,,Xn)\hat \theta_1(X_1,X_2,\cdots,X_n)θ^1(X1,X2,,Xn)\hat \theta_1(X_1,X_2,\cdots,X_n)更有效。

6.7.3 一致性(相合性)

若对任意ϵ>0\epsilon>0,有

limnP{θ^θ<ϵ}=1\lim\limits_{n\rightarrow \infty}P\{|\hat\theta-\theta|\lt\epsilon\}=1

则称θ^\hat \thetaθ\theta一致估计量

6.8 区间估计

6.9 假设检验

《概率论与数理统计(1):常用公式大全》有3条评论

发表评论

Hyperplasma
Hyperplasma