第三章 多维随机变量及分布
3.1 联合分布函数与边缘分布函数
3.1.1 二维随机变量及联合分布函数
设Ω是随机试验E的样本空间,$X_1 \sim X_n$是定义在Ω上的随机变量,则称$(X_1,X_2…X_n)$为n维随机变量。
联合分布函数:$F(x,y)=P \{ X≤x,Y≤y \} $,几何区域为$(x_0,y_0)$的左下方区域。
性质:
- 单调不减;
- 非负有界;
- 右连续;
上述三个性质为充要条件。
边缘分布函数:
$F_X(x)=P\{X≤x\}=F(x,+\infty)=\lim_{y \to +\infty}F(x,y)$
$F_Y(y)=P\{Y≤y\}=F(+\infty,y)=\lim_{x \to +\infty}F(x,y)$
联合分布决定边缘分布,边缘分布不能决定联合分布。
3.1.2 二维随机变量的独立性
随机变量X和Y相互独立,则$F(x,y)=F_X(x)F_Y(y)$,$P\{X≤x,Y≤y\}=P\{X≤x\}P\{Y≤y\}$。
3.2 二维离散型随机变量的分布
二维离散型随机变量:(X,Y)是二维随机变量,所有取值只有有限个。
3.2.1 二维离散型随机变量的联合概率分布律
- 联合概率分布律:$P\{X=x_i,Y=y_i\}=P_{ij}, i,j=1,2…$
性质:
- 非负性;$P_{ij}≥0$
- 规范性;$\sum_{i=1}^{+\infty}\sum_{j=1}^{+\infty}P_{ij}=1$
- 联合分布函数:$F(x,y)=P\{X≤x,Y≤y\}=\sum_{x_i≤x,y_i≤y}P_{ij}$
- 边缘分布函数:$F_X(x)=F(x,+\infty)=\sum_{i:x_i≤x}\sum_{j=1}^{+\infty}P_{ij}$,$F_Y(y)$同理
3.2.2 二维离散型随机变量的边缘概率分布律
边缘概率分布律:
$P\{X=x_i\}=\sum_{j=1}^{+\infty}P_{ij}=P_i, i=1,2…$
$P\{Y=y_i\}=\sum_{i=1}^{+\infty}P_{ij}=P_j, i=1,2…$
3.2.3 二维离散型随机变量的条件概率分布律
条件概率分布律:$P\{X=x_i|Y=y_i\}=\frac {P\{X=x_i,Y=y_i\}}{P\{Y=y_i\}}=\frac {P_ij}{P_·j}$
性质:
- 非负性;$P\{X=x_i|Y=y_i\}≥0$
- 规范性;$\sum_{i=1}^{+\infty} P\{X=x_i|Y=y_i\}=1$
3.2.4 二维离散型随机变量的独立性
对任意$i,j=1,2…$,有$P\{X=x_i,Y=y_i\}=P\{X=x_i\}P\{Y=y_i\}=P_{i·}P_{·j}$
3.3 二维连续型随机变量及分布
3.3.1 二维连续型随机变量的联合概率密度函数
联合概率密度函数$f(x,y)$:$F(x,y)=\int_{-\infty}^xds\int_{-\infty}^yf(s,t)dt$,$f(x,y)$是非负实值函数。
性质:
- 非负性;$f(x,y)≥0$
- 规范性;$\int_{-\infty}^{+\infty}dx\int_{-\infty}^{+\infty}f(x,y)dy=1$
满足上面两个性质的二元函数一定是某个二维随机变量的联合概率密度函数。- 若$f(x,y)$在点$(x,y)$处连续,则$\frac{\partial^{2}F(x,y)}{\partial x\partial y}=f(x,y)$
- 设D为一平面区域,$G={(x,y):f(x,y)>0}$,则$P\{(X,Y)\in D\}=\iint_{D\bigcap G}f(x,y)dxdy$
边缘分布函数:
$F_X(x)=F(x,+\infty)=\int_{-\infty}^xds\int_{-\infty}^{+\infty}f(s,t)dt, -\infty<x<+\infty$
$F_Y(y)=F(+\infty,y)=\int_{-\infty}^{+\infty}ds\int_{-\infty}^yf(s,t)dt, -\infty<y<+\infty$
3.3.2 二维连续型随机变量的边缘概率密度函数
边缘概率密度函数:$f_X(x)=\int_{-\infty}^{+\infty}f(x,y)dy$,$f_Y(y)=\int_{-\infty}^{+\infty}f(x,y)dx$
3.3.3 常用二维连续型随机变量的分布
二维均匀分布:$(X,Y)$是二维连续型随机变量,G是平面上一有界区域。
二维正态分布:$(X,Y)\sim N(μ_1,μ_2;σ_1^2,σ_2^2;ρ),|ρ|≤1$
二维正态随机变量的边缘分布仍然是正态分布,但是边缘分布都是正态分布,其联合分布可能不是正态分布
二维正态随机变量的条件分布仍然是正态分布。
$\int_{-\infty}^{+\infty}e^{- \frac {x^2}{2}}dx=\sqrt{2π}$
3.3.4二维连续型随机变量的条件概率密度函数
条件分布函数:
$F_{X|Y}(x|y)=P\{X≤x|Y=y\}=\lim_{ε→0^+}P\{X≤x|y-ε<Y≤y\}$
$F_{Y|X}(y|x)=P\{Y≤y|X=x\}=\lim_{ε→0^+}P\{Y≤y|x-ε<X≤x\}$
条件概率密度函数$f_{X|Y}(x|y)$:$F_{X|Y}(x|y)=\int_{-\infty}^{x}f_{X|Y}(x|y)dx$
3.3.5 二维连续型随机变量的独立性
X,Y相互独立等价于对任意$(x,y)\in R^2$,在平面上几乎处处成立,$f(x,y)=f_X(x)f_Y(y)$
“几乎处处成立”是指该等式至多在一个概率为零的区域上不成立。
随机变量X,Y相互独立还等价于$f_{x|y}(x|y)=f_X(x)$或$f_{y|x}(y|x)=f_Y(y)$
判断两个随机变量是否相互独立,既可以用分布函数也可以用密度函数来判断。
3.4 二维随机变量函数的分布
3.4.1 二维离散型随机变量函数的分布
- Z=X+Y的分布
$P\{Z=k\}=P\{X+Y=k\}=\sum_{i=0}^{k}P\{X=i,Y=k-i\}$
若X,Y相互独立,且已知边缘分布律,则:
$P\{Z=k\}=P\{X+Y=k\}=\sum_{i=0}^{k}P\{X=i,Y=k-i\}=\sum_{i=0}^k P\{X=i\}P\{Y=k-i\}$
结论:
- 相互独立的泊松分步具有可加性;
- 相互独立的二项分布具有可加性(两点分布不具有可加性);前提P一样。
- 正态分布、卡方分布具有可加性(标准正态分布不具有可加性);
- 最大值、最小值的分布
3.4.2 连续型随机变量函数的分布
- $Z=X+Y$的分布
$f_Z(z)=\int_{-\infty}^{+\infty}f(x,z-x)dx$或$f_Z(z)=\int_{-\infty}^{+\infty}f(z-y,y)dy$
进一步,如果随机变量X与Y相互独立,即$f(x,y)=f_X(x)f_Y(y)$那么:
$f_Z(z)=\int_{-\infty}^{+\infty}f_X(x)f_Y(z-x)dx$或$f_Z(z)=\int_{-\infty}^{+\infty}f_X(z-y)f_Y(y)dy$
结论:有限个相互独立的正态随机变量的线性组合仍然服从线性分布。(即正态分布具有可加性)
(标准正态分布不具有可加性)
- $M=max\{X,Y\},N=min\{X,Y\}$
$F_M(z)=P\{X≤z,Y≤z\}=F(z,z)=\int_{-\infty}^{z}dx\int_{-\infty}^{z}f(x,y)dxdy$
若X,Y相互独立,则
$F_M(z)=P\{X≤z\}P\{Y≤z\}=F_X(z)F_Y(z)=\int_{-\infty}^zf_X(x)dx\int_{-\infty}^zf_Y(y)dy$
$F_N(z)=1-P\{X>z,Y>z\}=1-\int_z^{+\infty}dx\int_z^{+\infty}f(x,y)dy$
若X,Y相互独立,则$F_N(z)=1-P\{X>z\}P\{Y>z\}=1-\int_z^{+\infty}f_X(x)dx\int_z^{+\infty}f_Y(y)dy=1-(1-F_X(z))(1-F_Y(z))$
结论:相互独立的指数分布的最小值函数仍然是指数分布,且参数是原来参数之和。
技巧知识点
①. $X$是只可能取两个值的离散型随机变量,$Y$是连续型随机变量,$X,Y$相互独立,则随机变量$X+Y$的分布函数是连续函数。