多维随机变量函数的分布

学R不思则罔，思R不学则殆。

coffee刚开始学习这一部分内容的时候，感到有些吃力，应该是大多数同学都有的感受，不过随着coffee啃教材啃题目多了，有了“山重水复疑无路，柳暗花明又一村”的感觉。现在coffee结合教材上的知识点，将自己的总结分享出来。这篇文章的结构是先给出几个重要的结论，再结合几个例题给出解决一般问题的方法。

这里讨论的多维随机变量，可分为离散型和连续型的，因而其函数就有三种组合：仅有离散型、仅有连续型、离散型和连续型的组合。

对于多维离散型随机变量的函数，若所给的是多维离散型随机变量的分布列，那么一般情况下根据该分布列和函数关系即可求出，这类问题较为简单，不做过多阐述。

离散场合下的卷积公式

我们首先定义分布的可加性：如果若干个属于同一类分布的独立随机变量的和的分布仍属于此类分布，称满足这样性质的分布具有可加性。

这里有两个特殊的离散型随机变量，二项分布和泊松分布，它们是具有可加性的。这一结论的证明需要引入离散场合下的卷积公式（这里的卷积是指，寻求两个独立随机变量和的分布的运算）：

设随机变量 $X,Y$ 是两个属于同一类分布的独立的离散型随机变量，设 $X,Y$ 的取值范围的交集为 $I$ ，记 $Z=X+Y$ ，则 $P(Z=k)=\sum_{i\in I}^{k}P(X=i)\,P(Y=k-i)$ .

这一结论是显然的，因为 $X,Y$ 是独立的。不过要注意的是，上述的“属于同一类分布的独立的离散型随机变量”并不是“独立同分布”，这两个概念要严加区分。“同分布”意味着两随机变量服从同一个分布，即分布的参数要全部一致，而“同一类分布”并不意味着分布的参数要相同。

二项分布和泊松分布的可加性的证明详见教材，这里仅给出结论：

二项分布的可加性：

若随机变量 $X\sim b(n,p),Y\sim b(m,p)$ ，且 $X$ 与 $Y$ 相互独立，则 $X+Y\sim b(n+m,p)$ 。这个性质可以推广到有限个随机变量的场合： $b(n_1,p)*b(n_2,p)*\cdots*b(n_k,p)\sim b\left( \sum_{i=1}^{k}n_i,p \right)$ 。此即说明服从二项分布 $b(n,p)$ 的随机变量可以分解为 $n$ 个相互独立的服从两点分布 $b(1,p)$ 的随机变量之和。

泊松分布的可加性：

若随机变量 $X\sim P(\lambda_1),Y\sim P(\lambda_2)$ ，且 $X$ 与 $Y$ 相互独立，则 $X+Y\sim P(\lambda_1+\lambda_2)$ 。这个性质可以推广到有限个随机变量的场合： $P(\lambda_1)*P(\lambda_2)*\cdots*P(\lambda_n)\sim P\left( \sum_{i=1}^{k}\lambda_i\right)$ 。

连续场合下的卷积公式

设 $X$ 和 $Y$ 为两个相互独立的连续随机变量，其密度函数分别为 $p_X(x)$ 和 $p_Y(y)$ ，则其和 $Z=X+Y$ 的密度函数为： $\begin{aligned} p_Z(z)&=\int_{-\infty}^{+\infty}p_X(z-y)p_Y(y){\rm d}y\\ &=\int_{-\infty}^{+\infty}p_X(x)p_Y(z-x){\rm d}x \end{aligned}$

由此公式可以得到一些连续型随机变量分布的可加性：

正态分布的可加性：

设 $X\sim N(\mu _1,\sigma_1^2),Y\sim (\mu _2,\sigma_2^2)$ ，且 $X$ 与 $Y$ 独立，则 $X+Y\sim N(\mu _1+\mu _2,\sigma_1^2+\sigma^2_2)$ 。这个结论可以推广到有限场合：任意 $n$ 个相互独立的正态变量的线性组合仍服从正态分布：若 $X_i\sim N(\mu _i,\sigma_i^2),\quad i=1,2,\cdots,n$ ，对于任意不全为零的常数列 $\left\{ a_i \right\}_{i=1}^{n}$ ， $\sum_{i=1}^{n}a_iX_i\sim N\left( \sum_{i=1}^{n}a_i\mu_i\,, \,\sum_{i=1}^{n}\sigma_i^2\right)$ .

伽玛分布的可加性：

设 $X\sim Ga(\alpha _1,\lambda),Y\sim (\alpha _2,\lambda)$ ，且 $X$ 与 $Y$ 独立，则 $X+Y\sim Ga(\alpha _1+\alpha_2,\lambda)$ 。这个结论可以推广到有限个尺度参数（ $\lambda$ ）相同的场合：任意 $n$ 个相互独立的尺度参数（ $\lambda$ ）相同的伽玛变量的和仍服从伽玛分布：若 $X_i\sim Ga(\alpha_i,\lambda),\quad i=1,2,\cdots,n$ ，则 $\sum_{i=1}^{n}X_i\sim Ga\left( \sum_{i=1}^{n}\alpha_i\,, \lambda\right)$ .

又因为

$Exp(\lambda)=Ga(1,\lambda),\quad \chi^2(n)=Ga(\frac{n}{2},\frac{1}{2})$ （由此可推出 $Exp(\frac{1}{2})=\chi^2(2)$ ）

结合伽玛分布的可加性，有：

1. $n$ 个独立同分布的指数变量之和为伽玛变量：

若 $X_i\sim Exp(\lambda),\quad i=1,2,\cdots,n$ ，且 $X_i$ 独立，则 $\sum_{i=1}^{n}Exp(\lambda)\sim Ga(n,\lambda)$ .

2.卡方分布具有可加性：

若 $X_i\sim \chi^2(n_i),\quad i=1,2,\cdots,n$ ，且 $X_i$ 独立，则 $\sum_{i=1}^{n}\chi^2(n_i)\sim \chi^2\left( \sum_{i=1}^{n}n_i \right)$ .

在概率论中，我们用“ $\chi^2(n)=Ga(\frac{n}{2},\frac{1}{2})$ ”这个式子来定义卡方分布；而在数理统计中，我们将给出卡方分布的构造定义：若 $\{X_i \}_{i=1}^{n}$ 独立同分布于 $N(0,1)$ ，则 $\sum_{i=1}^{n}X_i^2\sim \chi^2(n)$ ，记 $\chi^2=\sum_{i=1}^{n}X_i^2$ 服从自由度为 $n$ 的卡方分布。事实上，我们可以利用求分布函数的方法证得：若 $X\sim N(0,1)$ ，则 $X^2\sim\chi^2(1)$ 。那么我们可以这样理解卡方分布的“自由度”的这个概念：因为 $\chi^2(n)$ 可以看做是由 $n$ 个自由的（独立）正态变量的平方所组成的。

至此我们给出了所有具有可加性的随机变量。

最大值、最小值分布

记 $\{ X_i\}_{i=1}^{n}$ 为 $n$ 个相互独立的随机变量，且 $X_i\sim F_i (x),\quad i=1,2,\cdots,n$ 。

记 $Y=max\{ X_i\}_{i=1}^{n}$ ，求 $Y$ 的分布，即最大值分布。

这种较为抽象的问题一般都从定义出发。求一个随机变量的分布，那就从它的分布函数出发，分布函数唯一决定了该分布（私以为这也是分布函数的名称来源）。根据分布函数的定义，不难得到：

$\begin{aligned} F_Y(y)&=P(Y\leq y)\\&=P(max\{ X_i\}_{i=1}^{n} \leq y)\\ &=P(X_1\leq y,\,X_2\leq y,\,\cdots,X_n\leq y) \\&=P(X_1 \leq y)\,P(X_2 \leq y)\boldsymbol· \cdots \boldsymbol·P(X_n \leq y)\\ &=\Pi_{i=1}^{n}F_i(y) \end{aligned}$ ，再对两边关于 $y$ 求导，即得 $p_Y(y)$ .

特殊情况：若 $\{ X_i\}_{i=1}^{n}$ 独立同分布（不论离散或连续），则：

$F_Y(y)=\left[ F(y) \right]^n$

对该特殊情况进一步地，若 $\{ X_i\}_{i=1}^{n}$ 为连续型随机变量，则对上式两边关于 $y$ 求导，有：

$p_Y(y)=n\left[ F(y) \right]^{n-1} p(y)$

注意，上式中左边的 $p_Y(y)$ 和右边的 $p(y)$ 要加以区分。

记 $Y=min\{ X_i\}_{i=1}^{n}$ ，求 $Y$ 的分布，即最小值分布。

按照上面最小值分布求解的思想，不难得到：

$\begin{aligned} F_Y(y)&=P(Y\leq y)\\&=P(min\{ X_i\}_{i=1}^{n} \leq y)\\ &=1-P(min\{ X_i\}_{i=1}^{n} > y) \\ &=1-P(X_1> y,\,X_2> y,\,\cdots,X_n>y) \\&=1-P(X_1 > y)\,P(X_2 > y)\boldsymbol· \cdots \boldsymbol·P(X_n >y)\\ &=1-\Pi_{i=1}^{n}\left[1- F_i(y) \right] \end{aligned}$ ，再对两边关于 $y$ 求导，即得 $p_Y(y)$ .

特殊情况：若 $\{ X_i\}_{i=1}^{n}$ 独立同分布（不论离散或连续），则：

$F_Y(y)=1-\left[1- F(y) \right]^n$

对该特殊情况进一步地，若 $\{ X_i\}_{i=1}^{n}$ 为连续型随机变量，则对上式两边关于 $y$ 求导，有：

$p_Y(y)=n\left[1- F(y) \right]^{n-1} p(y)$

注意，上式中左边的 $p_Y(y)$ 和右边的 $p(y)$ 要加以区分。

对于该特殊情况，指数分布有一个很好的性质：

若 $\{ X_i\}_{i=1}^{n}$ 独立同分布，服从于 $Exp(\lambda)$ ，则 $min\{ X_i\}_{i=1}^{n}\sim Exp(n\lambda)$

这个结论也很容易理解，我们知道指数分布往往与“寿命”有关，譬如电子器件的工作寿命，现设有一批同质的电子器件，设其工作寿命的期望为 $\frac{1}{\lambda}$ ，则其工作寿命 $X_i\sim Exp(\lambda)$ 。将这些电子器件串联起来，电路正常运行当且仅当所有电子器件正常运行，这个回路的工作寿命取决于正常运行时间最短的那个电子器件，记这个回路的工作寿命 $Y=min\{ X_i\}_{i=1}^{n}$ 。直观上容易理解，回路的工作寿命的期望为 $\frac{1}{n\lambda}$ ，从而 $Y\sim Exp(n\lambda)$ 。

设 $X_1,X_2$ 独立同分布，记 $Y=max\{ X_1,X_2\}-min\{ X_1,X_2\}$ ，求 $Y$ 的分布，即最大值与最小值的差的分布。

关于这类问题的求解，只需注意到有以下等式：

$\begin{cases} max\{X_1,X_2\}=\frac{X_1+X_2+|X_1-X_2|}{2}\\ min\{X_1,X_2\}=\frac{X_1+X_2-|X_1-X_2|}{2} \end{cases}$

则 $Y=max\{ X_1,X_2\}-min\{ X_1,X_2\}=|X_1-X_2|$ 。若 $X_1,X_2$ 为离散型随机变量，由于 $X_1,X_2$ 独立同分布，根据对称性有， $P(Y=k)=P\left(\,|X_1-X_2\right|=k)=2P(X_1-X_2=k)$ ，再结合 $Xi$ 的分布列即可求得。若 $X_1,X_2$ 为连续型随机变量，需画出满足条件的积分区域，确定好积分上下限后做积分求得分布函数，对其关于 $z$ 求导得概率密度函数，具体问题具体分析，这里举一个例子。

e.g.1

设独立同分布的 $X_i$ 的概率密度函数如下：

$p(x)= \begin{cases} 2x,\quad 0<x<1,\\ \,\,0,\quad 其他. \end{cases}$

求 $Y=max\{ X_1,X_2\}-min\{ X_1,X_2\}$ 的分布。

解：

当 $z<0$ 时， $F_Z(z)=0$ ；

当 $0\leq z<\frac{1}{2}$ 时，积分区域如下图阴影部分：

对该区域分三段进行积分：

$\begin{aligned} F_Z(z)&=\int_{0}^{z}\int_{0}^{z+x_1}2x_1·2x_2\,{\rm d}x_2{\rm d}x_1\\&+\int_{z}^{1-z}\int_{x_1-z}^{x_1+z}2x_1·2x_2\,{\rm d}x_2{\rm d}x_1\\&+\int_{1-z}^{1}\int_{x_1-z}^{1}2x_1·2x_2\,{\rm d}x_2{\rm d}x_1 \end{aligned}$

当 $\frac{1}{2}\leq z<1$ 时，积分区域如下图所示：

对该区域分三段进行积分：

$\begin{aligned} F_Z(z)&=\int_{0}^{z}\int_{0}^{z+x_1}2x_1·2x_2\,{\rm d}x_2{\rm d}x_1\\&+\int_{z}^{1-z}\int_{0}^{1}2x_1·2x_2\,{\rm d}x_2{\rm d}x_1\\&+\int_{1-z}^{1}\int_{x_1-z}^{1}2x_1·2x_2\,{\rm d}x_2{\rm d}x_1 \end{aligned}$

但读者若自行尝试计算上面两个积分，会发现它们的计算非常繁琐，因而上述简单粗暴的方式只是提供一种思路。若利用“正难则反”的思想，则可以很容易地计算出结果：

不难看出，上图中Ⅰ和Ⅱ两部分面积相等，又由于两变量概率密度函数相同，很容易可以求出：

$\begin{aligned} F_Z(z)&=1-2\int_{1}^{z}\int_{0}^{x_1-z}2x_1·2x_2\,{\rm d}x_2{\rm d}x_1\\&=\cdots\\&=\frac{z^4}{3}-2z^2+\frac{8z}{3} \end{aligned}$

求导即得：

$p_Z(z)=\frac{4z^3}{3}-4z+\frac{8}{3}$

当 $z\geq1$ 时， $F_Z(z)=1$ .

综上所述：

$p_Z(z)= \begin{cases} \frac{4z^3}{3}-4z+\frac{8}{3},\quad 0\leq z<1 \\ \quad\quad\quad 0,\quad 其他. \end{cases}$

这道题也可以利用下面要介绍的变量变换法求解，请读者自行尝试。

变量变换法

设二维随机变量 $(X,Y)$ 的联合密度函数为 $p(x,y)$ ，若函数 $\begin{cases} u=g_1(x,y)\\v=g_2(x,y) \end{cases}$ 有连续的偏导数，且存在唯一的反函数 $\begin{cases} x=x(u,v) \\ y=y(u,v) \end{cases}$ ，该变换的Jocobi行列式 $\begin{aligned} J&=\frac{\partial (x,y)}{\partial (u,v)}= \left| \begin{array}{ccc} \frac{\partial x}{\partial u} & \frac{\partial x}{\partial v}\\ \frac{\partial y}{\partial u} & \frac{\partial y}{\partial v} \end{array} \right| \neq0 \\ &\left( = \left[ \frac{\partial (u,v)}{\partial (x,y)} \right]^{-1}=\left( \left| \begin{array}{ccc} \frac{\partial u}{\partial x} & \frac{\partial u}{\partial y}\\ \frac{\partial v}{\partial x} & \frac{\partial v}{\partial y} \end{array} \right| \right)^{-1} \right) \end{aligned}$ 。若 $\begin{cases} U=g_1(X,Y) \\ V=g_2(X,Y) \end{cases}$ ，则 $(U,V)$ 的联合密度函数为 $p(u,v)=p\left[ x(u,v),y(u,v) \right]\boldsymbol·|J|$ 。

这个方法实际上是二重积分的变量变换法。我们知道二维随机变量的在某范围内的概率值对应的就是对概率密度函数在有利于条件的区域上的积分，也即二重积分（私以为这就是概率密度函数的由来，联系数学分析的二重积分，我们求的是曲顶柱体的体积，其实曲顶柱体的高度就是这里的概率密度函数对于的值）。因而可以利用二重积分中的变量变换法将复杂区域转化为简单区域，其中Jocobi行列式的绝对值就表示两区域面积的比例。

由变量变换法的思想可以导出两种特殊类型随机变量的概率密度函数：

1.积的公式

设随机变量 $X,Y$ 相互独立，其密度函数分别为 $p_X(x),p_Y(y)$ ，则 $U=XY$ 的密度函数为： $p_U(u)=\int_{-\infty}^{+\infty}p_X\left( \frac{u}{y} \right)p_Y(y)\frac{1}{|y|}{\rm d}y$

2.商的公式

设随机变量 $X,Y$ 相互独立，其密度函数分别为 $p_X(x),p_Y(y)$ ，则 $U=\frac{X}{Y}$ 的密度函数为： $p_U(u)=\int_{-\infty}^{+\infty}p_X(uy)\,p_Y(y)\,|y|\,{\rm d}y$

下面举两个例子来巩固一下对上述公式的理解和应用。

e.g.2

设 $X,Y$ 相互独立，且 $X\sim U(0,1),Y\sim Exp(1)$ ，求 $Z=X+Y$ 的密度函数。

解：

方法一：分布函数法

（分布函数是求解分布问题的最根本的解法，我们首先利用该方法来求解这个问题）

作曲线簇 $x+y=z$ ，因 $X\in(0,1)$ ， $Y\in (0,+\infty)$ ，易知临界点为 $z=0,z=1$ 。如图所示（其实这里应该画出三维坐标轴来确定积分区域，但是教材偷懒了！因而我也就偷懒了……）：

对于一个固定的 $z$ ，概率密度函数非零的区域为虚线上方的区域（箭头所指）。

当 $z<0$ 时， $F_Z(z)=0$ ；
当 $0\leq z<1$ 时， $F_Z(z)=\int_{0}^{z}\int_{0}^{z-x}1·{\rm e}^{-y}{\rm d}y{\rm d}x=\cdots=z+{\rm e}^{-z}-1$
当 $z\geq 1$ 时， $F_Z(z)=\int_{0}^{1}\int_{0}^{z-x}1·{\rm e}^{-y}{\rm d}y{\rm d}x=\cdots=(1-e){\rm e}^{-z}+1$

综上所述：

$p_Z(z)=F^{'}_Z(z)= \begin{cases} 0,\quad z<0,\\ 1-{\rm e}^{-z},\quad 0\leq z<1,\\ ({\rm e}-1)^{-z},\quad z\geq 1. \end{cases}$

方法二：卷积公式

二.1：考虑对 $y$ 积分： $p_Z(z)=\int_{-\infty}^{+\infty}p_X(z-y)p_Y(y){\rm d}y$

作曲线簇 $x+y=z$ ，因 $X\in(0,1)$ ，易知两条临界直线为： $y=z,\,y=z-1$ ，如图：

当 $z<0$ 时， $p_Z(z)=0$ ；
当 $0\leq z<1$ 时， $p_Z(z)=\int_{0}^{z}1·{\rm e}^{-y}{\rm d}y=\cdots=1-{\rm e}^{-z}$
当 $z\geq 1$ 时， $p_Z(z)=\int_{z-1}^{z}1·{\rm e}^{-y}{\rm d}y=\cdots=(e-1){\rm e}^{-z}$

综上所述：

$p_Z(z)= \begin{cases} 0,\quad z<0,\\ 1-{\rm e}^{-z},\quad 0\leq z<1,\\ (\rm e-1){\rm e}^{-z},\quad z\geq 1. \end{cases}$

二.2：考虑对 $x$ 积分： $p_Z(z)=\int_{-\infty}^{+\infty}p_X(x)p_Y(z-x){\rm d}x$

作曲线簇 $x+y=z$ ，因 $Y\in(0,+\infty)$ ，易知两条临界直线为： $x=z,\,x=z+\infty=+\infty$ ，如图：

当 $z<0$ 时， $p_Z(z)=0$ ；
当 $0\leq z<1$ 时， $p_Z(z)=\int_{0}^{z}1·{\rm e}^{-(z-x)}{\rm d}x=\cdots=1-{\rm e}^{-z}$
当 $z\geq 1$ 时， $p_Z(z)=\int_{0}^{1}1·{\rm e}^{-(z-x)}{\rm d}x=\cdots=(e-1){\rm e}^{-z}$

综上所述：

$p_Z(z)= \begin{cases} 0,\quad z<0,\\ 1-{\rm e}^{-z},\quad 0\leq z<1,\\ (\rm e-1){\rm e}^{-z},\quad z\geq 1. \end{cases}$

上面利用了两种方法（实际上是三种）来求解这个问题。

实际上，变量变换法对一维和高维都成立，下面看一个一维的例子。

e.g.3

设随机变量 $X\sim U(0,1)$ ，求 $Y=-2{\rm ln}X$ 的分布。

方法一：分布函数法

当 $Y< 0$ 时， $F_Y(y)=0$ ；当 $Y\geq0$ 时，有：

$\begin{aligned} F_Y(y)&=P(Y\leq y)\\ &=P(-2{\rm ln}X \leq y)\\ &=P(X^2 \geq {\rm e}^{-y})\\ &=P(X \geq {\rm e}^{-\frac{1}{2}y}\,,or\, X \leq -{\rm e}^{-\frac{1}{2}y})\\ &=P(X\geq {\rm e}^{-\frac{1}{2}y})\quad(becuase\,X\in(0,1))\\ &=1-F_X({\rm e}^{-\frac{1}{2}y})\\ &=1-{\rm e}^{-\frac{1}{2}y} \end{aligned}$

两边关于 $y$ 求导，有：

$p_Y(y)=\frac{1}{2}{\rm e}^{-\frac{1}{2}y}$

综上所述：

$p_Y(y)= \begin{cases} \frac{1}{2}{\rm e}^{-\frac{1}{2}y},\quad y\geq0,\\ \quad\quad 0,\quad其他. \end{cases}$

方法二：变量变换法

做变换： $y=-2{\rm ln }x$ ，则

$x={\rm e}^{-\frac{1}{2}y} \,(x=-{\rm e}^{-\frac{1}{2}y}舍，因X\in(0,1))$
$|J|=\left|\frac{dx}{dy} \right|=\frac{1}{2}{\rm e}^{-\frac{1}{2}y}$

则

当 $Y<0$ 时， $p_Y(y)=0$ ；当 $Y\geq0$ 时：

$p_Y(y)=p_X(x(y))·|J|=\frac{1}{2}{\rm e}^{-\frac{1}{2}y}$

综上所述：

$p_Y(y)= \begin{cases} \frac{1}{2}{\rm e}^{-\frac{1}{2}y},\quad y\geq0,\\ \quad\quad 0,\quad其他. \end{cases}$

可以看出 $Y\sim {\rm Exp}\left(\frac{1}{2}\right)$ 。

下面我们看一个非常容易出错的题目。

e.g.4

设随机变量 $X,Y$ 独立同分布于 $N(0,1)$ ，求 $U=X^2+Y^2,\quad V=\frac{X}{Y}$ 的联合密度函数 $p_{U,V}(u,v)$ 。

显然这里需要用到变量变换法。最直接的就是利用题设条件做变换：

$\begin{cases} u=x^2+y^2\\ v=\frac{x}{y} \end{cases}$

直观上考虑到通过解这个变换的逆变换再求Jocobi行列式会比较复杂，因而我们利用这个性质：

$\begin{aligned} J&=\frac{\partial (x,y)}{\partial (u,v)}= \left| \begin{array}{ccc} \frac{\partial x}{\partial u} & \frac{\partial x}{\partial v}\\ \frac{\partial y}{\partial u} & \frac{\partial y}{\partial v} \end{array} \right| \\ & = \left[ \frac{\partial (u,v)}{\partial (x,y)} \right]^{-1}=\left( \left| \begin{array}{ccc} \frac{\partial u}{\partial x} & \frac{\partial u}{\partial y}\\ \frac{\partial v}{\partial x} & \frac{\partial v}{\partial y} \end{array} \right| \right)^{-1}\end{aligned}$

即：

$\begin{aligned} J&=\frac{1}{J^{-1}}\\&=\left( \left| \begin{array}{ccc} \frac{\partial u}{\partial x} & \frac{\partial u}{\partial y}\\ \frac{\partial v}{\partial x} & \frac{\partial v}{\partial y} \end{array} \right| \right)^{-1}\\&=\frac{1}{ \left| \begin{array}{ccc} 2x & 2y\\ \frac{1}{y} & -\frac{x}{y^2} \end{array} \right| }\\&=-\frac{1}{2(\frac{x^2}{y^2}+1)}\\&=-\frac{1}{2(v^2+1)} \end{aligned}$

由于 $X,Y$ 独立同分布，则当 $0<u<+\infty,\,-\infty<v<+\infty$ 时，

$\begin{aligned} p_{U,V}(u,v)&=p_{X,Y}[\,x(u,v),y(u,v)\,]·|J|\\&=p_X[\,x(u,v)\,]·p_Y[\,y(u,v)\,]·|J|\\ &=\frac{1}{\sqrt{2\pi}}{\rm exp}\left\{-\frac{x^2(u,v)}{2}\right\}·\frac{1}{\sqrt{2\pi}}{\rm exp}\left\{-\frac{y^2(u,v)}{2}\right\}·\left|-\frac{1}{2(v^2+1)}\right| \\ &=\frac{1}{4\pi(v^2+1)}{\rm exp}\left\{ -\frac{x^2(u,v)+y^2(u,v)} {2}\right\} \\&=\frac{1}{4\pi(v^2+1)}{\rm exp}\left\{ -\frac{u}{2} \right\} \end{aligned}$

我们算出来了 $p_{U,V}(u,v)$ ，而且自作聪明，完全没有求那个看似复杂的逆变换，并且在上面的计算中巧妙地利用了等式： $u=x^2(u,v)+y^2(u,v)$ ，沾沾自喜。然而很遗憾的是，这个答案是错的。究其原因在于没有注意到变量变换法要求所做的变换存在唯一的反函数。所以下面我们就老老实实求一下逆变换，看看究竟错在哪。

求解逆变换的过程我就不写了，直接给出逆变换：

$\begin{cases} x=\frac{v}{\sqrt{1+v^2}}\sqrt{u}\\ y=\frac{1}{\sqrt{1+v^2}}\sqrt{u} \end{cases}\quad (1) ,\quad or\quad \begin{cases} x=-\frac{v}{\sqrt{1+v^2}}\sqrt{u}\\ y=-\frac{1}{\sqrt{1+v^2}}\sqrt{u} \end{cases}\quad (2).$

可以看出反函数不唯一，因此要分开讨论。

当我们研究(1)时，可以看到 $y\in (0,+\infty)$ ，而 $x$ 可以取遍 $(-\infty,+\infty)$ ，这样确定的 $(x,y)$ 区域可以使 $u$ 取遍 $(0,+\infty)$ 、 $v$ 取遍 $(-\infty,+\infty)$ 。同样地，当我们研究(2)时，可以看到 $y\in (-\infty,0)$ ，而 $x$ 可以取遍 $(-\infty,+\infty)$ ，这样确定的 $(x,y)$ 区域可以使 $u$ 取遍 $(0,+\infty)$ 、 $v$ 取遍 $(-\infty,+\infty)$ 。这样我们将区域分两部分讨论，使得变化前后所有可能取得的情况都得到了讨论。从而：

$\begin{aligned} p_{U,V}(u,v)&=p_{X,Y}[\,x(u,v),y(u,v)\,]·|J|\\ &=p_{X,Y}\left(\frac{v}{\sqrt{1+v^2}}\sqrt{u},\frac{1}{\sqrt{1+v^2}}\sqrt{u}\right)·\left|-\frac{1}{2(v^2+1)} \right| \\&+p_{X,Y}\left(-\frac{v}{\sqrt{1+v^2}}\sqrt{u},-\frac{1}{\sqrt{1+v^2}}\sqrt{u}\right)·\left| -\frac{1}{2(v^2+1)}\right|\\ &= \begin{cases} \frac{1}{2\pi(1+v^2)}{\rm exp}\left\{ -\frac{u}{2}\right\},\quad 0<u<+\infty,-\infty<v<+\infty\\ 0,\quad其他 \end{cases} \end{aligned}$

可以看到这个结果是之前的两倍。

离散型和连续型的结合

这里仅举一个例子。

e.g.5

已知 $P(X=-1)=0.4,P(X=1)=0.6$ ， $Y\sim N(\mu,\sigma^2)$ ，求 $Z=X+Y$ 的分布。

离散型和连续型的结合是我们从未见过的类型，要求分布，就从分布的定义出发，即从分布函数出发。

解：

$\begin{aligned} F_Z(z)&=P(Z\leq z)\\ &=P(X+Y\leq z)\\ &=P(X+Y\leq z,X=-1)+P(X+Y\leq z,X=1)\\ (条件概率)&=P(X=-1)P(X+Y\leq z\,|\,X=-1)\\&\quad +P(X=1)P(X+Y\leq z\,|\,X=1)\\ &=0.4·P(Y\leq z+1)+0.6·P(Y\leq z-1)\\ &=0.4·\Phi\left(\frac{z+1-\mu}{\sigma}\right)+0.6·\Phi\left(\frac{z-1-\mu}{\sigma}\right) \end{aligned}$

对上式两边关于 $z$ 求导：

$p_Z(z)=F'_Z(z)=\frac{0.4}{\sigma}\varphi\left(\frac{z+1-\mu}{\sigma}\right)+\frac{0.6}{\sigma}\varphi\left(\frac{z-1-\mu}{\sigma}\right)$

因

$\varphi(y)=\frac{1}{\sqrt{2\pi}}{\rm e}^{-\frac{y^2}{2}}$

上式可进一步化简，此处省略。

综上所述：

$p_Z(z)=\frac{0.4}{\sigma}\varphi\left(\frac{z+1-\mu}{\sigma}\right)+\frac{0.6}{\sigma}\varphi\left(\frac{z-1-\mu}{\sigma}\right),\quad z\in(-\infty,+\infty)$

编辑于 06-13

「真诚赞赏，手留余香」

还没有人赞赏，快来当第一个赞赏的人吧！

写下你的评论...

蓝衬衫2020-06-21
想请问下非相互独立的二维随机变量的最小值函数怎么算呢
CoffeeCat (作者) 回复蓝衬衫2020-06-22
这个就有点刁钻了。。我还没见过这样的

张飞爱喝北冰洋2020-06-05
看完了，写的挺好的。就是变量变换法的原理不太理解，上下限也找不到
CoffeeCat (作者) 回复张飞爱喝北冰洋2020-06-06
变量变换法的原理，可以参考数学分析教材，联系矩阵的几何意义（对向量旋转），可以帮助理解；上下限的找法，可以先找一道比较简单的题目，画出二重积分的图形（三维），确定xy轴后z的取值范围就是上下限（其实就是二重积分）

翟言利2020-04-20
写得很棒，虽然我看得一知半解的，还是有种醍醐灌顶的感觉
CoffeeCat (作者) 回复翟言利2020-06-06
3q

之汴先生07-04
泊松可加性一定是加号吗，如果是减号是不是就不满足了？
之汴先生回复之汴先生07-04
我遇到过一题就是Xi独立且服从参数为1/2的泊松分布，求X2i-X2i-1的期望与方差，我觉得应该满足参数为0的泊松哈哈哈，可答案写的是期望为0方差为1，这是为什么
哈哈哈回复之汴先生10-25
减号不满足泊松分布可加性

蓝潮06-13
二.1和二.2中z>1的情况积分好像错了，我算出来是(e-1)e^(-z)
CoffeeCat (作者) 回复蓝潮06-13
嗯，综上所述那里打错了，谢谢提醒。

之汴先生05-29
e.g.1中对z的分类依据是什么呢
CoffeeCat (作者) 回复之汴先生05-29
x1 x2属于[0,1]，z是他们的差值，以±0.5为界可以划分出不同的积分区域

鸿哲斋扛把子2020-11-04
当两个随机变量的pdf很复杂的时候，积分很难求怎么办。比如是两个对数正态分布，求他们积的随机变量的pdf。

鸿哲斋扛把子2020-09-15
我看到都是只有两个随机变量的，有没有求三个甚至多个随机变量函数的例子。
CoffeeCat (作者) 回复鸿哲斋扛把子2020-09-15
这是多元统计的东西了吧，而且高维情况下一般只考虑多元正态分布，可以找一本多元统计的书看看
鸿哲斋扛把子回复CoffeeCat (作者) 2020-09-16
感谢，但是我现在遇到的问题就是一个因变量y值受多个变量xi值的影响，每个xi值都有各自的pdf，想求y值的pdf。

CoffeeCat (作者) 2020-04-08
是的

merty2020-04-08
这概统跟我学的难度不一样。这是数统系的内容吗
CoffeeCat (作者) 回复merty05-29
是的，这对于统计系算是基础吧，还有更难的

明原黑2019-11-30
非专业看不懂啦，哈哈
CoffeeCat (作者) 回复明原黑2019-11-30
哈哈

多维随机变量函数的分布

离散场合下的卷积公式

连续场合下的卷积公式

最大值、最小值分布

变量变换法

离散型和连续型的结合

文章被以下专栏收录

概率论与数理统计

推荐阅读

多维随机变量的特征数

如何深刻的理解随机变量

离散型随机变量的常见分布

27-概率论（多维随机变量及其分布）03

22 条评论