概率统计随机过程之条件期望与重期望公式
概率统计随机过程之条件期望与重期望公式
之前对条件期望的理解有一些偏差,现在重新看了下条件期望的内容与重期望公式。注意(X|Y)的条件期望实际上是关于Y的函数,而重期望公式则与分区加权求和有着本质联系,提供了求X期望的另一种方式。
条件数学期望
如果我们对条件分布求期望,则称为条件数学期望。在离散分布列和连续密度函数的定义方式如下,以二维举例:
X关于Y=y的条件期望: E(X∣Y=y)=⎩⎨⎧i∑xiP(X=xi∣Y=y),(X,Y)为二维离散随机变量∫−∞∞xp(x∣y)dx,(X,Y)为二维连续随机变量(1)
Y关于X=x的条件期望: E(Y∣X=x)=⎩⎨⎧i∑yiP(Y=yi∣X=x),(X,Y)为二维离散随机变量∫−∞∞yp(y∣x)dy,(X,Y)为二维连续随机变量(2)
注意,E(X∣Y=y)是在y为特定值时,对x求和/积分,抹去了x的随机性,得到一个关于y的函数。同理,E(Y∣X=x)抹去的是y的随机性,得到一个关于x的函数。
条件期望E(X∣Y=y)和无条件期望E(X)的一大区别是,E(X)是一个数,而条件期望E(X∣Y)是一个函数g(y)。
举个例子,如用X表示中国成年人的身高,则E(X)=170表示中国成年人的平均身高为170 cm,是一个具体的数字。若用Y表示中国成年人的足长,则E(X∣Y=y)表示足长为y的中国成年人的平均身高,根据研究可知 E(X∣Y=y)=6.876y 这显然是一个与y相关的函数,对y的不同取值,条件期望的取值也在变化。可以记: g(y)=E(X∣Y=y) 进一步,还可以将条件期望看成是随机变量Y的函数,即E(X∣Y)=g(Y),而将E(X∣Y=y)看成是Y=y时E(X∣Y)的一个取值。从这个角度来看,E(X∣Y)也是一个随机变量。
如果条件期望也是一个随机数,那么条件期望的期望是什么呢?下面就用重期望公式做进一步说明。
重期望公式
前面提到,g(Y)=E(X∣Y)也是一个随机变量,如果我们对其求期望,以连续函数为例,注意随机变量是Y: E[g(Y)]=∫−∞∞E(X∣Y=y)pY(y)dy 我们将条件期望的定义(1)式代入可得: E[g(Y)](全概率公式)(提出x)(求x的边际pdf)=∫−∞∞[∫−∞∞xp(x∣Y=y)dx]pY(y)dy=∫−∞∞∫−∞∞xp(x,y)dxdy=∫−∞∞x{∫−∞∞p(x,y)dy}dx=∫−∞∞xpX(x)dx=E(X)(3) 我们“惊讶”的发现,条件期望的期望竟然是X的无条件期望!由此,我们给出重期望公式:
定理:(重期望公式)设(X,Y)是二维随机变量,且E(X)存在,则
E(X)=E[E(X∣Y)]
重期望公式是概率论中比较深刻的一个结论。我们也可以换个角度理解:我们找到一个与X相关的量Y,用Y的不同取值(要互斥)把X划分成若干小区域(场景),现在小区域上求X的期望或均值,然后再根据Y的出现概率对各个小区域的期望E(Xyi)求加权平均,即可求出整体X的期望。
具体一些,重期望公式也可以写成如下形式: E(X)=⎩⎨⎧i∑E(X∣Y=yi)P(Y=yi),离散场景∫−∞∞E(X∣Y=y)PY(y)dy,连续场景
随机个随机变量和的数学期望
设X1,X2,⋯为一系列独立同分布的随机变量,随机变量N只取正整数值,且N与{Xn}独立,证明: E(i=1∑NXi)=E(X1)E(N)
证明:由重期望公式可知: E(i=1∑NXi)({Xn}与N独立)({Xn}i.i.d)=E[E(i=1∑NXi∣N)]=i=1∑∞E(i=1∑NXi∣N=n)P(N=n)=i=1∑∞E(i=1∑nXi)P(N=n)=i=1∑∞nE(X1)P(N=n)=E(X1)i=1∑∞nP(N=n)=E(X1)E(N)
条件期望的其他推论
- Var(X)=E[Var(X∣Y)]+Var[E(X∣Y)]
证明: E[Var(X∣Y)]=E{E(X2∣Y)−[E(X∣Y)]2}=E(X2)−E[E2(X∣Y)]Var[E(X∣Y)]=E[E2(X∣Y)]−[E(X)E⋅E(X∣Y)]2=E[E2(X∣Y)]−[E(X)]2⎭⎬⎫⇒E[Var(X∣Y)]+Var[E(X∣Y)]=E(X2)−E[E2(X∣Y)]+E[E2(X∣Y)]−[E(X)]2=E(X2)−E2(X)=Var(X)
- E[f(Y)∣Y]=f(Y)
证明: 当随机变量Y取到固定值y时(Y=y),就不存在随机性了。所以对于∀Y=y,有 E[f(Y)∣Y=y]=E[f(Y=y)∣Y=y]=E[f(y)]=f(y) 所以,有E[f(Y)∣Y]=f(Y)。
- E[g(X)⋅Y∣X]=g(X)E[Y∣X]
- E(XY)=E[X⋅E(Y∣X)]
- Cov[X,E(Y∣X)]=Cov(X,Y)