本文将介绍随机变量的期望、方差等数字特征。

期望

定义

离散型随机变量

设离散型随机变量 的概率分布为 ,若和式

绝对收敛,则称其值为 期望,记作

连续型随机变量

设连续型随机变量 的密度函数为 。若积分

绝对收敛,则称其值为 期望,记作

统一定义

设随机变量 的分布函数为 ,若 Stieltjes 积分

绝对收敛,则称其值为 期望,记作

期望的性质

线性性

若随机变量 的期望存在,则

  • 对任意实数 ,有

随机变量乘积的期望

若随机变量 , 的期望存在且 , 相互独立,则有

注意:上述性质中的独立性 并非 必要条件。

期望与概率的转化

对于随机事件 ,考虑其示性函数

根据定义可以求得其期望 。这一转化在实际应用中非常常见。

条件分布与条件期望

我们之前研究过条件概率,类似的也可以提出所谓条件期望的概念。

定义

对于两个随机变量 ,,在已知 的条件下 的概率分布(密度函数)称之为 条件概率分布(条件概率密度),分别记作

在此条件下, 的期望称为 条件期望,记作

条件期望的性质

条件期望的诸多性质可由条件概率推知,在此不做赘述。

值得一提的是 一般是随机变量 的函数,且这个函数通常不是线性的。但实际上有

上式称作 全期望公式

应用

有一根长为 的 Pocky,每次随机折成两段。若右边一段的长度不大于 则停止,否则对右边一段重复上述过程。求重复次数的期望。

方差

定义

设随机变量 的期望 存在且期望

也存在,则称上式的值为随机变量 方差,记作 。方差的算术平方根称为 标准差,记作

方差的性质

若随机变量 的方差存在,则

  • 对任意常数 都有

协方差与相关系数

一般来说,等式 并不成立,我们自然会提出两个问题:

  • 之间相差的部分到底是什么。
  • 在什么情况下相等。

对于第一个问题,我们引入协方差作为解答。

协方差的定义

对于随机变量 ,称

协方差,记作

协方差的性质

对于随机变量 ,有

  • 对任意常数 ,有

同时协方差与方差也有如下联系:

对于刚才提出的第二个问题,不难看出 当且仅当 。一个直观的必要条件是 独立,因为此时有

但这个条件并不是充分的。为了描述满足 的随机变量 , 之间的关系,我们引入相关系数

相关系数

对于随机变量 ,称

Pearson 相关系数,记作

Pearson 相关系数描述了两个随机变量之间线性关联的紧密程度。 越大,则 之间的线性关联程度越强。不难证明 ,且 仅可能出现在以下两种情况

  • 当存在实数 和正实数 使得 时,有
  • 当存在实数 和负实数 使得 时,有

时我们称随机变量 不相关,此时 之间不存在线性关系。

对于这一小节开头提到的第二个问题,我们给出结论: 的充要条件就是 , 中的某一个以概率 取常值,或 不相关。