假设随机变量 X 的期望μ和方差 σ 都存在, 对于任意正数 ϵ>0 , 都有:
P(|x−μ|>ϵ)≤σ2ϵ2 从不等式本身的意义来看, 它用随机变量的期望与方差给出了长尾概率的范围。例如,对于正态分布 X∼N(0,σ) 来说, x 大于3σ的概率: P(|x|>3σ)≤19 ,当然, 这个范围给的有点大了。现在来推导一下这个不等式。需要用到Markov不等式
假设 X 是一个不小于0的随机变量, 则: P(X>a)≤E(X)a 证明过程如下:
E(X)=∫∞0xp(x)dx=∫a0xp(x)dx+∫∞axp(x)dx≥∫∞axp(x)dx≥a∫∞ap(x)dx=aP(X>a)这个不等式只使用了随机变量的期望就给出了长尾分布的概率范围,但很明显, 太粗放了, 几乎不能提供有用信息。例如,假如人口年龄分布是一个在 [0,80] 之间的均匀分布(只是假如, 不是实际情况),随机锁定一个人, 他的年龄大于1岁的概率 P(X>1)<40 ,囧。大于40的概率: P(X>40)≤1 , 再囧。
P(|x−μ|>ϵ)=P(|x−μ|2>ϵ2)≤E(|x−μ|2)ϵ2=σ2ϵ2
