首页 > 代码库 > 熵、相对熵与互信息

熵、相对熵与互信息

一、熵

熵的定义

技术分享

其对数log的底为2,若使用底为b的对数,则记为技术分享。当对数底为技术分享时,熵的单位为奈特。

技术分享表示数学期望,如果技术分享,则随机变量技术分享的期望值为,

技术分享

技术分享技术分享关于技术分享的分布自指数学期望。而熵为随机变量技术分享的期望值,其技术分享技术分享的概率密度函数,则可写为,

技术分享

引理技术分享

证明技术分享

 

二、联合熵与条件熵:

对于服从联合分布为技术分享的一对离散随机变量技术分享

联合熵的定义

技术分享

技术分享条件熵的定义

技术分享

定理链式法则

技术分享

证明

技术分享

等价记为

技术分享

推论

技术分享

技术分享,但技术分享

 

三、相对熵与互信息

两个概率密度函数为技术分享技术分享之间的相对熵或Kullback-Leibler距离定义为,

技术分享

定义 考虑两个随机变量技术分享技术分享,它们的联合概率密度函数为技术分享,其边际概率密度函数分别是技术分享技术分享

互信息技术分享为联合分布技术分享和乘积分布技术分享技术分享之间的相对熵,

技术分享

 

四、熵和互信息的关系

还可以将互信息写为,

技术分享

由此可以看出,互信息技术分享是在给定技术分享知识条件下技术分享的不确定度的缩减量。则,

技术分享,联系到前面的技术分享,可得,

技术分享

最后得出,技术分享

因此,随机变量与自身的互信息为该随机变量的熵。有时,熵称为自信息就是这个原因。

熵和互信息的关系如下,

技术分享

 

五、熵、相对熵与互信息的链式法则

一组随机变量的熵等于条件熵之和。

定理 设随机变量技术分享服从技术分享,则

技术分享

证明一

技术分享

证明二,由

技术分享

可得:

技术分享

给定技术分享时由于技术分享的知识而引起关于技术分享的不确定度的缩减量,即条件互信息的定义

技术分享

定理 互信息的链式法则

技术分享

证明

技术分享

条件相对熵的定义

技术分享

定理 相对熵的链式法则

技术分享

证明

技术分享

 

熵、相对熵与互信息