title: 信息熵是什么? - 知乎
category: default
tags:
- www.zhihu.com
created_at: 2021-05-24 08:43:12
original_url: https://www.zhihu.com/question/22178202/answer/223017546
信息熵是什么? - 知乎
信息熵名字起的太抽象了,介绍的文章都不易懂
关注者 2,366
被浏览 492,455
D.Han 科技盐究员
阅读大概需要十五分钟。
相信通过这个回答的介绍,能够使一个对信息熵毫无了解的人,基本上明白信息熵是什么,以及有什么用。
熵的概念首先在热力学中引入,用于表述热力学第二定律。波尔兹曼研究得到,热力学熵与微观状态数目的对数之间存在联系,并给出了公式:
这个公式也作为他最骄傲的成绩,刻在了他的墓碑上。
信息熵的定义与上述这个热力学的熵,虽然不是一个东西,但是有一定的联系。熵在信息论中代表随机变量不确定度的度量。一个离散型随机变量
这个定义的特点是,有明确定义的科学名词且与内容无关,而且不随信息的具体表达式的变化而变化。是独立于形式,反映了信息表达式中统计方面的性质。是统计学上的抽象概念。
所以这个定义如题主提到的可能有点抽象和晦涩,不易理解。那么下面让我们从直觉出发,以生活中的一些例子来阐述信息熵是什么,以及有什么用处。
直觉上,信息量等于传输该信息所用的代价,这个也是通信中考虑最多的问题。比如说:赌马比赛里,有4匹马
接下来,让我们将哪一匹马获胜视为一个随机变量
例如:问题1:A获胜了吗?问题2:B获胜了吗?问题3:C获胜了吗?最后我们可以通过最多3个二元问题,来确定
如果
如果
如果
如果
那么很容易计算,在这种问法下,为确定
那么我们回到信息熵的定义,会发现通过之前的信息熵公式,神奇地得到了:
在二进制计算机中,一个比特为0或1,其实就代表了一个二元问题的回答。也就是说,在计算机中,我们给哪一匹马夺冠这个事件进行编码,所需要的平均码长为1.75个比特。
平均码长的定义为:
很显然,为了尽可能减少码长,我们要给发生概率
那么
霍夫曼编码就是利用了这种大概率事件分配短码的思想,而且可以证明这种编码方式是最优的。我们可以证明上述现象:
这可能是信息熵在实际工程中,信息熵最最重要且常见的一个用处。
最后,解释下信息熵公式的由来:
信息论之父克劳德·香农,总结出了信息熵的三条性质:
事件
那么信息熵
香农从数学上,严格证明了满足上述三个条件的随机变量不确定性度量函数具有唯一形式:
其中的
补充一下,如果两个事件不相互独立,那么满足
比如一个点到点通信系统中,发送端信号为
写这个颇费功夫,希望大家能在评论区反馈下,自己读完后有没有收获。
赞同 1624
子微鱼2017-08-31
和国情没有关系.....一个公式吓跑一半潜在读者是科普书放之四海皆准的真理,还没有被那些公式吓跑留在这的,都是死硬派^_^
还是不懂,只能硬了
孙鼎昌2017-10-04
关于赛马事件,“神奇的一致”的论证是错误的,会误导一知半解的读者。显而易见的,若有两匹马,一匹获胜概率为0.8,另一匹为0.2,则H(X)? 答案是0.72,而不是1.2。
我也想说这个问题,神奇的一致只是个巧合,把数据换一换完全不一致,更不能说神奇
青青2017-08-31
虽然我没看懂,但你回复评论者的那句国情是多数人的文化素质有待提高真的触动到我,我觉得我就是这其中的一员。
雄立东方2017-08-30
感觉讲的太多,没有学过通原和信息论的人可能会懵逼的
山川兄2017-08-31
看了两秒钟就瞬间不想看
莉莉安2020-01-01
前边的差不多看懂了,概念解释的还是很清楚的,后边的互信息有点没看懂。
x = {A,B,C,D} 用问几次问题加权的结果不总等于信息熵? (1/4, 1/4, 1/4, 1/4} 加权 1/4 x 1 +1/4 x 2 +1/4 x 3 + 1/4 x 3 = 9/4, while (1/4 log 4 ) * 4=2
狂猎2018-05-09
如果四匹马夺冠概率相同那么算出来是 1/4*1+1/4*2+1/4*3+1/4*3=9/4
编码长度不是应该是2么
金生水2018-04-11
作者说的不清楚,建议多写一些
建议你去看教材
明眸hz2018-02-07
虽然不知道写的是啥,但是感觉很吊,赞一个
永不言弃2018-01-14
很有收获,谢谢! 不过我想问问“那么 \{A,B,C,D\} 四个实践,可以分别由 \{0,10,110,111\} 表示”,如果用{0 1 10 11}来编码呢,这意味着平均码长可以小于1.75?
这个问题有答案了吗?我在自学信息论,也好奇这个问题。。。不知道为什么是编码要是0 10 110 1110这样。。。
神探潘仁美2017-09-24
受教,一直在想到底该怎么理解。
学习第一其他免谈2017-09-20
感谢大佬科普。老师让写一篇“我身边的信息熵”的论文,然而上这课有什么用都不知道😭,就是感觉是个很抽象的东西
mathematical2017-08-31
7分钟,我一直怀疑自己阅读速度慢,在答主写的的时间内看完帮助我提升了自信,非常感谢,当然作为CS学生,数据结构,计算机网络和概率论与数理统计在相当大程度上帮助了我对这篇文章的理解。
给答主点个赞。
灰烬之灵2017-08-30
很有收获!学过,高效的温习了一遍。谢谢
我也觉得自己写的挺用心,为啥没几个人看呢...
跟用心无关,话题不同而已。你写影评、撩妹攻略,分分钟上百赞。《big bang theory》里莱纳德做个报告,与会者50人,其实已经非常多了。曲高和寡,国情是多数人的文化素质还有待够高,10年后20年后此文会比现在火得多。
查看全部 7 条回复
查看全部 6 条回复
评论由作者筛选后显示
发布
继续浏览内容
知乎
发现更大的世界
打开
Chrome
继续
原网址: 访问
创建时间: 2021-05-24 08:43:12
目录: default
标签: www.zhihu.com