title: 香农的信息论
category: default
tags:
- www.zhihu.com
created_at: 2021-03-23 20:00:30
original_url: https://www.zhihu.com/question/27068465/answer/98422117
香农的信息论
感觉说的都会大白话啊。
本草纲目 发过几篇ISIT, TCOM,离开信息论通信多年
涛吴 等 361 人赞同了该回答
以前读本科的时候,当讲到信源编码率等于H(X),信道容量等于max_p(X) I(X,Y)的时候,也觉得没什么,只是记到脑子里面而已。直到读博的时候再上信息论的课,才了解到这些结论的证明。
这些定理的结论都是充要条件,所以证明有两个方向。
第一,Achievability. 即提出一种编码方式,以H(X) (或I(X,Y))为编码率,可以达到在码长无限的情况下错误率逼近于零。这样就证明了码率<=H(X) (或I(X,Y))。这种编码方式是理论上成立的,只是复杂度很高而已。方法叫typical set coding,复杂度是指数级的。
第二, Converse,即利用信息论中的不等式结论(比如Fano's inequity)来证明码率>= H(X) (或I(X,Y))。这就证明了自己在第一步里提出来的方法是最优的。
另外,Shannon也证明了信源信道编码是可以分开的,合起来编码不会比分开更优,所以几十年来信源编码和信道编码就像是分道扬镳一样,各自发展。
所以,Shannon的论文定义了点对点通信中两个最重要的问题,给出了解法,并且证明了他的解法在速率角度是最优的。 在Shannon论文前后,通信和编码领域也都有着发展。不过,在他的论文以后,所有人的论文都多了一个benchmark: Shannon limit. 大家都朝着Shannon给出的理论界努力。香农提出的编码方法是很复杂的,之后很多人的努力就是提出工程上可行的方案,比如Convolutioal code, Turbo code, LDPC code 之类,目前比较好的能够接近Shannon limit的是LDPC以及Turbo.
Shannon打开了一扇窗,指明了数字通信和压缩系统发展的目标,同时,信息熵的定义也被其他学科,比如统计,计算机,广泛应用。我认为这是他的主要贡献。IEEE信息论协会做了一个官方的纪念视频: https://www.youtube.com/watch?v=pHSRHi17RKM
在Shannon之后,还有无数科学家和工程师在通信领域努力,达到Shannon得出的理论边界。举一些在信道编码里面的例子。
Robert Gallager: 60年代就发明了LDPC code,可惜由于当年计算能力的限制,没有被重视,直到2000年左右被重新发现,现在已经成为公认的十分接近Shannon的信道容量定理的编码,已经被加入各种无线通信标准中。他有很多有名的学生,比如Elwyn Berlekamp, 做无线通信的David Tse, 做网络编码的Muriel Medard.
Irving Reed and Gustave Solomon: 发明了Reed-Solomon code,走的是代数路线。这种编码用在CD/DVD, 卫星通信(70年代开始),数字电视中.
Elwyn Berlekamp: 发明了Reed-Solomon码的解码算法。他还从Jim Simons手上接手了一个对冲基金,弄出一年55.9%的收益以后又卖回给Jim Simons回Berkeley教书去了。那个基金叫大奖章基金,那家公司叫Renaissance Technologies. 他有一个学生叫Robert Li, 网络编码的发明人之一。
Andrew Viterbi: 发明了Viterbi算法作为卷积码的译码算法,由卷积码延伸出来的Turbo code也是一种capacity achieving code. 该算法也是Hidden Markov Model里求Max Likelihood sequence的经典算法。同时,他还创建了一家公司,叫Qualcomm (高通)。
还有很多人,不一一多说,可以看看历届Shannon Award的获得者:Claude E. Shannon Award. 还有一个不得不提的人,Ralf Koetter,他是近年来信息论界少有的代数和概率功底都极为深厚的人,可惜英年早逝。
Shannon在学术上活跃的时间大约在40-50年代,然后他就开始玩其他东西了。比如他做了能走迷宫的机械老鼠。更有意思的应该还是他和Thorp去拉斯维加斯耍赌场的故事。他们做了一个装置,可以在转盘小球刚开始转动的时候根据小球运动发现出转盘的偏差,从而计算出小球落到某些格子的概率可能会更大。Thorp后来了一本很流行的书,叫Beat the dealer, 讲他在blackjack上的研究。有一本书叫Fortune's Formula,讲做信息论的人在赌博方面的故事。
时隔60年,点对点通信的问题基本已经解决,物理层通信已经非常成熟和标准化。信息论圈子早已开始关注其他的热点。比如2000年开始的网络信息论和网络编码,2006年左右开始的compressive sensing, 2008-09那时候开始的interference alignment, 还有2010年之后David Tse开始做bioinformatics. 可惜这些热点除了Compressive sensing在医学MRI中有比较大的实用价值以外,其他的目前大都缺乏实用的地方。
赞同 361
人气王揭示板2016-05-03
信息时代的先知。虽然没给出具体算法。可是晚年去研究走迷宫的老鼠这种现在ai轻易能解决的问题,略像牛顿。
研究老鼠不算晚年,香农晚年老年痴呆了。。。
……跟牛顿也不一样吧 ai也不是万能的 而且现在很多领域ai也不如传统方法
Aaron2016-05-02
我说一个吹毛求疵的abuse,LDPC码并不是capacity achieving,答主后面也说了是接近。另外一个,香农除了答主提到的文章以外,还有很多很有意义的论文,以信道编码为例的话,比如码的有限长性能分析,香农给出的bound仍是目前最优秀的bound。个人意见,可供答主参考。
你说的没错,谢谢指正,我做了一点修改
shannon给出的有限码长bound中,貌似只有awgn中的lower bound目前还是最好的了吧。
查看全部 8 条回复
一云leisurely2016-05-02
所以说,还是没看懂
Qi Chen2016-05-03
网络信息论70年代就开始有人在做,而且一度比较火;只是在沉寂了20多年后,由于互联网的带动,再次火起来。对于网络编码,请教一下,在答主看来,实际问题中的constraints主要是哪些?
....杨伟豪不是在cuhk么,为什么你不问他...
Raymond还是以做理论为主,他当年在贝尔实验室的时候是做queuing theory,并不是做网络,虽然他学了一些网络的内容。我更希望能听听来自工业界人士的看法。
展开其他 3 条回复
可曾记得爱2019-03-10
信源信道可分这个是香农证明的嘛?那为啥本世纪初joint channel and source encoding还颇火了一阵呢?
阎凡朴2018-05-10
答主太厉害了,电子系的phd竟然转金融,太强了...是电子方向不好找工作吗
amour52016-05-08
二维世界自有存在……不是人类完全掌控的……
喵了个咪2016-05-08
看不懂,还是要点赞支持干货。。
圆珠笔2016-05-03
koetter确实可惜 少有的通吃代数编码和图码的人。
kötter生前招的最后一个博士生去年毕业了,我们所基本也没有人搞代数码了。
总觉得性能上代数码很难超LDPC啊。。
查看全部 8 条回复
一位无名氏2016-05-03
我也不知道?️反正我只知道香农韦弗的传播模式
fox fox2016-05-03
外行飘过,能不能再通俗的讲一讲香农的理论到底是怎么个牛法?
北原和纱2016-05-03
先向毕业的学长致个敬。
最后一段我稍稍有些不同的意见:近五年火起来的caching和machine learning都在IT中找到了相应的位置,更不用说一直有军工需求的secrecy communication。
如果要说没有实用价值不如说是用户对速率的需求没有我们假设的那么高。
很久没有关注圈内最新动向了,如果IT的方法能为一些machine learning算法找到理论基础那还是非常有意义的。前几年我的感觉是在美国做IT的找本行工作要不去学术界要么去Qualcomm,所以才会给我那种感觉。网络编码的问题就在于实际中速率不是major constraint,用编码反而增加了系统复杂度,所以工业界一直没怎么实用。Secrecy communication我一直没有太了解。
抱歉才看到回复,ML的这个确实是比较火了才被加入进IT分支当中的。是啊,IT的找工作确实不好找,去业界一般都要转方向。。。单纯做研究的话,很多钱都是政府出的项目里来的。 转方向也好,这个要做到挣钱确实有点难。
原网址: 访问
创建时间: 2021-03-23 20:00:30
目录: default
标签: www.zhihu.com