发布供求信息     推广企业产品
管理企业商铺     进入商务中心
用户:   免费注册
密码:  
 
当前位置: 首页 » 资讯 » 人物访谈 » 正文

万柯访谈录:香农与他的猜心机

放大字体  缩小字体 发布日期:2017-07-10  来源:万新宇  浏览次数:1018
访问者:万新宇,简称:万
受访者:柯玉鹏,某研究院院长。简称:柯
 
万:柯院长,最近读任总在全国科创大会上的发言,他表达了对逼近香农定理和摩尔定律极限的担忧……
 
柯:任正非原话是这样的:“华为现在的水平尚停留在工程数学、物理算法等工程科学的层面,尚未真正进入基础理论研究。随着逐步逼近香农定理、摩尔定律的极限,而对大流量、低时延的理论还未创造出来,华为感到前途茫茫,找不到方向”……
 
万:任总提到的摩尔定律大家很熟,而香农定理是何方神圣让他如此忧心?
 
柯:要了解香农定理必先知道香农是谁……
 
万:香农是谁?
 
柯:克劳德·香农1916年4月30日出生在美国密西根州。在一个小镇长大,爸爸是该镇的法官,妈妈是镇里的中学校长,他生长在一个有良好教育的环境,不过父母给他的科学影响还不如爷爷的影响大……
 
万:为什么?
 
柯:爷爷是一位农场主兼发明家,发明过洗衣机和农业机械,此外香农家与大发明家爱迪生还有远亲关系……
 
万:真的假的?
 
柯:香农小时候就崇拜爱迪生,后来才知道自己是爱迪生的远亲,他们都是约翰.欧格登,一个殖民领袖的后代……
 
万:看来基因不错!
 
柯:香农1940年在麻省理工获硕士和博士学位,1941年进入贝尔实验室。在那里提出了信息熵的概念……
 
万:什么是信息熵?
 
柯:香农理论的重要特征就是熵的概念,他证明了熵与信息内容的不确定程度有等价关系……
 
万:熵不是热力学第二定律的概念吗?
 
柯:是的,熵可以理解为分子运动的混乱度,信息熵也有类似含义,中文静态平均信息熵是9.65比特,英文是4.03比特……
 
万:信息熵大,意味着不确定性也大?
 
柯:对,我们上次还谈到一个段子:中国有两项体育不用看,一是乒乓球一是足球,前者是谁也赢不了,后者是谁也赢不了……
 
万:汉语的高语境由此可见!
 
柯:香农把信息量定义为随机不定性程度的减少,即信息是用来减少随机不定性的东西……
 
万:也可以反过来定义:信息是确定性的增加?
 
柯:你很棒!
著名科普作家威廉.庞德斯通在记述香农的事迹时引用康奈尔大学的托比.伯格的话:一个人建立了一个学科,提出了所有的相关推测和假设,而且证明并解答了自己提出的这些推测和设想,古往今来这种情况屈指可数……
 
万:真了不起!那香农定理的内容是什么?
 
柯:跟牛顿定律一样,也有三条,任总提到的应该是通信业应用最广泛的香农第二定理……
 
万:复杂吗?
 
柯:并不复杂,但写下来还是很复杂。简单说包括三个量:a.信道容量;b.信道带宽;c.信噪比……
 
万:很简捷嘛!
 
柯:关键是c比较麻烦,它不直接出现在公式里,而是经过了一个转换,对非专业人士记住一点就够了:c的转换值跟c本身的值是正相关的……
 
万:信噪比会随着c的增大或减小而增减?
 
柯:你很醒目!因此我们将“香农第二定理”简化为:a=b×c,注意c不是信噪比本身而是和它正相关……
 
万:有点儿明白了……
 
柯:看一下这三个量:a.“信道容量”:说白了,相当于一条路的运载能力……
 
万:那信道带宽b呢?
 
柯:b相当于一条路的车道数……
 
万:这比喻容易理解!
 
柯:“信噪比”也可以用开车来形容:走一条路所用的总时间,除以等红灯、让行人、堵车的时间……
 
万:好像代表了质量问题?
 
柯:对!信噪比代表了这条通信线路的传输质量。这三个量给定任何一个,其他两个的关系也就定了……
 
万:比如说?
 
柯:比如说带宽一定,你想传更多的信息就要降低信噪比,就好比看视频,如果卡得受不了就切到标清模式……
 
万:但会牺牲部分画质?
 
柯:是的,再比如信噪比一定,你想传更多信息就得增大带宽。这几年家庭带宽从2M、10M到100M,便是这个趋势……
 
万:香农极限是什么?
 
柯:香农极限就是在会发生误码的信道上进行无差错传输的最大传输速率......
 
万:也就是信道容量?
 
柯:是的,它更像绝对零度和光速一样,在现实中极难达到。为了达到香农极限,信号序列必须无限长……
 
万:这可能吗?
 
柯:实际上,信道编码的长度受着传送时延和系统复杂性的限制……
 
万:难怪任老板忧心忡忡?
 
柯:自从阿法狗3:0战胜围棋冠军柯洁后,AI对普罗大众而言不再陌生,而香农在AI领域也是一个先驱者……
 
万:人工智能?
 
柯:香农有一位在贝尔的朋友,名叫戴夫.哈格尔巴格。他根据库普林:“随机性并不那么容易实现,写出一长串没有侧重或关联的数字是超出人类能力范围的”观点,制作了一台猜心机……
 
万:猜心机?
 
柯:这台机器很简单,你可以把它想象成一台和你玩儿“石头剪刀布”的机器……
 
万:它能猜心思?
 
柯:香农见识了哈格尔巴格的猜心机后很兴奋,决定自己也制作一台……
 
万:结果怎样?
 
柯:他的猜心机和贝尔的科学家们“玩儿”的结果是65%的胜率,哈格尔巴格的胜率为53.3%。也就是说你和机器玩100局,机器能赢65局……
 
万:这么牛?
 
柯:20世纪50年代,一大批科学家、工程师和数学家陆续加入贝尔。香农的猜心机由此成了辨识天才的智商测试仪。凡是自诩聪明的人都会绞尽脑汁跟机器比试一番……
 
万:猜心机到底能进行多大程度的智力活动?
 
柯:举个例子吧,人有10^10个神经元,最笨的行军蚁也有200个神经元,而这台机器只有不到100个继电器,只有16比特的存储空间(2个字节)……
 
万:太小儿科了吧?
 
柯:你别小瞧了这简单的猜心机,当时大把的数学家、天才工程师轮番上阵比试,竟无一人能赢……
 
万:太遗憾了!
 
柯:不过有一个人赢了猜心机……
 
万:谁?
 
柯:那个人就是香农自己。1953年,在一份备忘录里他披露了自己获胜的秘密:就是把自己变成一台猜心机……
 
万:什么意思?
 
柯:就是在精神上模拟机器的运作,弄清机器的预测,接着反其道而行之……
 
万:这很难吧?
 
柯:香农说:“在精神上运行这一程序极端困难”,考虑到机器的设计机制,一名完美的模拟者能有75%的胜率,无法达到100%,因为机器有时候也会随机选择……
 
万:猜心机的原理是什么?
 
柯:基本原理就是人类的思维既不能理解随机性也做不到随机性……
 
万:我觉得:随机性还是可以理解的!
 
柯:就算理解了随机性,但也做不到随机性,还是输……
 
万:我不信!
 
柯:有个例子:一位来访的数学家希策布鲁赫连赢了13局,难道猜心机不灵了?事实并非如此,机器赢下了第14局,数学家不停地玩,很遗憾,他再也木有赢过一次……
 
万:这么牛叉?
 
柯:猜心机在进攻状态时,它通过分析记录对手过往的选择情况,从中找出规律来预测对手的下一次选择……
 
万:随机性很难?
 
柯:是的!当它处于防守状态时,由于人类无法战胜随机性,遇到厉害的猜不透的玩家,猜心机就用随机性应对人类,所以最差也是50%的胜率……
 
万:是不是玩的时间越长越能准确预测人们的想法?
 
柯:是的,美国小说家爱伦.坡在《窃信案》中从心理学角度讨论过:“当人们努力不想被预测的时候,总是能被预测”……
 
万:这很奇怪!
 
柯:人越是不想被猜中,越是容易被猜中,因为每当人们要做出任意的、随机的选择时,总会落入能够被预测到的无意识模式之中……
 
万:香农的猜心机有什么用?
 
柯:你这句话让我想起了当年有人问:麦克斯韦方程有什么用?麦克斯韦回答:这是抽象的数学,没什么用。但正是这无用的研究却为后来有用的发明奠定了基础……
 
万:收音机就是在此基础上发明的?
 
柯:国人心目中的“有用”,往往是立竿见影式的有用。这种急功近利很难使我们跻身世界科技强国之列,任正非老爷子已清醒地看到了这一点……
 
万:基础理论研究很重要!
 
柯:对!可以这样说,香农的机器是最早使用了“小型文本文件cookies”的,猜心机就是现代猜心机的鼻祖……
 
万:现代猜心机?
 
柯:现代猜心机--就是所谓的大数据,一种无所不包的算法,它一边跟踪我们的每一个数字行动,一边预测接下来可以劝诱我们买什么东西……
 
万:请举个例子!
 
柯:去年明尼苏达州的一个大型百货店,进来一个气急败坏的男人对着经理发火:“你们想鼓励她怀孕吗?我女儿在邮件里收到了这个”,经理一看是本店的促销邮件,是些可爱婴儿、婴儿家具和孕妇装的照片。要知道他女儿还在读高中,经理赶忙道歉……
 
万:怎么回事儿?
 
柯:原来商店里有一个猜心机(一套预测分析软件):预测哪些顾客怀孕了。因为准妈妈们必须购买此前从不曾购买过的商品。预测很准确,但也难保100%......
 
万:说不定这次就露怯了?
 
柯:过了几天,经理向那位生气的父亲致电,再次表示歉意。“我跟女儿谈了谈,”那位男士说,“结果,我家里发生了一些我毫不知情的事情。我女儿的预产期是8月份。我应该向你道歉才对。”……
 
万:呵呵,真是新型猜心机!
2017年7月10日于龙岗
备注与参考
参考:360百科
参考:《剪刀石头布》作者:威廉.庞德斯通,译者:闾佳,浙江人民出版社,2016年3月第一版
微信图片_20170424100600
 
 
关键词: 万柯访谈录
 
[ 资讯搜索 ]  [ 加入收藏 ]  [ 告诉好友 ]  [ 打印本文 ]  [ 违规举报 ]  [ 关闭窗口 ]

 
0条 [查看全部]  相关评论

 

 
技术支持: 都市科技