熵编码加密
㈠ 求助:信息论与编码理论的最新发展动态及其成果
你的提问很有创意!!
有一个比知识更天然和更基础的概念,这个概念便是信息。但信息如若没有定义,则是个贫乏的概念,其他概念也不能据此得到表达和关联。而信息流的运作层面,要比知识的获取和传播更为基本。因此,信息尽管也通过语言传递,但也只在由知觉传递,由记忆储存。
量子理论与相对论是二十世纪物理学两大支柱,也是二十世纪物理学所取得的最辉煌的成果。到1982年,Wotters和Zurek在《Nature》杂志上发表一篇短文,提出所谓的量子不可克隆定理:即一个未知的量子态不可能被完全精确复制。这个定理,虽然有人认为已经蕴涵在量子态叠加原理的最基本的量子力学原理之中,其实质是量子态叠加原理的一个重要推论,但笔者不完全同意这个结论;量子不可克隆定理给量子信息的提取设置的不可逾越的界限,以及“量子态不可克隆原理”指明环境的不可避免地破坏量子的相干性,就已经能说明,克隆与不可克隆,其本质是介入传统问题的新视角。而且量子不可克隆定理已经开始能应对来自信息世界和信息社会新的智力挑战。
然而早在17世纪的科学革命,使哲学家将其注意力从可知客体的本质转移到客体与认知主体之间的知识关系,随后而来的信息社会的发展以及现在管理信息圈的工具、组织、信息圈数百万人打发他们时间的语义环境的出现,信息已上升为一个基本概念,并突出了信息与计算科学的概念、方法和理论基础。这是自人工智能早期工作以来就很清楚的事。特别是1948年,申农(Shannon)指出通信的极限而奠定的信息论基础;这个基础最初出发点似乎非常简单,但却不简单。申农定义的“信息”概念是,信息的最基本形式是某一事物的对与错。
这个“对与错”,和“克隆与不可克隆” ,介入信息的视角是完全不同的,其本质是电脑(电子计算机)信息论。因为“对与错”可以用一个二进制单位,或者说一个“比特”,以“1”或“0”的形式来表达。在这一过程中,申农有一个惊人的发现,通过信息编码来对付各种形式的干扰,能将信息从一个地点传送到另一个地点。目前, 关于电脑与信息研究,已经结出累累硕果,影响也日益广泛,可以说,现在信息论研究的三个范畴:A. 狭义信息论;B. 一般信息论;C. 广义信息论,其本质都属于电脑信息论,即是可克隆的内容。
同时申农的定义,使信息成为人们对事物了解的不确定性的消除或减少。这也是从“对与错”的角度下的定义,例如信源发出了某种情况的不了解的“对”的状态,即消除了不定性;并且能用概率统计的数学方法,来度量为定性被消除的量的大小:如以H(x)为信息熵,是信源整体的平均不定度;而信息I(p)是从信宿角度代表收到信息后消除不定性的程度,所以它只不在信源发出的信息熵被信宿收到后才有意义。在排除干扰的理想情况下,信源发出的信号与信宿接收的信号一一对应,H(x)与I(p)二者相等。所以信息熵的公式也就是信息量的分式。当对数以2为底时,单位称比特(bit),信息熵是l0g2=1比特。然而在热力学中,熵是物质系统状态的一个函数,它表示微观粒子之间无规则的排列程度,即表示系统的紊乱度。这正如一个系统中的信息量是它的组织化程度的度量,一个系统的熵就是它的无组织程度的度量;即这一个正好是那一个的负数。这也说明信息与熵是一个相反的量,信息是负熵,它表示系统获得后无序状态的减少或消除,即消除不定性的大小。
然而,不管是语法信息、语义信息、语用信息;离散信息、连续信息;二元信息、多元信息;自然信息,社会信息,科技信息,文艺信息,经济信息;前馈信息、反馈信息;真实信息、虚假信息;有用信息、无用信息;概率信息,突发信息,确定信息、模糊信息等,从应用、来源、载体分类来说多么复杂,但它们具有的,1、可识别;2、可转换;3、可传递;4、可加工处理;5、可多次利用(无损耗性);6、在流通中扩充;7、主客体二重性;8、可度量性;9.可存储性;10.时效性;11.排序性等,都与“可克隆”的性质类似。特别是关于信息传输的有效性、可靠性、保密性和认证性研究中,例如信源熵的定义、量化,信源编码、信道编码、加密编码、解密编码,以及关于信息的计量、发送、传递、交换、接收和储存等问题,更是属于的电脑信息论的内容。
1956年,法国物理学家布里渊出版《科学与信息论》专着,从热力学和生命等许多方面探讨信息论,把热力学熵与信息熵直接联系起来,使热力学中“麦克斯韦尔妖”的佯谬得以解释。1964年,英国神经生理学家W.B.Ashby发表的《系统与信息》等文章,还把信息论推广应用到生物学和神经生理学领域。这些研究,以及后来从经济、管理和社会的各个部门对信息论的研究,使信息论远远地超越了申农原通信技术的领域。目前的哲学家、经济学家、计算机和情报工作者以及普通老百姓,可以完全不理会电脑信息论中隐藏的“克隆”概念的认同,而且类似天气预报信息,股价预测信息,谎报军情信息、经济信息等和信息价值的度量及优化,好似与电脑信息论的研究范围和数学工具无关,比如有效市场理论中“股票价格反映公司所有公开的信息”的“信息”的用法,一些反对电脑信息论的专家认为,这是把公开的资料(文字数据)本身当作信息,实际上各人对资料理解的不同,信息(量)是不同的。因此,他们希望扩大信息的研究范围和数学工具,但此追求其本质仍然是一个提高“克隆”或“对”质量的问题。
二、量子计算机信息论
量子计算机(量脑)和三旋理论的出现,也许能更从多方面揭开“信息”与“克隆”关系的谜底,为“信息”的本质提供更为清晰的图象。因为量子计算机和电脑的原理是不相同的 。这个中的道理是,量子理论虽然把任何事物包括光、物质、能量甚至时间都看成是以大量的量子形式显现的,并且这些量子是粒子和波的多种组合,以多种方式运动,但量子的拓扑几何形状抽象却长期没有统一。一种认为量子是质点,如类粒子模型;一种认为量子是能量环,如类圈体模型。电子计算机属类粒子模型,因为它的微处理器是以大规模和超大规模半导体集成电路芯片为部件,这是以晶体能带p-n结法则决定的电子集群粒子性为基础得以开发的。而量子计算机则属于类圈体模型,因为一台桌式量子计算机的基本元件如核磁共振分光计,它操纵的是量子的自旋,而类圈体模型最具有自旋操作的特色。类圈体的三旋即面旋、体旋、线旋不仅可以用作夸克的色动力学编码,而且也可以用作量子计算逻辑门的建造。因为类圈体的三旋根据排列组合和不相容原理,可构成三代62种自旋状态,并且为量子的波粒二相性能作更直观的说明:在类圈体上任意作一个标记(类似密度波),由于存在三种自旋,那么在类圈体的质心不作任何运动的情况下,观察标记在时空中出现的次数是呈几率波的,更不用说它的质心有平动和转动的情况。这与量子行为同时处于多种状态且能同时处理它的所有不同状态是相通的。而这正是量子计算机开发的理论基础,并且能提高计算速度。即由信息与电子计算科学(电脑)、信息与通信技术,引起的实践与概念的转换,正在导致一场大变革,然而电脑的信息革命却误导了人们,以为仅仅是电子计算机正面临晶体管的尺寸缩小到常规微芯片的极限,显示的量子行为的限制,才要求功能强大的量子计算机的。
并且,这也不是有的人认为的,量子计算机的研究范围和数学工具,与电脑信息论并没有本质的不同。例如,量子计算机利用量子行为能同时处于多种状态且能同时处理它的所有不同状态,类似打开一把有两位的号码锁,在电子计算机中,一位的状态由0或1规定,两位就构成4种不同,即0与0,0与1,1与0,1与1。随着计算过程的进行,数据位就能很有秩序地在众多的逻辑门间移动,因此在电子计算机中可能需要进行4次尝试才能打开的计算,在类似的一台由极少量的氯仿构成的两位量子计算机中,一个量子位可同时以0和1的状态存在,两个量子位也构成类似的4种不同状态,而量子位却不需移动,要执行的程序被汇编成一系列的射频脉冲,通过各种各样的核磁共振操作把逻辑门带到量子位那里,该锁只用一步就被打开。
当然,也有更多的人认为,不应低估接受“克隆与不可克隆” 范式,所要遇到的不可逾越的困难。然而,正是量子不可克隆的不可逾越,才能理解爱因斯坦关于“我不相信上帝在掷骰子”的话。因为笔者认为,爱因斯坦是从宏观物质的清楚、精确的信息非常多,而不可克隆,说的对物质实体、实在、结构最为本质的看法。在这一点上,爱因斯坦和玻尔并没有本质的分歧。不信,就看下面以“克隆与不可克隆” 范式,对微观物质和宏观物质作的对比分析研究。
1、由于事物能“一分为二”或有“双重解”结构,例如物质可分为微观物质和宏观物质,我们也把信息“一分为二”,类似“实体”的信息,设叫“结构信息”;类似“关系”的信息,设叫“交换信息”,这仅是和“克隆与不可克隆”作的近似对应,即假设“交换信息”是“可克隆”的,而“结构信息”是“不可克隆”的。现以 “人”代表宏观物质,以“量子”代表微观物质,作对比分析研究。
2、从时序上来说,宏观物质“结构信息”的“人”,只能从“活”到“死”,不能从“死”到“活”。这是非常清楚、精确的信息;因一个“人”的清楚、精确的信息非常多,这是不能作假的,所以这个真“人”“不可克隆”,即真品克隆就成了赝品。但宏观物质“结构信息”的“人”的这种清楚、精确的信息虽然非常多,而类似发生从“活”到“死”的概率少,且类似相同信息发生的间隔大,所以是一种弱“不可克隆”。因此对“交换信息”的“人”,是可以克隆的,例如戏剧、电影,拌演真人的演员这种克隆“人”,就可以从“活”到“死”,也可以从“死”到“活”。其原因不光是改变了时序问题,而且还存在“速度”问题。从速度上来说,宏观物质一般远离“光速”,“结构信息”的“人”也远离“光速”,因此“交换信息”的“人”容易“克隆”,而且这是一种强“克隆”。
3、再说微观物质,由于存在不确定性原理,量子存在涨落,因此好似不清楚、精确的信息非常多,容易克隆,即如俗话说的:“画鬼易,画人难”,因为人,大家清楚,而鬼大家不清楚,可随便画。但事实上,从时序上来说,“结构信息”的“量子”不但能从“存在”到“消失”,而且也能从“消失”转到“存在”,这些清楚、精确的信息非常多,因此“量子”克隆既难又不容易。其次,从速度上来说,微观物质一般接近“光速”,“结构信息”的“量子”也接近“光速”,量子涨落的速度也接近“光速”,而且这种类似相同信息发生的间隔小,概率又多,因此“量子”是“不可克隆”的;而且这是一种强“不可克隆”。是否“交换信息”的“量子”也不可克隆的呢?这要取决于具体情况。否定随机性的学者认为,随机性并非无序性;在真正的无序系统中,小误差会以几何级数迅速发展,所以类似掷骰子的随机或概率是由两个原因引起的,一是像掷骰子一样,人们不知道它的初始状态;二是它的无序运动。
量子不可克隆为量子编码的绝对安全性提供了基础,但也存在概率误差迅速发展的环节。这让我国以郭光灿、段路明教授为首的科学家独辟蹊径,避开量子不可克隆的研究方向,提出了“量子概率克隆机”,这一理论随后被国际许多着名的实验室所证明,被誉为“段-郭概率克隆机”,他们推导出的最大概率克隆效率公式,被国际上称为“段-郭界限”。其原理是,量子态在超辐射的条件下会发生集体效应,能在消相干的环境下保持其相干性,这一研究成果被国际学术界称为“无消相干子空间理论”。他们运用“无消相干子空间理论”,在国际上首创了“量子避错编码原理”,从根本上解决了量子计算中的编码错误造成的系统计算误差问题。即这里“交换信息”的“量子”的克隆,是一种弱“克隆”。
4、综合上述“信息”的“双重解”结构,不管是强“不可克隆”,还是弱“不可克隆”,“结构信息”一般是“不可克隆”的。而不管是强“克隆”,还是弱“克隆” ,“交换信息”一般是“克隆”的。而所谓的观察、测量,其本质也是一个“克隆”问题。但量子计算机的计算本质,则不类似电脑是一个提高“克隆”质量的问题,而是一个把“不可克隆”的问题,转化为一个可观察、测量的“克隆”问题。
三、信息范型、结构信息、交换信息的定义
人类需要随时获取、传递、加工、利用信息,否则就不能生存。人类早期只是用语言和手势直接进行通讯,交流信息。人们获得信息的方式也是两种;一种是直接的,即通过自己的感觉器官,耳闻、目睹、鼻嗅、口尝、体触等直接了解外界情况;一种是间接的,即通过语言、文字、信号……等等传递消息而获得信息。人类的社会生活是不能离开信息的。人类不仅时刻需要从自然界获得信息,而且人与人之间也需要进行通讯,交流信息。长期以来,人们对结构信息、交换信息和信息范型的认识都比较模糊,也众说纷纭。现在通过对电脑信息论到量子计算机信息论的研究,已能对它们作出定义。
结构信息:观察、测量的事物不管是强“不可克隆”,还是弱“不可克隆”,一般是指“不可克隆”的结构交换。
交换信息:观察、测量的事物不管是能强“克隆”,还是弱“克隆” ,一般是指能“克隆”的交换结构。
信息范型:指对信息作的“克隆与不可克隆”的“双重解”分类,一般仅指结构信息和交换信息这两类范式。
人们对于信息的了解,比对于物质和能量的了解晚,至今信息是什么?尚未形成一个公认的、确切的定义。 英文信息一词(Information)的含义是情报、资料、消息、报导、知识的意思。所以长期以来人们就把信息看作是消息的同义语,简单地把信息定义为能够带来新内容、新知识的消息。但是后来发现信息的含义要比消息、情报的含义广泛得多,不仅消息、情报是信息,指令、代码、符号语言、文字等,一切含有内容的信号都是信息。有人还把消息、情报、信号、语言等等,都认为是信息的载体,而信息则是它们荷载着的内容。现何能定义信息范型、结构信息、交换信息等概念呢?其实,通过对电脑信息论到量子计算机信息论的研究,也提高了人们对信息是宇宙中除物质和能量外的第三个“要素”的认识,而且已经能给“信息”作出一个完整、全面的定义。
信息:是除物质和能量外包含时序与概率的第三个“要素”,既能包容“对与错”,又能包容“克隆与不可克隆”的结构与交换。
这里,包容“对与错”,就有“熵”的存在,也有不确定性的消除或减少。这里,包容“克隆与不可克隆”,就有“构成论”与“生成论”,或“物质实体”与“关系实在”,或“自在实体”与“现象实体”的存在,也有“显析序”与“隐缠序”,或“现实世界”与“可能世界”的分辩。本文不准备对此作更的解释,这里再以爱因斯坦针对玻尔的量子论的关于“我不相信上帝在掷骰子”的说法作些分析。这个跨世纪影响的争论,让半个多世纪以来的许多理论物理学家和哲学家,竞相误导和夸大爱因斯坦与玻尔之间的分歧。其实,从信息范型的“双重解”看,爱因斯坦与玻尔之间没有矛盾,他们俩人研究的都是“结构信息”,得出的研究成果也都是“交换信息”,只不过爱因斯坦的相对论研究的是宏观物质,玻尔的量子论研究的是微观物质,其研究成果“交换信息”,宏观物质与微观物质在“克隆与不可克隆”方面有强和弱的差异,而20世纪只有电脑信息论而没有量子计算机信息论,因此让他们俩人讨论了半天无结果。
1923年,M·玻恩向哥廷根科学院提交一封信,提名玻尔和爱因斯坦为该院外籍院士;他在玻尔的推荐中说:“他对我们这个时代的理论和实验研究的影响,比任何其他物理学的影响都大”。过了40年,1963年,H·海森伯在一篇玻尔悼文中写道:“玻尔对本世纪物理学家们的影响,比任何其他人的影响都更大,甚至比阿尔伯特·爱因斯坦的影响也更大。”又过了40年,现在本文想说明的是,盖尔曼在《夸克与美洲豹》一书的“量子力学的当代观”这一章结语中说:“我们正在努力建构量子力学的现代诠释的目的,是想终止尼尔斯·玻尔所说的时代。”这是从实数+虚数的“结构信息”角度来理解空间“描述长度”,是一种偏重实数的“交换信息”;从历史求和的角度来理解,又是对“结构信息”虚数的依赖。但这都能用观控相对界的眼孔三旋理论统一起来,从而有可能站在超越玻尔和爱因斯坦的高度作出量子力学新解释,即不停留在爱因斯坦的“结构信息”的“不可克隆”范围,强调要从玻尔的“不可克隆”高度进入历史求和的“交换信息”层次。就这个意义上说,爱因斯坦的光速界面是立本,玻尔的二重互补是立标,爱因斯坦和玻尔的超前思想难道还有多大的矛盾吗?
四、量子计算机信息论与三旋
有学者认为,由于量子力学向信息学科的渗透和拓展而重新热闹起来的有关“量子力学诠释”的讨论和研究,目前如果尚有100道物理难题的困扰,那么比起其他99道物理难题来说,爱因斯坦的相对论和以玻尔为代表的量子力学之间的协调在20世纪留给21世纪物理学的第一朵‘乌云’,就具体表现在“EPR实验”和“薛定锷猫佯谬”两个问题上。如果中国人发明的环量子三旋理论,能够在解释微观粒子的波粒二象性以及“EPR实验”方面有所建树,使量子力学摆脱EPR佯谬的折磨;但是它能否解除“薛定锷猫佯谬”的折磨,也还要有所期待,因为三旋理论还没有在解决“薛猫”佯谬方面做文章。即使类似《潘建伟教授的多粒子纠缠态隐形传输与三旋理论》一文,也不外乎是说明量子多粒子纠缠能“超光速”的传输并非是“超光速”。 而与“EPR实验”问题相比,“薛定锷猫佯谬”是量子信息论中的关键问题,也是研制“量子计算机”的理论基础之一,三旋理论避开信息论,其意图是否在为自己找突破口?因为三旋理论曾声称,解决相对论与量子力学之间不协调的矛盾,出路是把信息看成宇宙的组成部分;全息理论是否真能革量子场论的命,还不得而知,但环量子及其三旋能部分革量子场论的命,其本质是拓扑学和微分几何的环面与球面不同伦。
是的,如果在三旋理论不讨论“薛定锷猫佯谬”,这是不负责任的表现。现在可以看到这个突破口,是信息论应分为电脑信息论和量子计算机信息论双重解。三旋理论对波粒二象性和EPR佯谬的解释,用的是电脑信息论,即用环量子的三旋就能解释波粒二象性和EPR佯谬,这里涉及的结构信息、交换信息,只需“对与错”的判断;而对“薛定锷猫佯谬”的解释,却要用到量子计算机信息论,即用环量子的三旋还不能直接解释“薛定锷猫佯谬”,这里涉及的结构信息、交换信息,还需要用“克隆与不可克隆”对环量子三旋作出的解释。
众所周知,球面和环面在拓扑上不一样。也就是说:把球面拉拉扯扯,只要不破不粘上其它东西,它可以变大、变小、变长、变扁,但还是个球面,总也变不成环面;反过来,环面经过弹性变形之后也变不成球面。象球面和环面这两种在拓扑上不同的曲面区别,深化了微观物质“结构信息”的整体性观念,通过三旋及转座子方法,可以找到了一种基于对称原理的严格数理性证明:①自旋:有转点,能同时组织旋转面,并能找到同时对称的动点的旋转。②自转:有转点,但不能同时组织旋转面,也不能找到轨迹同时重复的旋转。③转动:可以没有转点,不能同时组织旋转面,也不存在同时对称的动点的旋转。按以上定义,类似圈态的客体(简称类圈体)存在三种自旋:A、面旋:类圈体绕垂直于圈面的轴的旋转;B、 体旋:类圈体绕圈面内的轴的旋转;C、 线旋:类圈体绕圈体内中心圈线的旋转。以上三种旋简称三旋。正是从严格的语义学出发,才证明类圈体整体的三旋是属于自旋,而类圈体的部分(即转座子)不是在作自旋,而仅是作自转或转动,即整体与部分是不同伦的。在类圈体表面用经线和纬线画出网块,即把类圈体分成环段,再把环段分成格,做成一种象魔方那样能转动的魔环器,这种网块就是转座子(即子系统)。任取一网块都能在类圈体面上沿体内中心圈线作面旋;绕体内中心圈线作线旋;或随同圈体整体作体旋。并且这三旋还可两者、三者交叉组合运动。另外,转座子还可在圈面局部地区作圆圈运动,即局部旋。与有26个转座子54格面的魔方相比,同样转座子数和着色的魔环器旋转,由于线旋时表面积还可变,就比魔方的4325亿亿余种图案变化还要多得多。在这里,转座子可以看成魔环器系统的子系统;反之,魔环器系统的子系统就是转座子。在物质演变的各种层次,三旋现象都存在。微观层次,环量子三旋“不可克隆”是显然的。在宏观层次,由于魔环器线旋时转座子在内外的表面积要变化,也能证明类似的魔环器难制造,而“不可克隆”。
所以微观层次环量子的三旋,本质上是一种量子计算机;三旋理论其本质也类似量子计算机是一个把“不可克隆”的问题,转化为一个可观察、测量的“克隆”问题。其结果支持以下两个结论:第一,电脑人工智能信息论,还不是成熟的范式。第二,量子计算机信息论的创新,与正统的物质和能量哲学达到了一种新的辨证。而由信息与量子计算科学和信息与电脑、通信技术引起的实践与概念的转换,正导致一场大变革,这便是所谓的“量子计算机革命”或“信息论转向”。其中“克隆与不可克隆”的作用,就像特洛伊木马,是把一种更具包容性的量子计算机的与信息的范式引入哲学的城堡。因此,像丘奇(Church)、申农、司马贺(Simon)、图灵、冯·诺依曼(Von Neumann)或维纳(Wiener)这样的思想家,基本上只被传统的电脑信息论“对与错”所承认。信息和量子计算机资源的利用,信息与量子计算科学和信息与量子通信技术,将是最发达的后工业社会使之不断增氧的机器,信息社会因此还会迎来历史上最快的技术增长,且成为新千年的一种象征。。
量子计算机信息论为哲学提供的一套简单而又令人难以置信的丰富观念——新颖而又演变着的环量子三旋准备的主题、方法和模式,将为传统的哲学活动带来新的机遇和挑战;在这个意义上,克隆作为基础性的信息设计,可以解释和指导知识环境有目的的建构,并可以为当代社会的概念基础提供系统性处理。它可以使人类理解世界并负责任地建构这个世界。显而易见,从克隆的角度出发,可以对信息做出规定和立法,以及信息应如何适当地生成、处理、管理和利用,它将影响到我们处理新老人文科学的整个方式,引起人文科学体系涌入自然科学的结构信息、交换信息中去作实质性的创新。
㈡ 如何计算密码所携带的信息熵
可加性与强可加性(涉及到了两个变量!)H(XY)为两个随机变量的联合熵。可加性:H(XY)等于 X的无条件熵,加上已知 X 时 Y的条件概率的熵的平均值,即条件熵。对于 X 与 Y 独立的情况有:(强可加性)信息论基础2011年3月教材和参考书傅祖芸编着《信息论-基础理论与应用》,电子工业出版社,2006第二版. 孟庆生《信息论》,西安交通大学,1986。(数学家写的研究生教材,含编码和密码)朱雪龙《应用信息论基础》,清华大学出版社,2000。(研究生教材,面向电子类,含编码方法。王育民、梁传甲《信息与编码理论》,西电教材。 (内容深入,推导过程少)沈连丰、叶芝惠编着《信息论与编码》东南大学硕士教材,科学出版社,2004,(面向通信专业)。周荫清主编《信息理论基础》北航出版社,2006(简洁,面向电子类)T. M. Cover & J. A. Thomas , Elements of Information Theory ,Addison-Wesley Pub, 1990, 清华影印。R. J. McEliece《The Theory of Information and Coding》第二版,电子工业出版社,2003。(内容简练,编码方面较全) * J.H.Van Lint 《Introction to coding theory》 GTM 86, Springer-Verlag, 1998. * Roman 《Coding and information theory》, GTM 134,新的教材:在广义信息论、网络信息论方面的内容有所增加。第一讲 1-1 信息论的主要内容 1-2 信息的度量-信息熵 1-3 信息熵的性质 信息熵 1-1. 信息论的主要内容 香农信息论最初是为了解决通信问题而提出的。通信的重要意义是勿庸置疑的。类传递思想、表达情感,就需要相互交流。人类的劳动、生产、政治、文化、日常生活等都离不开通信。人类利用眼、耳、鼻、舌、身等五种感觉器官来感受外界的信息,形成一个信息流通的体系。通信方式的不断提高,代表了人类文明和科技水平的不断提高。通信的根本任务:将一地点的消息可靠地、有效地传送到另一地点。信源干扰源信道信宿通信系统的基本模型:为了使消息可靠地、有效地传送到信宿,就需要对信源的消息进行处理;信源编码:实现有效性;信道编码:实现可靠性;密码:实现保密性及认证性;有没有可靠的、有效的处理方法?如何进行编码?香农信息论奠定了通信的理论基础。信息是消息的不确定性度量。某消息出现的概率大,它的信息量就小,相反某消息出现的概率小,则它的信息量就大。通信的关键是信息的传输问题。 信源,信源,编码信宿,信道,信道编码,信道译码,信源译码加密钥,加密解密钥,解密 干扰源提出的背景:在香农信息论出现以前,没有系统的通信理论。是香农,开创了信息论的研究,奠定了一般性通信 理论的基础。对数字通信技术的形成有很大贡献。(不论什么样的干扰信道,抓住了本质问题Shannon, 1916-2001)“A Mathematical Theory of Communication ”“ Communication Theory of Secrecy System ” About Claude Elwood Shannon: 1916年生于 Gaylord, MI 的一个小镇。母亲是一个语言教师和中学校长,父亲是一个商人。 16岁高中毕业,进入密西根大学。1936年获得电子工程和数学双学士学位。随后进入 MIT,作为研究生和研究人员。
㈢ 像qq,陌陌这种IM软件,即时通讯都用到了什么技术
你好!望采纳!
即时通讯开发涉及到的技术领域十分广泛,主要涉及以下几个领域:
音频技术
AAC于1997年形成国际标准ISO 13818-7。先进音频编码AAC开发成功,成为继MPEG-2音频标准(ISO/IEC13818-3)之后的新一代音频压缩标准。
类型:Audio
制定者:MPEG
所需频宽:96-128 kbps
优点:支持多种音频声道组合,提供优质的音质。
应用领域:voip
特性:AAC可以支持1到48路之间任意数目的音频声道组合、包括15路低频效果声道、配音/多语音声道,以及15路数据。它可同时传送16套节目,每套节目的音频及数据结构可任意规定。
AAC主要可能的应用范围集中在因特网网络传播、数字音频广播,包括卫星直播和数字AM、以及数字电视及影院系统等方面。AAC使用了一种非常灵活的熵编码核心去传输编码频谱数据。具有48 个主要音频通道,16 个低频增强通道,16 个集成数据流, 16 个配音,16 种编排。[2]
因此,AAC无疑是最好的即时通讯音频编码标准之一。
视频技术
目前最先进的视频技术非H.264莫属,H.264最大的优势是具有很高的数据压缩比率,在同等图像质量的条件下,H.264的压缩比是MPEG-2的2倍以上,是MPEG-4的1.5~2倍。H.264具有许多与旧标准不同的新功能,它们一起实现了编码效率的提高。特别是在帧内预测与编码、帧间预测与编码、可变矢量块大小、四分之一像素运动估计、多参考帧预测、自适应环路去块滤波器、整数变换、量化与变换系数扫描、熵编码、加权预测等实现上都有其独特的考虑。
网络技术
即时通讯讲究的是点对点,或者一对多的通讯。因此,P2P(点对点技术)作为一种网络新技术进入即时通讯开发人员的视野。针对可不经过服务器中转的音视频应用,采用了P2P通信技术,该技术的核心在于防火墙的穿越。使用P2P通信技术,可以大大的减轻系统服务器的负荷,并成几何倍数的扩大系统的容量,且并不会因为在线用户数太多而导致服务器的网络阻塞。支持UPNP协议,自动搜索网络中的UPNP设备,主动打开端口映射,提高P2P通信效率。
API接口技术
即时通讯开发必须采用动态缓冲技术来适应不同网络环境(局域网、企业专网、互联网、3G网络),根据不同的网络状态动态调节相关参数,使得即时通讯平台在多种网络环境下均有良好的表现,并特别针对互联网、3G网络等应用场合进行优化,为上层应用提供视频质量的动态调节接口、音频质量的动态调节接口。
保密技术
开发即时通讯平台时,不得不考虑到的问题就是保密问题了。比较通用的保密技术有:
1、自定义服务器端口。服务器所使用的TCP、UDP服务端口均可自定义(在服务器的.ini文件中配置),实现服务的隐藏;
2、加密传输服务器与客户端之间的底层通信协议;
3、服务器设置连接认证密码;
4、服务器内部设置安全检测机制,一旦检测到当前连接的客户端有非法操作嫌疑(如内部通信协议没有按既定的步骤进行)时,主动断开该客户端的连接,并记录该连接的IP地址,在一段时间内不允许重新连接。
㈣ 有哪些视频加密算法
全部加密
使用标准加密算法(比如DES3)加密整个视频流,其中,P是原始的多媒体数据,p0是经过压缩或不压缩的数据,C是使用加密算法加密过的数据,K是加密密钥。解密过程与加密过程相对陈,这种加密方法将视频比特流视作传统的文本数据,没有利用视频压缩后数据的特殊结构。这种方法显然计算量巨大,很难保证视频的实时传输
选择性加密
选择性加密是基于信源特征的视频加密方法的主要发展方向。其加密模型如下图所示。选择性加密可分为加班的选择性加密算法、仅加密头部信息的方法和SECMPEG比特流方法。
Zigzag置乱算法
Zigzag置乱算法的基本思想是使用一个随机的置乱序列来代替Zigzag扫描顺序,来将各个8*8块的DCT系数映射成一个1*64矢量。
Zigzag置乱算法速度很快,不影响视频的实时传输。但是经过加密的视频压缩后码流大下显着增加。因为运用非Zigzag顺序将8*8块映射到1*64矢量,将会极大减少连续零的个数,从而减少压缩率。视频流大小经过加密后增加可达46%。考虑到MPEG视频数据量的巨大,这种大小增量是很难容忍的。
改变Huffiman码表算法
改变Huffiman码表的视频加密算法原理是:对于熵编码采用Huffiman编码的视频标准,将通用Huffiman码表修改后使用,修改后的特殊Huffiman码表作为密钥。非接收方无此特殊码表,就无法正确解密视频信息。该算法完全不增加计算量。适用于使用Huffiman编码的各种视频和图像压缩编码标准和算法。其缺点是安全性较差。
纯置乱算法
纯置乱算法简单的置乱字节流。置乱密码序列的基数是根据密级和应用需求动态可变的。比如我们可以用64个数的置乱序列或一个长的I帧的1/8的置乱序列。这种算法的问题在于它对已知明文攻击非常脆弱。一旦通过比较密文和已知原始帧数据,获取了随机置乱序列,所有的帧将很容易被破解。为了找出随机置乱序列,我们需要已知随机序列长度倍数大小的明文。然而注意到MPEG数据流的单一性和帧大小在同一个数量级上,因此,基于香农理论,如果已知一个I帧数据足以破译整个随机序列。
如果你要是加密视频的话最简单的方法其实是下载一个视频加密软件就可以了,比如超级加密3000、金钻视频加密专家都可以加密视频的。
㈤ Matlab如何获得JPEG图片中量化之后的DCT系数
Matlab如何获得JPEG图片中量化之后的DCT系数
加密过程中需要用两类遍历矩阵对图像进行置乱加密,一类用来对明文图像进行以8×8图像块为单位的统一置乱;
另一类用来对图像DCT变换量化后的系数重新组合后的8×8系数块内的系数进行置乱加密。
利用混沌系统产生随即序列,然后对这该序列按大小进行排序,根据排序的序号可以产生所需要的遍历矩阵。
㈥ 当文件被压缩时它发生了什么变化
文件压缩的基本原理是—— 哈夫曼编码 ,用较短的数据替换掉文件中经常出现的、较长的数据。例如,一篇英文文章保存到文本文件中,显然文件中大部分数据都是小写字母、空格,还有少量的大写字母、标点,而这些字母和符号都无例外每个占用了一个字节(8bit)。如果现在我开发一个压缩软件专门压缩英文文本,那可以这样做:把小写a-z、空格只用5bit来表示,例如:00000 - a00001 - b……11010 - z11011 - 空格如此,还有11100、11101这样编码没有分配,可以用来表示大写字母,例如规定出现11100,则后面5个bit表示大写字母:1110000000 ~ A1110000001 ~ B……1110011010 ~ Z类似地,11101后面再加3bit表示标点:11101000 ~ .11101001 ~ ,11101010 ~ '……虽然大写字母的编码变得更长了,但由于文章中小写字母占绝大多数,文件就变小了。解压缩就是将上述过程反过来执行,将转换后的编码重新找到原来对应的编码。实际应用中,还有更多更复杂的方法来提高压缩效率,例如上面的例子中,小写字母的出现频率也有区别,把a、e等出现频率高的字母用更短的编码,而q、z等不常用字母用较长的编码,甚至发现某些单词出现的频率比较高,例如the / is,于是将那些单词用更短的编码表示。压缩软件要考虑很多不同类型文件的特点,并有针对性地设计压缩算法。从信息学的角度来说,数据压缩是去掉冗余,提高单位容量的有效信息量。低冗余的信息有不可预知、高熵的特点,加密后更难破解。形象来说,这就像把冗长的白话文写成言简意赅的文言文,不影响原来的意思又节省了书写时间。==========================【补充1】微博上很多同学提出用白话文写成文言文这个比喻不恰当,其实误解了我的意思。首先,被比喻的对象是“数据压缩”,不是“无损压缩”。其次,用白话文译文言文比喻的不是压缩“过程”、“方法”,而是比喻压缩“去掉冗余信息”这个本质,这是一个在理论层面、相当抽象的概念。的确,白话文译文言更像是把BMP转成JPG,WAV转MP3,是有损压缩,但损失的信息都是无用或者不重要(冗余)的信息,例如MP3去掉了人耳不容易听出来的高频和低频声音,这和无损压缩去掉冗余信息的本质并无不同。最重要的是——我实在想不到更恰当的比喻了。【补充2】有同学提出,压缩不只是用哈夫曼编码,还有很多其它算法——其实哈夫曼编码不是具体的算法,更像是一种思想,不局限于《数据结构》课本上说的那种逐个字节生成哈夫曼树的初等算法。绝大部分无损压缩算法仍然是基于哈夫曼编码的,其核心思想都是对出现频率高的编码(可能是多个字节的,例如单词)映射到短的编码,把出现频率低的编码映射到长的编码。
求采纳
㈦ 哈夫曼编码的应用
哈夫曼编码(Huffman Coding)是一种编码方式,以哈夫曼树—即最优二叉树,带权路径长度最小的二叉树,经常应用于数据压缩。在计算机信息处理中,“哈夫曼编码”是一种一致性编码法(又称"熵编码法"),用于数据的无损耗压缩。这一术语是指使用一张特殊的编码表将源字符(例如某文件中的一个符号)进行编码。这张编码表的特殊之处在于,它是根据每一个源字符出现的估算概率而建立起来的(出现概率高的字符使用较短的编码,反之出现概率低的则使用较长的编码,这便使编码之后的字符串的平均期望长度降低,从而达到无损压缩数据的目的)。这种方法是由David.A.Huffman发展起来的。例如,在英文中,e的出现概率很高,而z的出现概率则最低。当利用哈夫曼编码对一篇英文进行压缩时,e极有可能用一个位(bit)来表示,而z则可能花去 25个位(不是26)。用普通的表示方法时,每个英文字母均占用一个字节(byte),即8个位。二者相比,e使用了一般编码的1/8的长度,z则使用了 3倍多。倘若我们能实现对于英文中各个字母出现概率的较准确的估算,就可以大幅度提高无损压缩的比例。
㈧ 2010年江苏省专转本考试答案
额色差不要期望iuuy32iuxzhww我也2ubxyqwu饿呀各有v爷爷纳入今晚vgfhndwybgeuwvvnebyvfyet7t4
㈨ 关于多媒体的一些问题 急!!!
二, DPCM编码原理,参数编码的几个国际语音标准的特点
对预测误差信号 进行量化、编码、发送, 由此而得名为差值脉冲编码调制法,简写DPCM。DPCM编、解码系统由以下三部分组成。它包括发送、接收和信道传输三部分。 第一部分发送端(绿框部分动态显示)由编码器、量化器组成;第二部分接收端(黄框部分动态显示)包括解码器和预测器等,第三部分是信道传送(红框部分动态显示) DPCM系统的组成归纳如下:
发送端 若不带量化器--可逆的无失真的DPCM编码,是信息保持编码 若带量化器--有失真的DPCM编码 ,①JPEG标准,②H.261标准;③MPEG标准
静态图像帧内压缩编码
运动图像压缩编码标准。
以满足ISDN日益增长的需要可适用于可视电视和视频电话会议。
三。JPEG压缩编码原理
JPEG 标准定义了两种基本压缩算法:一是:基于DCT变换有失真的压缩算法。二是:基于空间预测编码DPCM的无失真压缩算法。
1.无失真的预测编码
图4.6—1 DPCM预测编码框图
2.基于DCT 的有失真压缩编码(1)基于DCT的有失真编码处理过程图
图4.6—2 基于DCT解码器处理步骤
(2)基于DCT的有失真编码处理总过程:
JPEG静态图像压缩编码主要原及实现技术概述为以下几点: ① 离散余弦变换(DCT) 首先把一幅图像(单色图像的灰度值或彩色图像的亮度分量或色差分量信号)分成8×8的块按图中的框图进行离散余弦正变换(FDCT)和离散余弦逆变换(IDCT)。 ② 量化 为了达到压缩数据的目的,对DCT系数F(u,v)需作量化处理。量化处理是一个多到一的映射它是造成DCT编解码信息损失的根源。在JPEG标准中采用线性均匀量化器。量化定义为,对64个DCT变换系数F(u,v)除以量化步长Q(u,v)后四舍五入取整。 ③ 熵编码 为进一步达到压缩数据的目的,需对量化后的DC系数和行程编码后的AC系数进行基于统计特性的熵编码。63个AC系数行程编码和码字,可用两个字节表示。JPEG建议使用两种熵编码方法:Huffman编码和自适应二进制算术编码。熵编码可分成两步进行,首先把DC和AC系数转换成一个中间格式的符号序列,第二步是给这些符号赋以变长码字。
5 视频会议系统,基于内容检索的多媒体数据库的原理
视频会议系统的结构如上图所示,它主要由视频会议终端、多点控制单元、信道(网络)及控制管理软件组成。 视频会议系统终端的主要功能是:完成视频信号的采集、编辑处理及显示输出、音频信号的采集、编辑处理及输出、视频音频数字信号的压缩编码和解码,最后将符合国际标准的压缩码流经线路接口送到信道或从信道上将标准压缩码流经线路接口送到终端中。此外,终端还要形成通信的各种控制信息:同步控制和指示信号、远端摄象机的控制协议、定义帧结构、呼叫规程及多个终端的呼叫规程、加密标准、传送密钥及密钥的管理标准等。 多点控制单元MCU(Multimedia Control Unit)是视频会议系统的关键设备,它的主 要功能是对视频、语音及数据信号进行切换,例如它会把传送到MCU某会场发言者的 图像信号切换到所有会场。对于语音信号,若同时有几个发言,可以对它们进行混合处 理,选出最高的音频信号,切换到其他会场。MCU的主要组成部分是:网络接口单元、 呼叫控制单元、多路复用和解复用单元、音频处理器、视频处理器、数据处理器、控制 处理器、密钥处理分发器及呼叫控制处理器。 视频会议系统的服务质量QoS(Quality of Service)是满足视频会议系统需求的核心问 题,视频会议系统要把用户的服务请求映射成预先规定的QoS参数,进而与系统和网 络资源对应起来,通过资源的分配和调度满足用户的应用需要。资源的分配和调度可以 选用资源的静态管理和动态管理去完成。资源的静态管理包括:QoS的协商和解释、资 源许可(Admission)、资源的保留和分配及资源的释放。资源的动态管理包括:进程管理、 缓冲区管理、传输率和流量控制及差错控制。 视频会议系统最后一个组成部分是安全保密系统,它也是视频会议一个重要问题。安全保密系统的主要组成部分是加密模块和解密模块,加密模块是将会议终端用户数据加密形成加密后的数据在网络上传输,解密模块接收加密数据进行解密得到用户数据。加密和解密模块的核心是密钥的生成和管理,密钥生成的核心是加密算法,加密算法不包含在国际标准的建议中,它由视频会议系统设计者研制或选用。
基于内容检索系统的组成如下图所示:由上图可见,基于内容检索系统分为两个子系统:特征抽取子系统和查询子系统。系统包括如下功能模块: (1) 目标识别:为用户提供自动半自动识别静态图像、视频、镜头的代表帧,是用户感兴趣的内容或区域。 视频序列图像动态目标,对目标进行特征抽取、查询,处理进行整体的或局部的内容检索,可采用全局特征或局部的特征。 (2) 特征抽取:提取用户威兴趣的又适合于基于内容检索的特征。如颜色分布情况、颜色的组成情况、纹理结构、方向对称关系、轮廓形状大小。 (3) 数据库:多媒体数据库,声、文、图;特征库,预处理特征;知识库,知识表达。 (4) 查询接口:有三种输入方式:①交互输入方式,②模板选择输入方式,③用户提交特征样板输入方式。多媒体特征组合功能和查询结果浏览。 (5) 检索引擎:利用特征之间的距离函数来进行相似性检索。对于不同的特征用不同的相似性测度算法,检索引擎中系统有效的是相似性测度函数集。 (6) 索引/过滤:通过索引和过滤达到快速搜索的目的。把全部的数据通过过滤器变成新的集合再用高维特征匹配来检索。
3 VGA卡帧存储器设计
1987年4月IBM公司随着IBM PS/2系列机问世,同时又推出了VGA显示标准。VGA(Vedio Graphics Array)与EGA兼容,主要增加了640×480点阵、16种颜色以及320×200点阵、256种颜色的图形方式,字符方式采用9×16点阵的字符窗口,显示80列×25行字符。VGA的主要特点是采用256K种颜色的调色板和用模拟量输出,使显示的颜色更加逼真,由于VGA输出RGB模拟量,所以必须配置模拟显示器。
显示缓存器的原理结构图以及它与VGA芯片的连接如图3.28所示。显示缓存器可以选用两片256 KB×4 DRAM芯片(256KB),它支持所有的VGA显示模式。当显示缓存器选用4片256 KB×4 DRAM芯片时(512KB),VGA的显示模式可以达到800×600分辨率16种颜色(非隔行扫描的图形方式),也可以达到1024×768分辨率16种颜色(隔行扫描的图形方式)以及132列的文本方式。
㈩ 麻烦帮忙翻译一下下面这段话
残余的系数主要是在macroblock 和它的动作之间的差别的转换系数
被补偿版本,在他们已经被量化之后,熵编码。 我们的实验已经显示那这些
残余系数传播一定量esial 视觉informationthat 给对手运送可能
如果不正确地获得,被压缩的录像的内容。 因此,加密残余的信息变得必要。
图2显示那而不需要(译码参考框架或者运动矢量,A的luma残渣系数)
P 框架将为一个对手提供一次原先的框架的描述。 因此,我们需要保护残余
系数。 不过,更进一步实验揭示不是所有luma 和色度系数都需要被获得。
当它的时,图3 证明混杂全部残余的luma 和一个P 框架的色度DC 系数的影响
运动矢量和参考框架没被加密。 象可以被看见的那样,在很大程度上加密DC
系数足以在框架里遮蔽大多数细节。 有确实渗透的信息由于
不稳固的运动矢量和参考框架