當前位置:首頁 » 文件管理 » 十個字母無壓縮

十個字母無壓縮

發布時間: 2025-02-07 23:54:51

壓縮的重復壓縮

有兩種形式的重復存在於計算機數據中,zip就是對這兩種重復進行了壓縮。
第一種
一種是短語形式的重復,即三個位元組以上的重復,對於這種重復,zip用兩個數字:1.重復位置距當前壓縮位置的距離;2.重復的長度,來表示這個重復,假設這兩個數字各佔一個位元組,於是數據便得到了壓縮,這很容易理解。
一個位元組有 0 - 255 共 256 種可能的取值,三個位元組有 256 * 256 * 256 共一千六百多萬種可能的情況,更長的短語取值的可能情況以指數方式增長,出現重復的概率似乎極低,實則不然,各種類型的數據都有出現重復的傾向,一篇論文中,為數不多的術語傾向於重復出現;一篇小說,人名和地名會重復出現;一張上下漸變的背景圖片,水平方向上的像素會重復出現;程序的源文件中,語法關鍵字會重復出現(我們寫程序時,多少次前後、paste?),以幾十 K 為單位的非壓縮格式的數據中,傾向於大量出現短語式的重復。經過上面提到的方式進行壓縮後,短語式重復的傾向被完全破壞,所以在壓縮的結果上進行第二次短語式壓縮一般是沒有效果的。
第二種
第二種重復為單位元組的重復,一個位元組只有256種可能的取值,所以這種重復是必然的。其中,某些位元組出現次數可能較多,另一些則較少,在統計上有分布不均勻的傾向,這是容易理解的,比如一個 ASCII 文本文件中,某些符號可能很少用到,而字母和數字則使用較多,各字母的使用頻率也是不一樣的,據說字母 e 的使用概率最高;許多圖片呈現深色調或淺色調,深色(或淺色)的像素使用較多(這里順便提一下:png圖片格式是一種無損壓縮,其核心演算法就是 zip 演算法,它和 zip 格式的文件的主要區別在於:作為一種圖片格式,它在文件頭處存放了圖片的大小、使用的顏色數等信息);上面提到的短語式壓縮的結果也有這種傾向:重復傾向於出現在離當前壓縮位置較近的地方,重復長度傾向於比較短(20位元組以內)。這樣,就有了壓縮的可能:給 256 種位元組取值重新編碼,使出現較多的位元組使用較短的編碼,出現較少的位元組使用較長的編碼,這樣一來,變短的位元組相對於變長的位元組更多,文件的總長度就會減少,並且,位元組使用比例越不均勻,壓縮比例就越大。

Ⅱ 求十個字母TXT百度雲,不是壓縮包最好。跪求

不好意思找不到。😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬😬

熱點內容
oraclesql添加欄位 發布:2025-05-03 20:38:03 瀏覽:232
尼康7100存儲卡 發布:2025-05-03 20:22:18 瀏覽:631
qq傳輸加密 發布:2025-05-03 20:22:13 瀏覽:936
去哪裡找萬能寶密碼呢 發布:2025-05-03 20:17:30 瀏覽:849
c語言mid 發布:2025-05-03 20:13:15 瀏覽:632
androidgridview標題 發布:2025-05-03 20:01:23 瀏覽:429
如何將系統跟軟體安裝在伺服器上 發布:2025-05-03 19:56:44 瀏覽:892
編程該學嘛 發布:2025-05-03 19:51:42 瀏覽:472
安卓設備代碼編譯器 發布:2025-05-03 19:37:27 瀏覽:831
安卓怎麼下正版游戲 發布:2025-05-03 19:19:54 瀏覽:276