當前位置:首頁 » 文件管理 » 基於dct圖像壓縮

基於dct圖像壓縮

發布時間: 2022-12-14 04:29:00

㈠ 基於圖像的dct壓縮處理中的d值是是什麼意思

基於圖像的dct壓縮處理
需要我幫助嗎.

㈡ 點陣圖圖像 經 基於DCT變換的順序編碼 壓縮後 文件類型會改變嗎

看你怎麼保存

㈢ 急求圖像壓縮編碼方法!!!

以下是幾種格式的專業解釋:

HDTV

一,HDTV的概念

要解釋HDTV,我們首先要了解DTV。DTV是一種數字電視技術,是目前傳統模擬電視技術的接班人。所謂的數字電視,是指從演播室到發射、傳輸、接收過程中的所有環節都是使用數字電視信號,或對該系統所有的信號傳播都是通過由二進制數字所構成的數字流來 完成的。數字信號的傳播速率為每秒19.39兆位元組,如此大的數據流傳輸速度保證了數字電視的高清晰度,克服了模擬電視的先天不足。同時,由於數字電視可以允許幾種制式信號的同時存在,因此每個數字頻道下又可分為若干個子頻道,能夠滿足以後頻道不斷增多的 需求。HDTV是DTV標准中最高的一種,即High Definision TV,故而稱為HDTV。

二,HDTV中要求音、視頻信號達到哪些標准?

HDTV規定了視頻必須至少具備720線非交錯式(720p,即常說的逐行)或1080線交錯式隔行(1080i,即常說的隔行)掃描(DVD標准為 480線),屏幕縱橫比為16:9。音頻輸出為5.1聲道(杜比數字格式),同時能兼容接收其它較低格式的 信號並進行數字化處理重放。

HDTV有三種顯示格式,分別是:720P(1280×720P,非交錯式),1080 i(1920×1080i,交錯式),1080P(1920×1080i,非交錯式),其中網路上流傳的以720P和1080 i最為常見,而在微軟WMV-HD站點上1080P的樣片相對較多。

三,如何收看HDTV節目?

目前有兩種方式可欣賞到HDTV節目。一種是在電視上實時收看HDTV,需要滿足兩個條件,首先是電視可接收到HDTV信號,這需要額外添加相關的硬體,其次是電視符合HDTV標准,主要是指電視的解析度和接收埠而言。
另一種是在電腦上通過軟體播放。目前我國只有極少部分地區可接收到HDTV數字信號,而且HDTV電視的價格仍高高在上,不是普通消費者所能承受的。因此,在網路中找尋HDTC源,下載後在個人電腦上播放,成了大多數HDTV迷們的一個嘗鮮方法。

四,哪些是可用於電腦播放的HDTV文件?

網路中流傳的HDTV主要以兩類文件的方式存在,一類是經過MPEG-2標准壓縮,以.tp和.ts為後綴的視頻流文件,一類是經過WMV-HD (Windows Media Video High Definition)標准壓縮過的.wmv文件,還有少數文件後綴為.avi或.mpg,其性質與.wmv是完全一樣的。

HDTV文件都比較大,即使是經過重新編碼過後的.wmv文件也非同小可。以一部普通電影的時間長度來計算,.wmv文件將會有4G以上,而同樣時間長度的.tp和.ts文件能達到8G以上,有的甚至達到20多G。因此,除了通過文件後綴名,還可以通過文 件大小來判斷是否為HDTV文件。

五,如何在個人電腦上播放HDTV節目?

對於.wmv文件,只要系統安裝了Windows Media Player 9 或更高版本,就可以正常播放,一些播放軟體的最新版本已經開始支持WMV-HD,如WINDVD6等,也可以直接使用這些軟體播放HDTV。有些HDTV文件在壓縮過程中採用了其它標準的編碼格式,就需要安裝對應的解碼器,遇到Windows Media Player 9不能正常播放時,可以再安裝ffdshow,它帶有各種最常用的解碼器。

播放以.tp和.ts為後綴的視頻流文件要稍微麻煩一點,因為文件中分別包含有AC3音頻信息和MPEG-2視頻信息。好在現下有已經不少專門播放.tp 和.ts文件的軟體問世了,Moonlight-Elecard MPEG Player 就是其中一款比較常見的支持HDTV播放的軟體,目前最新的版本為2.x。安裝完後,也可以運行其它播放軟體來調用Moonlight- Elecard MPEG Player的解碼器進行播放。

六,如何鑒別HDTV的顯示格式?

目前我們無法僅從文件名稱、大小上來判定一個HDTV文件的顯示格式是720P還是1080i,或是1080P,但是有不少軟體可以在播放時顯示影片的圖像信息,如WINDVD、zplay等,在軟體的控制面板中選擇對應的選項就可以看到詳細的信息。

七,為什麼我只能看到圖像,卻聽不到聲音?

這是因為未安裝AC3音頻解碼器,導致HDTV文件中的音頻信息不能被正確識別的原因。解決的方法是下載並安裝對應的音頻解碼器,常用的有 AC3Filter,這些音、視頻解碼器只需安裝一次即可,播放HDTV文件時系統會自動調用,而不必每次播 放的時候都打開其控制界面。

八,為什麼我播放HDTV時會出現丟幀現象?

在家用電腦上播放HDTV,對其硬體配置要求較高,主要是與CPU、顯存、內存緊緊相關,如果這三樣中有一樣性能過低,就會產生一些播放問題。播放 HDTV時會出現丟幀現象是顯存容量不夠造成的,尤其是在播放1080 i格式HDTV的時候,1920×1080的像素量,需要足夠大的顯存才能滿足其數據吞吐,因此顯存至少需要64M以上,建議128M。由於是2D顯示,所以對顯卡核心的運算能力要求反而不是很高。

九,為什麼我播放HDTV時會經常出現畫面和語音停頓的現象?

一些採用了WMV-HD重新編碼的HDTV文件,因為有著較高的壓縮率,在播放時就需要非常高的CPU運算能力來進行實時解碼,一般來說P4 2.0G/AMD 2000 以上及同級別的CPU可達到這個要求。同時,由於HDTV的數據流較大,需要足夠的內存來支持,推薦在256M以上。如果你的電腦滿足不了這樣的配置,就可能會在播放過程中產生畫面與語音不同步、畫面經常停頓、爆音等現象。嚴重的話甚至無法順利觀看。如果 這種現象不太嚴重,則可以通過優化系統和一些小技巧來改善。

十,如何優化系統以保證順利地播放HDTV?

除非你的電腦硬體配置的確很強,否則就很可能需要對系統進行一些優化,以便可以順利地播放HDTV。首先是在播放HDTV前關閉所有沒有用的後台程序或進程,盡量增加系統的空閑資源為播放HDTV服務;其次是選擇一款佔用系統資源較低的軟體來播放HDTV 。Windows Media Player、WINDVD等軟體佔用系統資源較多,在硬體配置本就不高的系統上會影響HDTV的播放效果,這時可以選擇使用BSPlayer。 BSPlayer是一款免費軟體,最大的特點就是佔用系統資源很小,尤其在播放HDTV文件時,與其它幾個資源佔用大戶相比效果更為明顯。另外,運行播放軟體後立即打開任務管理器(僅在Windows 2000/XP中有效),將播放軟體的進程級別設置為最高,這樣也可以為HDTV的播放調用更多的系統資源。除此之外,安裝更高版本的 DirectX,也能更好地支持HDTV的播放。

十一,還有什麼其它的技巧?

如果你的PC可以流利地播放HDTV,那麼你唯一會感到遺憾的,可能就是抱怨顯示器太小和音箱太不夠勁了。音箱的問題沒有好的方法可以解決,必竟PC音箱和家庭影院的音箱兩者是不可同比的,然而我們可以通過調高顯示器的解析度來提高畫面的清晰度和細節感。 現在主流的顯示器為17寸純平CRT(因為改變標准解析度只會給LCD帶來負面影響,因此這種方法只針對普通的CRT顯示器),中低檔的17寸顯示器很難達到1600×1200以上的解析度,即使達到了其水平掃描率也在60Hz以下,但是請不要忘了,電視 信號的水平掃描率也就是在這個水平上。720P的水平掃描率為60Hz,1080i則有50Hz和60Hz兩種,分別為我國和美國地區的標准。也就是說,即使你在顯示器水平掃描率為60Hz的狀態下全屏觀看HDTV或DVD等其它視頻,你是感覺不到晃眼的 ,這主要是由於人眼對於動態和靜態物體的感應不同造成的。因此你可以在觀看HDTV的時候,放心地將顯示器水平掃描率設為60Hz,進而將解析度調高,平時使用再調回標准解析度即可。

存放HDTV文件的硬碟分區必須轉換為NTFS格式,因為一部HDTV電影通常是幾個4.3GB的視頻文件組成(為了方便刻錄在DVD上面),而FAT32是無法管理2GB以上的文件的,因此務必轉換分區格式。

H.264

JVT(Joint Video Team,視頻聯合工作組)於2001年12月在泰國Pattaya成立。它由ITU-T和ISO兩個國際標准化組織的有關視頻編碼的專家聯合組成。JVT的工作目標是制定一個新的視頻編碼標准,以實現視頻的高壓縮比、高圖像質量、良好的網路適應性等目標。目前JVT的工作已被ITU-T接納,新的視頻壓縮編碼標准稱為H.264標准,該標准也被ISO接納,稱為AVC(Advanced Video Coding)標准,是MPEG-4的第10部分。
H.264標准可分為三檔:
基本檔次(其簡單版本,應用面廣);
主要檔次(採用了多項提高圖像質量和增加壓縮比的技術措施,可用於SDTV、HDTV和DVD等);
擴展檔次(可用於各種網路的視頻流傳輸)。
H.264不僅比H.263和MPEG-4節約了50%的碼率,而且對網路傳輸具有更好的支持功能。它引入了面向IP包的編碼機制,有利於網路中的分組傳輸,支持網路中視頻的流媒體傳輸。H.264具有較強的抗誤碼特性,可適應丟包率高、干擾嚴重的無線信道中的視頻傳輸。H.264支持不同網路資源下的分級編碼傳輸,從而獲得平穩的圖像質量。H.264能適應於不同網路中的視頻傳輸,網路親和性好。

H.261是最早出現的視頻編碼建議,目的是規范ISDN網上的會議電視和可視電話應用中的視頻編碼技術。它採用的演算法結合了可減少時間冗餘的幀間預測和可減少空間冗餘的DCT變換的混合編碼方法。和ISDN信道相匹配,其輸出碼率是p×64kbit/s。p取值較小時,只能傳清晰度不太高的圖像,適合於面對面的電視電話;p取值較大時(如 p>6),可以傳輸清晰度較好的會議電視圖像。H.263 建議的是低碼率圖像壓縮標准,在技術上是H.261的改進和擴充,支持碼率小於64kbit/s的應用。但實質上H.263以及後來的H.263 和H.263 已發展成支持全碼率應用的建議,從它支持眾多的圖像格式這一點就可看出,如Sub-QCIF、QCIF、CIF、4CIF甚至16CIF等格式。
MPEG-1標準的碼率為1.2Mbit/s左右,可提供30幀CIF(352×288)質量的圖像,是為CD-ROM光碟的視頻存儲和播放所制定的。MPEG-l標准視頻編碼部分的基本演算法與H.261/H.263相似,也採用運動補償的幀間預測、二維DCT、VLC遊程編碼等措施。此外還引入了幀內幀(I)、預測幀(P)、雙向預測幀(B)和直流幀(D)等概念,進一步提高了編碼效率。在MPEG-1的基礎上,MPEG-2標准在提高圖像解析度、兼容數字電視等方面做了一些改進,例如它的運動矢量的精度為半像素;在編碼運算中(如運動估計和DCT)區分「幀」和「場」;引入了編碼的可分級性技術,如空間可分級性、時間可分級性和信噪比可分級性等。近年推出的MPEG-4標准引入了基於視聽對象(AVO:Audio-Visual Object)的編碼,大大提高了視頻通信的交互能力和編碼效率。 MPEG-4中還採用了一些新的技術,如形狀編碼、自適應DCT、任意形狀視頻對象編碼等。但是MPEG-4的基本視頻編碼器還是屬於和H.263相似的一類混合編碼器。
總之,H.261建議是視頻編碼的經典之作,H.263是其發展,並將逐步在實際上取而代之,主要應用於通信方面,但H.263眾多的選項往往令使用者無所適從。MPEG系列標准從針對存儲媒體的應用發展到適應傳輸媒體的應用,其核心視頻編碼的基本框架是和H.261一致的,其中引人注目的MPEG-4的「基於對象的編碼」部分由於尚有技術障礙,目前還難以普遍應用。因此,在此基礎上發展起來的新的視頻編碼建議H.264克服了兩者的弱點,在混合編碼的框架下引入了新的編碼方式,提高了編碼效率,面向實際應用。同時,它是兩大國際標准化組織的共同制定的,其應用前景應是不言而喻的。
JVT的H.264
H.264是ITU-T的VCEG(視頻編碼專家組)和ISO/IEC的MPEG(活動圖像編碼專家組)的聯合視頻組(JVT:joint video team)開發的一個新的數字視頻編碼標准,它既是ITU-T的H.264,又是ISO/IEC的MPEG-4的第10 部分。1998年1月份開始草案徵集,1999年9月,完成第一個草案,2001年5月制定了其測試模式TML-8,2002年6月的 JVT第5次會議通過了H.264的FCD板。2003年3月正式發布。
H.264和以前的標准一樣,也是DPCM加變換編碼的混合編碼模式。但它採用「回歸基本」的簡潔設計,不用眾多的選項,獲得比H.263 好得多的壓縮性能;加強了對各種信道的適應能力,採用「網路友好」的結構和語法,有利於對誤碼和丟包的處理;應用目標范圍較寬,以滿足不同速率、不同解析度以及不同傳輸(存儲)場合的需求;它的基本系統是開放的,使用無需版權。
在技術上,H.264標准中有多個閃光之處,如統一的VLC符號編碼,高精度、多模式的位移估計,基於4×4塊的整數變換、分層的編碼語法等。這些措施使得H.264演算法具有很的高編碼效率,在相同的重建圖像質量下,能夠比H.263節約50%左右的碼率。H.264的碼流結構網路適應性強,增加了差錯恢復能力,能夠很好地適應IP和無線網路的應用。
H.264的技術亮點
(1) 分層設計
H.264的演算法在概念上可以分為兩層:視頻編碼層(VCL:Video Coding Layer)負責高效的視頻內容表示,網路提取層(NAL:Network Abstraction Layer)負責以網路所要求的恰當的方式對數據進行打包和傳送。在VCL和NAL之間定義了一個基於分組方式的介面,打包和相應的信令屬於NAL的一部分。這樣,高編碼效率和網路友好性的任務分別由VCL和NAL來完成。
VCL層包括基於塊的運動補償混合編碼和一些新特性。與前面的視頻編碼標准一樣,H.264沒有把前處理和後處理等功能包括在草案中,這樣可以增加標準的靈活性。
NAL負責使用下層網路的分段格式來封裝數據,包括組幀、邏輯信道的信令、定時信息的利用或序列結束信號等。例如,NAL支持視頻在電路交換信道上的傳輸格式,支持視頻在Internet上利用RTP/UDP/IP傳輸的格式。NAL包括自己的頭部信息、段結構信息和實際載荷信息,即上層的VCL數據。(如果採用數據分割技術,數據可能由幾個部分組成)。
(2) 高精度、多模式運動估計
H.264支持1/4或1/8像素精度的運動矢量。在1/4像素精度時可使用6抽頭濾波器來減少高頻雜訊,對於1/8像素精度的運動矢量,可使用更為復雜的8抽頭的濾波器。在進行運動估計時,編碼器還可選擇「增強」內插濾波器來提高預測的效果。
在H.264的運動預測中,一個宏塊(MB)可以按圖2被分為不同的子塊,形成7種不同模式的塊尺寸。這種多模式的靈活和細致的劃分,更切合圖像中實際運動物體的形狀,大大提高了運動估計的精確程度。在這種方式下,在每個宏塊中可以包含有1、2、4、8或16個運動矢量。
在H.264中,允許編碼器使用多於一幀的先前幀用於運動估計,這就是所謂的多幀參考技術。例如2幀或3幀剛剛編碼好的參考幀,編碼器將選擇對每個目標宏塊能給出更好的預測幀,並為每一宏塊指示是哪一幀被用於預測。
(3) 4×4塊的整數變換
H.264與先前的標准相似,對殘差採用基於塊的變換編碼,但變換是整數操作而不是實數運算,其過程和DCT基本相似。這種方法的優點在於:在編碼器中和解碼器中允許精度相同的變換和反變換,便於使用簡單的定點運算方式。也就是說,這里沒有「反變換誤差」。變換的單位是4×4塊,而不是以往常用的8×8塊。由於用於變換塊的尺寸縮小,運動物體的劃分更精確,這樣,不但變換計算量比較小,而且在運動物體邊緣處的銜接誤差也大為減小。為了使小尺寸塊的變換方式對圖像中較大面積的平滑區域不產生塊之間的灰度差異,可對幀內宏塊亮度數據的16個4×4塊的DC系數(每個小塊一個,共16個)進行第二次4×4塊的變換,對色度數據的4個4×4塊的DC系數(每個小塊一個,共4個)進行2×2塊的變換。
H.264為了提高碼率控制的能力,量化步長的變化的幅度控制在12.5%左右,而不是以不變的增幅變化。變換系數幅度的歸一化被放在反量化過程中處理以減少計算的復雜性。為了強調彩色的逼真性,對色度系數採用了較小量化步長。
(4) 統一的VLC
H.264中熵編碼有兩種方法,一種是對所有的待編碼的符號採用統一的VLC(UVLC :Universal VLC),另一種是採用內容自適應的二進制算術編碼(CABAC:Context-Adaptive Binary Arithmetic Coding)。CABAC是可選項,其編碼性能比UVLC稍好,但計算復雜度也高。UVLC使用一個長度無限的碼字集,設計結構非常有規則,用相同的碼表可以對不同的對象進行編碼。這種方法很容易產生一個碼字,而解碼器也很容易地識別碼字的前綴,UVLC在發生比特錯誤時能快速獲得重同步。
圖3顯示了碼字的語法。這里,x0,x1,x2,…是INFO比特,並且為0或1。圖4列出了前9種碼字。如:第4號碼字包含INFO01,這一碼字的設計是為快速再同步而經過優化的,以防止誤碼。
(5) 幀內預測
在先前的H.26x系列和MPEG-x系列標准中,都是採用的幀間預測的方式。在H.264中,當編碼Intra圖像時可用幀內預測。對於每個4×4塊(除了邊緣塊特別處置以外),每個像素都可用17個最接近的先前已編碼的像素的不同加權和(有的權值可為0)來預測,即此像素所在塊的左上角的17個像素。顯然,這種幀內預測不是在時間上,而是在空間域上進行的預測編碼演算法,可以除去相鄰塊之間的空間冗餘度,取得更為有效的壓縮。
如圖4所示,4×4方塊中a、b、...、p為16 個待預測的像素點,而A、B、...、P是已編碼的像素。如m點的值可以由(J+2K+L+2)/ 4 式來預測,也可以由(A B C D I J K L)/ 8 式來預測,等等。按照所選取的預測參考的點不同,亮度共有9類不同的模式,但色度的幀內預測只有1類模式。
(6) 面向IP和無線環境
H.264 草案中包含了用於差錯消除的工具,便於壓縮視頻在誤碼、丟包多發環境中傳輸,如移動信道或IP信道中傳輸的健壯性。
為了抵禦傳輸差錯,H.264視頻流中的時間同步可以通過採用幀內圖像刷新來完成,空間同步由條結構編碼(slice structured coding)來支持。同時為了便於誤碼以後的再同步,在一幅圖像的視頻數據中還提供了一定的重同步點。另外,幀內宏塊刷新和多參考宏塊允許編碼器在決定宏塊模式的時候不僅可以考慮編碼效率,還可以考慮傳輸信道的特性。
除了利用量化步長的改變來適應信道碼率外,在H.264中,還常利用數據分割的方法來應對信道碼率的變化。從總體上說,數據分割的概念就是在編碼器中生成具有不同優先順序的視頻數據以支持網路中的服務質量QoS。例如採用基於語法的數據分割(syntax-based data partitioning)方法,將每幀數據的按其重要性分為幾部分,這樣允許在緩沖區溢出時丟棄不太重要的信息。還可以採用類似的時間數據分割(temporal data partitioning)方法,通過在P幀和B幀中使用多個參考幀來完成。
在無線通信的應用中,我們可以通過改變每一幀的量化精度或空間/時間解析度來支持無線信道的大比特率變化。可是,在多播的情況下,要求編碼器對變化的各種比特率進行響應是不可能的。因此,不同於MPEG-4中採用的精細分級編碼FGS(Fine Granular Scalability)的方法(效率比較低),H.264採用流切換的SP幀來代替分級編碼。
H.264的性能測試
TML-8為H.264的測試模式,用它來對H.264的視頻編碼效率進行比較和測試。測試結果所提供的PSNR已清楚地表明,相對於MPEG-4(ASP:Advanced Simple Profile)和H.263 (HLP:High Latency Profile)的性能,H.264的結果具有明顯的優越性,如圖5所示。
H.264的PSNR比MPEG-4(ASP)和H.263 (HLP)明顯要好,在6種速率的對比測試中,H.264的PSNR比MPEG-4(ASP)平均要高2dB,比H.263(HLP)平均要高3dB。6個測試速率及其相關的條件分別為:32 kbit/s速率、10f/s幀率和QCIF格式;64 kbit/s速率、15f/s幀率和QCIF格式;128kbit/s速率、15f/s幀率和CIF格式;256kbit/s速率、15f/s幀率和QCIF格式;512 kbit/s速率、30f/s幀率和CIF格式;1024 kbit/s速率、30f/s幀率和CIF格式。
實現難度
對每個考慮實際應用的工程師而言,在關注H.264的優越性能的同時必然會衡量其實現難度。從總體上說,H.264性能的改進是以增加復雜性為代價而獲得的。目前全球也只有中國杭州海康威視數字技術有限公司在安防領域實現了H.264的實際應用,這一次我們走到了世界的前端!

1080p

1080P是標准層面上的HDTV或者硬體層面上FULL HD的最高標准之一,而FULL HD就是能夠完全顯示1920*1080像素或者說物理解析度達到1920*1080的平板電視機。需要注意的是,FULL HD和先前很多廠家宣傳的1080P並不是同樣的概念。
但是我們走進賣場會發現大多數品牌商家都打著1080P的旗幟對外宣傳,多少對我們的選購產生了阻礙.其實目前市場中的大多數平板電視都不是FULL HD,所謂的1080P只是支持1080P信號的接收並通過計算演變在屏幕上顯示,大多數大屏幕平板電視都為1366*768,等離子中的部分產品更低,要達到FULL HD的概念,就必須屏幕達到1920*1080的物理解析度以及至少30Hz的刷新率.

WAF

We Are Family 的簡稱 [我們是一家人]
WAF是韓國的一個影視製作小組,他們製作的DVDRIP是目前網上除了HDTV之外質量最好的,清晰度和音質都是上乘之作。
WAF的作品有以下特點:
1:嚴格控制每CD的容量,每CD的容量大小一般不超過0.05M(大家見過不少CD1是702M,CD2卻是698M的現象吧)。
2:經過控制的容量,利於刻盤,(有些小組製作的容量經常可以超過702M,一CD盤的容量,這時候超刻技術就受重視了^_^)
3:分割片子時注意場景轉換,極少造成一段場景有分裂感(例如4CD的《特洛伊》和4CD的《黑鷹》)。
4:每個片子壓制的尺寸都以OAR為准,即導演原始版。
5:尺寸統一,幾乎都是800線。(例:WAF20CD DTS版BOB,800*448,見過15CD的HDTVRIP版,居然有兩種尺寸!)我不清楚,一部大片為什麼大家會忍受得了解析度為640甚至以下的版本?
6:有極強的負責任的製作態度,發現有瑕疵的一般都會推出修復版.
7:喜歡WAF的DTS和AC3音頻和高碼率壓縮的視頻.
8:WAF每部片分割成的CD數一般都比別的小組製作的要多,這是為了保證必要的畫質和音質的質量。試想想有個加長版《角鬥士》使用DTS音軌,卻只分割成2CD,每CD有70多分鍾長,不知這樣壓縮出來的片子畫質能好到什麼程度?
所以說,WAF小組出品的DVDRip一般都是網上最清晰的版本。

問題補充:

普通家用電視的解析度是多少?是不是屏幕越大解析度越高?

電視的NTSC標准為720x480 刷新率為60Hz , PAL為720x576,刷新率為50Hz。 我國電視廣播採用 PAL制。

逐行電視接收隔行信號經過差補後可以達到逐行輸出,同時75Hz刷新率 ,或者隔行輸出,同時100Hz刷新率。

雖然PAL制可達576線,但普通電視的實際可分辨水平線數只有300~500。高清電視理論上可達720P 和1080i,就是說最多逐行720線。所以按理論來說,搞清電視用1024x768的VGA輸入也勉強可以表現出來了,但實際因為聚焦不準,文字顯示比能顯示1024x768的顯示器差很多,畫面顯示則沒什麼問題。

HDTV是不是沒有經過壓縮,最原始的視頻?

網路中流傳的HDTV主要以兩類文件的方式存在,一類是經過MPEG-2標准壓縮,以.tp和.ts為後綴的視頻流文件,一類是經過WMV-HD (Windows Media Video High Definition)標准壓縮過的.wmv文件,還有少數文件後綴為.avi或.mpg,其性質與.wmv是完全一樣的。

H.264等壓縮格式是不是為了方便網上傳播?

在技術上,H.264標准中有多個閃光之處,如統一的VLC符號編碼,高精度、多模式的位移估計,基於4塊的整數變換、分層的編碼語法等。這些措施使得H.264得演算法具有很高的編碼效率,在相同的重建圖像質量下,能夠比H.263節約50%左右的碼率。H.264的碼流結構網路適應性強,增加了差錯恢復能力,能夠很好地適應IP和無線網路的應用。

H.264能以較低的數據速率傳送基於聯網協議(IP)的視頻流,在視頻質量、壓縮效率和數據包恢復丟失等方面,超越了現有的MPEG-2、MPEG-4和H.26x視頻通訊標准,更適合窄帶傳輸。

網上流傳的Rip格式是什麼意思?DVDRip

DVDRip理解:其實就是一種DVD的備份技術。

DVD我們都知道,目前非常優秀的媒體格式,MPEG2編碼的視頻;AC3、DTS的音軌。但是我們也知道DVD載體是DVD光碟,D5一張就有4.7G。顯然,直接將DVD文件進行網路傳送毫無實際價值可言,將這樣的文件打包傳到伺服器上只會佔用伺服器的硬碟和大量的網路帶寬。還沒有多少人的網路帶寬可以讓他毫不動容地去下載一個7、8GB的文件只為了看兩個小時電影,更不要說將它們保存下來,DVD刻錄機這樣的產品目前也不是一般人能擁有的。
這就需要rip了,將DVD的視頻、音頻、字幕剝離出來,再經過壓縮或者其他處理,然後重新合成成多媒體文件。在更小的文件尺寸上達到DVD的是視聽享受。

㈣ 多媒體知識

多媒體知識全接觸 教程第一篇 多媒體基本概念

1.多媒體的定義

「多媒體」一詞譯自英文「Multimedia」,而該詞又是由mutiple和media復合而成的。媒體(medium)原有兩重含義,一是指存儲信息的實體,如磁碟、光碟、磁帶、半導體存儲器等,中文常譯作媒質;二是指傳遞信息的載體,如數字、文字、聲音、圖形等,中文譯作媒介。所以與多媒體對應的一詞是單媒體(Monomedia),從字面上看,多媒體就是由單媒體復合而成的啦。

多媒體技術從不同的角度有著不同的定義。比如有人定義「多媒體計算機是一組硬體和軟體設備;結合了各種視覺和聽覺媒體,能夠產生令人印象深刻的視聽效果。在視覺媒體上,包括圖形、動畫、圖像和文字等媒體,在聽覺媒體上,則包括語言、立體聲響和音樂等媒體。用戶可以從多媒體計算機同時接觸到各種各樣的媒體來源」。還有人定義多媒體是「傳統的計算媒體----文字、圖形、圖像以及邏輯分析方法等與視頻、音頻以及為了知識創建和表達的互動式應用的結合體」。概括起來就是:多媒體技術,即是計算機互動式綜合處理多媒體信息----文本、圖形、圖像和聲音,使多種信息建立邏輯連接,集成為一個系統並具有交互性。簡言之,多媒體技術就是具有集成性、實時性和交互性的計算機綜合處理聲文圖信息的技術(這句話的三性可是精髓哦!)。多媒體在我國也有自己的定義,一般認為多媒體技術指的就是能對多種載體(媒介)上的信息和多種存儲體(媒介)上的信息進行處理的技術。

2.多媒體的關鍵技術

由於多媒體系統需要將不同的媒體數據表示成統一的結構碼流,然後對其進行變換、重組和分析處理,以進行進一步的存儲、傳送、輸出和交互控制。所以,多媒體的傳統關鍵技術主要集中在以下四類中:數據壓縮技術、大規模集成電路(VLSI)製造技術、大容量的光碟存儲器(CD-ROM)、實時多任務操作系統。因為這些技術取得了突破性的進展,多媒體技術才得以迅速的發展,而成為像今天這樣具有強大的處理聲音、文字、圖像等媒體信息的能力的高科技技術。

但說到當前要用於互聯網路的多媒體關鍵技術,有些專家卻認為可以按層次分為媒體處 理與編碼技術、多媒體系統技術、多媒體信息組織與管理技術、多媒體通信網路技術、多媒 體人機介面與虛擬現實技術,以及多媒體應用技術這六個方面。而且還應該包括多媒體同步 技術、多媒體操作系統技術、多媒體中間件技術、多媒體交換技術、多媒體資料庫技術、超 媒體技術、基於內容檢索技術、多媒體通信中的QoS管理技術、多媒體會議系統技術、多媒 體視頻點播與交互電視技術、虛擬實景空間技術等等。

3.一般多媒體系統的組成部分

一般的多媒體系統由如下四個部分的內容組成:

多媒體硬體系統、多媒體操作系統、媒體處理系統工具和用戶應用軟體。

★ 多媒體硬體系統:包括計算機硬體、聲音/視頻處理器、多種媒體輸入/輸出設備及信號轉換裝置、通信傳輸設備及介面裝置等。其中,最重要的是根據多媒體技術標准而研製生成的多媒體信息處理晶元和板卡、光碟驅動器等。

★ 多媒體操作系統:或稱為多媒體核心系統(Multimedia kernel system),具有實時任務調度、多媒體數據轉換和同步控制對多媒體設備的驅動和控制,以及圖形用戶界面管理等。

★ 媒體處理系統工具:或稱為多媒體系統開發工具軟體,是多媒體系統重要組成部分。

★ 用戶應用軟體:根據多媒體系統終端用戶要求而定製的應用軟體或面向某一領域的用戶應用軟體系統,它是面向大規模用戶的系統產品。

第二篇 多媒體計算機的組成

1.多媒體個人機的解釋

在多媒體計算機之前,傳統的微機或個人機處理的信息往往僅限於文字和數字,只能算是計算機應用的初級階段,同時,由於人機之間的交互只能通過鍵盤和顯示器,故交流信息的途徑缺乏多樣性。為了改換人機交互的介面,使計算機能夠集聲、文、圖、像處理於一體,人類發明了有多媒體處理能力的計算機。我們這里重點談談個人機(就是現在說的PC啦)。所以現在你該明白,所謂多媒體個人機(Multimedia Personal Computer, MPC)無非就是具有了多媒體處理功能的個人計算機(如早期的586機型),它的硬體結構與一般所用的個人機並無太大的差別,只不過是多了一些軟硬體配置而已。一般用戶如果要擁有MPC大概有兩種途徑:一是直接夠買具有多媒體功能的PC機;二是在基本的PC機上增加多媒體套件而構成MPC。到奔Ⅱ橫行的今天,對計算機廠商和開發人員來說,MPC已經成為一種必須具有的技術規范。

2.多媒體計算機的基本配置(及可選配置)

一般來說,多媒體個人計算機(MPC)的基本硬體結構可以歸納為七部分:

★ 至少一個功能強大、速度快的中央處理器(CPU);

★ 可管理、控制各種介面與設備的配置;

★ 具有一定容量(盡可能大)的存儲空間;

★ 高解析度顯示介面與設備;

★ 可處理音響的介面與設備;

★ 可處理圖像的介面設備;

★ 可存放大量數據的配置等;

這樣提供的配置是最基本MPC的硬體基礎,它們構成MPC的主機。除此以外,MPC能擴充的配置還可能包括如下幾個方面:

★ 光碟驅動器:包括可重寫光碟驅動器(CD-R)、WORM光碟驅動器和CD-ROM驅動器。其中CD-ROM驅動器為MPC帶來了價格便宜的650M存儲設備,存有圖形、動畫、圖像、聲音、文本、數字音頻、程序等資源的CD-ROM早已廣泛使用,因此現在光碟機對廣大用戶來說已經是必須配置的了。而可重寫光碟、WORM光碟價格較貴,目前還不是非常普及。另外,DVD出現在市場上也有些時日了,它的存儲量更大,雙面可達17GB,是升級換代的理想產品。

★ 音頻卡:在音頻卡上連接的音頻輸入輸出設備包括話筒、音頻播放設備、MIDI合成器、耳機、揚聲器等。數字音頻處理的支持是多媒體計算機的重要方面,音頻卡具有A/D和D/A音頻信號的轉換功能,可以合成音樂、混合多種聲源,還可以外接MIDI電子音樂設備。

★ 圖形加速卡:圖文並茂的多媒體表現需要解析度高,而且同屏顯示色彩豐富的顯示卡的

支持,同時還要求具有Windows的顯示驅動程序,並在Windows下的像素運算速度要快。所以現在帶有圖形用戶介面GUI加速器的局部匯流排顯示適配器使得Windows的顯示速度大大加快。

★ 視頻卡:可細分為視頻捕捉卡、視頻處理卡、視頻播放卡以及TV編碼器等專用卡,其功能是連接攝像機、VCR影碟機、TV等設備,以便獲取、處理和表現各種動畫和數字化視頻媒體。

★ 掃描卡:它是用來連接各種圖形掃描儀的,是常用的靜態照片、文字、工程圖輸入設備。

★ 列印機介面:用來連接各種列印機,包括普通列印機、激光列印機、彩色列印機等,列印機現在已經是最常用的多媒體輸出設備之一了。

★ 交互控制介面:它是用來連接觸摸屏、滑鼠、光筆等人機交互設備的,這些設備將大大方便用戶對MPC的使用。

★ 網路介面:是實現多媒體通信的重要MPC擴充部件。計算機和通信技術相結合的時代已經來臨,這就需要專門的多媒體外部設備將數據量龐大的多媒體信息傳送出去或接收進來,通過網路介面相接的設備包括視頻電話機、傳真機、LAN和ISDN等。

3.媒體播放器在WEB中的應用

我們知道,由於聲音點播和影視點播應用還沒有完全直接集成到現在的Web瀏覽器中,這就需要一個單獨的應用程序來幫助,通常我們使用媒體播放器(Media player)來播放聲音和影視。典型的媒體播放器要執行好幾個功能,包括解壓縮、消除抖動、錯誤糾正和用戶播放等功能。現在可以使用像插件這種技術把媒體播放器的用戶介面放在Web客戶機的用戶界面上,瀏覽器在當前Web頁面上保留屏幕空間,並且由媒體播放器來管理。目前,大多數客戶機使用如下幾種方法來讀取聲音和影視文件:

★ 通過Web瀏覽器把聲音/影視從Web伺服器傳送給媒體播放器;

★ 直接把聲音/影視從Web伺服器傳送給媒體播放器

★ 直接把聲音/影視從多媒體流放伺服器傳送給媒體播放器;

在這個過程中,媒體播放器的主要功能表現在如下四個方面:

★ 解壓縮:幾乎所有的聲音和電視圖象都是經過壓縮之後存放在存儲器中的,因此無論播放來自於存儲器或者來自網路上的聲音和影視都要解壓縮。

★ 去抖動:由於到達接收端的每個聲音信息包和電視圖象信息包的時延不是一個固定的數值,如果不加任何措施就原原本本地把數據送到媒體播放器播放,聽起來就會有抖動的感覺,甚至對聲音和電視圖象所表達的信息無法理解。在媒體播放器中,限制這種抖動的簡單方法是使用緩存技術,就是把聲音或者電視圖象數據先存放在緩沖存儲器中,經過一段延時之後再播放。

★ 錯誤處理:由於在網際網路上往往會出現讓人不能接收的交通擁擠,信息包中的部分信息在傳輸過程中就可能會丟失。如果連續丟失的信息包太多,用戶接收的聲音和圖象質量就不能容忍。採取的辦法往往是重傳。

★ 用戶可控制的介面:這是用戶直接控制媒體播放器播放媒體的實際介面。媒體播放器為用戶提供的控制功能通常包括聲音的音量大小、暫停/重新開始和跳轉等等。

第三篇 圖像和圖形

1.有關色彩的基本常識

我們知道,只要是彩色都可用亮度、色調和飽和度來描述,人眼中看到的任一彩色光都是這三個特徵的綜合效果。那麼亮度、色調和飽和度分別指的是什麼呢?

★ 亮度:是光作用於人眼時所引起的明亮程度的感覺,它與被觀察物體的發光強度有關;★ 色調:是當人眼看到一種或多種波長的光時所產生的彩色感覺,它反映顏色的種類,是決定顏色的基本特性,如紅色、棕色就是指色調;

★ 飽和度:指的是顏色的純度,即摻入白光的程度,或者說是指顏色的深淺程度,對於同一色調的彩色光,飽和度越深顏色越鮮明或說越純。通常我們把色調和飽和度通稱為色度。 現在你該明白了,亮度是用來表示某彩色光的明亮程度,而色度則表示顏色的類別與深淺程度。除此之外,自然界常見的各種顏色光,都可由紅(R)、綠(G)、藍(B)三種顏色光按不同比例相配而成;同樣絕大多數顏色光也可以分解成紅、綠、藍三種色光,這就形成了色度學中最基本的原理----三原色原理(RGB)。

2.目前常見的圖形(圖像)格式

一般來說,目前的圖形(圖像)格式大致可以分為兩大類:一類為點陣圖;另一類稱為描繪類、矢量類或面向對象的圖形(圖像)。前者是以點陣形式描述圖形(圖像)的,後者是以數學方法描述的一種由幾何元素組成的圖形(圖像)。一般說來,後者對圖像的表達細致、真實,縮放後圖形(圖像)的解析度不變,在專業級的圖形(圖像)處理中運用較多。

在介紹圖形(圖像)格式前,我們實在有必要先了解一下圖形(圖像)的一些相關技術指標:解析度、色彩數、圖形灰度。

★ 解析度:分為屏幕解析度和輸出解析度兩種,前者用每英寸行數表示,數值越大圖形(圖像)質量越好;後者衡量輸出設備的精度,以每英寸的像素點數表示;

★ 色彩數和圖形灰度:用位(bit)表示,一般寫成2的n次方,n代表位數。當圖形(圖像)達到24位時,可表現1677萬種顏色,即真彩。灰度的表示法類似;

下面我們就通過圖形文件的特徵後綴名(就是如圖.bmp這樣的)來逐一認識當前常見的圖形文件格式:BMP、DIB、PCP、DIF、WMF、GIF、JPG、TIF、EPS、PSD、CDR、IFF、TGA、PCD、MPT。

★ BMP(bit map picture):PC機上最常用的點陣圖格式,有壓縮和不壓縮兩種形式,該格式可表現從2位到24位的色彩,解析度也可從480x320至1024x768。該格式在Windows環境下相當穩定,在文件大小沒有限制的場合中運用極為廣泛。

★ DIB(device independent bitmap):描述圖像的能力基本與BMP相同,並且能運行於多種硬體平台,只是文件較大。

★ PCP(PC paintbrush):由Zsoft公司創建的一種經過壓縮且節約磁碟空間的PC點陣圖格式,它最高可表現24點陣圖形(圖像)。過去有一定市場,但隨著JPEG的興起,其地位已逐漸日落終天了。

★ DIF(drawing interchange formar):AutoCAD中的圖形文件,它以ASCII方式存儲圖形,表現圖形在尺寸大小方面十分精確,可以被CorelDraw,3DS等大型軟體調用編輯。

★ WMF(Windows metafile format):Microsoft Windows圖元文件,具有文件短小、圖案造型化的特點。該類圖形比較粗糙,並只能在Microsoft Office中調用編輯。

★ GIF(graphics interchange format):在各種平台的各種圖形處理軟體上均可處理的經過壓縮的圖形格式。缺點是存儲色彩最高只能達到256種。

★ JPG(joint photographics expert group):可以大幅度地壓縮圖形文件的一種圖形格式。對於同一幅畫面,JPG格式存儲的文件是其他類型圖形文件的1/10到1/20,而且色彩數最高可達到24位,所以它被廣泛應用於Internet上的homepage或internet上的圖片庫。

★ TIF(tagged image file format):文件體積龐大,但存儲信息量亦巨大,細微層次的信息較多,有利於原稿階調與色彩的復制。該格式有壓縮和非壓縮兩種形式,最高支持的色彩數可達16M。

★ EPS(encapsulated PostScript):用PostScript語言描述的ASCII圖形文件,在PostScript圖形列印機上能列印出高品質的圖形(圖像),最高能表示32點陣圖形(圖像)。該格式分為Photoshop EPS格式adobeillustrator EPS和標准EPS格式,其中後者又可以分為圖形格式和圖像格式。

★ PSD(photoshop standard):Photoshop中的標准文件格式,專門為Photoshop而優化的格式。

★ CDR(coreldraw):CorelDraw的文件格式。另外,CDX是所有CorelDraw應用程序均能使用的圖形(圖像)文件,是發展成熟的CDR文件。

★ IFF(image file format):用於大型超級圖形處理平台,比如AMIGA機,好萊塢的特技大片多採用該圖形格式處理。圖形(圖像)效果,包括色彩紋理等逼真再現原景。當然,該格式耗用的內存外存等的計算機資源也十分巨大。

★ TGA(tagged graphic):是True vision公司為其顯示卡開發的圖形文件格式,創建時期較早,最高色彩數可達32位。VDA,PIX,WIN,BPX,ICB等均屬其旁系。

★ PCD(Photo CD):由KODAK公司開發,其它軟體系統對其只能讀取。

★ MPT(macintosh paintbrush)或MAC:Macintosh機所使用的灰度圖形(圖像)模式,在macintosh paintbrush中使用,其解析度只能是720x567。

除此之外,Macintosh機專用的圖形(圖像)格式還有PNT、PICT、PICT2等。
第四篇 聲音(音頻)

1.多媒體中的音頻處理技術

多媒體涉及到多方面的音頻處理技術,如:音頻採集、語音編碼/解碼、文一-語轉換、音樂合成、語音識別與理解、音頻數據傳輸、音頻一-視頻同步、音頻效果與編輯等。其中數字音頻是個關鍵的概念,它指的是一個用來表示聲音強弱的數據序列,它是由模擬聲音經抽樣(即每隔一個時間間隔在模擬聲音波形上取一個幅度值)量化和編碼(即把聲音數據寫成計算機的數據格式)後得到的。計算機數字CD、數字磁帶(DAT)中存儲的都是數字聲音。模擬一-數字轉換器把模擬聲音變成數字聲音;數字一-模擬轉換器可以恢復出模擬來的聲音。

一般來講,實現計算機語音輸出有兩種方法:一是錄音/重放,二是文一-語轉換。第二種方法是基於聲音合成技術的一種聲音產生技術,它可用於語音合成和音樂合成。而第一種方法是最簡單的音樂合成方法,曾相繼產生了應用調頻(FM)音樂合成技術和波形表(wavetable)音樂合成技術。

2.樂器數字介面MIDI的概念

現在我們用的最多的音頻名詞之一MIDI(musical instrument digital interface)是作為「樂器數字介面」的縮寫出現的,並用它來泛指數字音樂的國際標准。由於它定義了計算機音樂程序、合成器及其他電子設備交換信息和電子信號的方式,所以可以解決不同電子樂器之間不兼容的問題。另外,標準的多媒體PC平台能夠通過內部合成器或連接到計算機MIDI埠的外部合成器播放MIDI文件,利用MIDI文件演奏音樂,所需的存儲量最少。

至於MIDI文件,是指存放MIDI信息的標准文件格式。MIDI文件中包含音符、定時和多達16個通道的演奏定義。文件包括每個通道的演奏音符信息:鍵通道號、音長、音量和力度(擊鍵時,鍵達到最低位置的速度)。由於MDDI文件是一系列指令,而不是波形,它需要的磁碟空間非常少;並且現裝載MIDI文件比波形文件容易的多。這樣,在設計多媒體節目時,我們可以指定什麼時候播放音樂,將有很大的靈活性。在以下幾種情況下,使用MIDI文件比使用波形音頻更合適:需要播放長時間高質量音樂,如想在硬碟上存儲的音樂大於4分鍾,而硬碟又沒有足夠的存儲容量;需要以音樂作背景音響效果,同時從CD-ROM中裝載其它數據,如圖像、文字的顯示;需要以音樂作背景音響效果,同時播放波形音頻或實現文一語轉換,以實現音樂和語音的同時輸出。

3.常見的聲音文件格式

再接下來我們介紹七種目前最為流行的多媒體聲音文件效果讓你認識認識:

★ WAVE,擴展名為WAV:該格式記錄聲音的波形,故只要采樣率高、采樣位元組長、機器速度快,利用該格式記錄的聲音文件能夠和原聲基本一致,質量非常高,但這樣做的代價就是文件太大。

★ MOD,擴展名MOD、ST3、XT、S3M、FAR、669等:該格式的文件里存放樂譜和樂曲使用的各種音色樣本,具有回放效果明確,音色種類無限等優點。但它也有一些致命弱點,以至於現在已經逐漸淘汰,目前只有MOD迷及一些游戲程序中尚在使用。

★ MPEG-3,擴展名MP3:現在最流行的聲音文件格式,因其壓縮率大,在網路可視電話通信方面應用廣泛,但和CD唱片相比,音質不能令人非常滿意。

★ Real Audio,擴展名RA:這種格式真可謂是網路的靈魂,強大的壓縮量和極小的失真使其在眾多格式中脫穎而出。和MP3相同,它也是為了解決網路傳輸帶寬資源而設計的,因此主要目標是壓縮比和容錯性,其次才是音質。

★ Creative Musical Format,擴展名CMF:Creative公司的專用音樂格式,和MIDI差不多,只是音色、效果上有些特色,專用於FM音效卡,但其兼容性也很差。

★ CD Audio音樂CD,擴展名CDA:唱片採用的格式,又叫「紅皮書」格式,記錄的是波形流,絕對的純正、HIFI。但缺點是無法編輯,文件長度太大。

★ MIDI,擴展名MID:目前最成熟的音樂格式,實際上已經成為一種產業標准,其科學性、兼容性、復雜程度等各方面當然遠遠超過本文前面介紹的所有標准(除交響樂CD、Unplug CD外,其它CD往往都是利用MIDI製作出來的),它的General MIDI就是最常見的通行標准。作為音樂工業的數據通信標准,MIDI能指揮各音樂設備的運轉,而且具有統一的標准格式,能夠模仿原始樂器的各種演奏技巧甚至無法演奏的效果,而且文件的長度非常小。

總之,如果有專業的音源設備,那麼要聽同一首曲子的HIFI程度依次是:

原聲樂器演奏 〉 MIDI 〉 CD唱片 〉 MOD 〉 所謂音效卡上的MIDI 〉 CMF,而MP3及RA要看它的節目源是採用MIDI、CD還是MOD了。

另外,在多媒體材料中,存儲聲音信息的文件格式也是需要認識的,共有:

WAV文件、VOC文件、MIDI文件、RMI文件、PCM文件以及AIF文件等若干種。

★ WAV文件:Microsoft公司的音頻文件格式,它來源於對聲音模擬波形的采樣。用不同的采樣頻率對聲音的模擬波形進行采樣可以得到一系列離散的采樣點,以不同的量化位數(8位或16位)把這些采樣點的值轉換成二進制數,然後存入磁碟,這就產生了聲音的WAV文件,即波形文件。Microsoft Sound System軟體Sound Finder可以轉換AIF SND和VOD文件到WAV格式。

★ VOC文件:Creative公司波形音頻文件格式,也是聲霸卡(sound blaster)使用的音頻文件格式。每個VOC文件由文件頭塊(header block)和音頻數據塊(data block)組成。文件頭包含一個標識版本號和一個指向數據塊起始的指針。數據塊分成各種類型的子塊。如聲音數據靜音標識ASCII碼文件重復的結果重復以及終止標志,擴展塊等。

★ MIDI文件:Musical Instrument Digital Interface(樂器數字介面)的縮寫。它是由世界上主要電子樂器製造廠商建立起來的一個通信標准,以規定計算機音樂程序 電子合成器和其它電子設備之間交換信息與控制信號的方法。MIDI文件中包含音符定時和多達16個通道的樂器定義,每個音符包括鍵通道號持續時間音量和力度等信息。所以MIDI文件記錄的不是樂曲本身,而是一些描述樂曲演奏過程中的指令。

★ RMI文件:Microsoft公司的MIDI文件格式,它可以包括圖片標記和文本。

★ PCM文件:模擬音頻信號經模數轉換(A/D變換)直接形成的二進制序列,該文件沒有附加的文件頭和文件結束標志。在聲霸卡提供的軟體中,可以利用VOC-HDR程序,為PCM格式的音頻文件加上文件頭,而形成VOC格式。Windows的Convert工具可以把PCM音頻格式的文件轉換成Microsoft的WAV格式的文件。

★ AIF文件:Apple計算機的音頻文件格式。Windows的Convert工具同樣可以把AIF格式的文件換成Microsoft的WAV格式的文件。

第五篇 視頻(動畫)

1.動態圖像的組成

動態圖像,包括動畫和視頻信息,是連續漸變的靜態圖像或圖形序列,沿時間軸順次更換顯示,從而構成運動視感的媒體。當序列中每幀圖像是由人工或計算機產生的圖像時,我們常稱作動畫;當序列中每幀圖像是通過實時攝取自然景象或活動對象時,我們常成為影像視頻,或簡稱為視頻。動態圖像演示常常與聲音媒體配合進行,二者的共同基礎是時間連續性。一般意義上談到視頻時,往往也包含聲音媒體。但在這里,視頻(動畫)特製不包含聲音媒體的動態圖像。

2.動畫的定義

什麼是動畫?所謂動畫,就是通過以每秒15到20幀的速度(相當接近於全運動視頻幀速)順序地播放靜止圖像幀以產生運動的錯覺。因為眼睛能足夠長時間地保留圖像以允許大腦以連續的序列把幀連接起來,所以能夠產生運動的錯覺。我們可以通過在顯示時改變圖像來生成簡單的動畫。最簡單的方法是在兩個不同幀之間的反復。這種方法對於指示「是」或「不是」的情況來說是很好的解決方法。另一種製作動畫的方法是以循環的形式播放幾個圖像幀以生成旋轉的效果,並且可以依靠計算時間來獲得較好的回放,或用記時器來控制動畫。

3.常見的視頻文件格式

視頻信息在計算機中存放的格式有很多,目前最流行的兩種格式是:

蘋果公司的Quicktime和微軟的AVI。

★ Quicktime:是蘋果公司採用的面向最終用戶桌面系統的低成本、全運動視頻的方式,現在在軟體壓縮和解壓縮中也開始採用這種方式了。其向量量化是Quicktime軟體的壓縮技術之一,它在最高為30幀/秒下提供的視頻解析度是320x240,其壓縮率能從25到200。

★ AVI:類似於Quicktime,是微軟公司採用的音頻視頻交錯格式,也是一種桌面系統上的低成本、低解析度的視頻格式。AVI可在160x120的視窗中以15幀/秒回放視頻,並可帶有8位的聲音,也可以在VGA或超級VGA監視器上回放。AVI很重要的一個特點是可伸縮性,使用AVI演算法時的性能依賴於與它一起使用的基礎硬體。

第六篇 多媒體數據壓縮和編碼技術標准

目前,被國際社會廣泛認可和應用的通用壓縮編碼標准大致有如下四種:

H.261、JPEG、 MPEG和DVI。

★ H.261:由CCITT(國際電報電話咨詢委員會)通過的用於音頻視頻服務的視頻編碼解碼器(也稱Px64標准),它使用兩種類型的壓縮:一幀中的有損壓縮(基於DCT)和用於幀間壓縮的無損編碼,並在此基礎上使編碼器採用帶有運動估計的DCT和DPCM(差分脈沖編碼調制)的混合方式。這種標准與JPEG及MPEG標准間有明顯的相似性,但關鍵區別是它是為動態使用設計的,並提供完全包含的組織和高水平的交互控制。

★ JPEG:全稱是Joint Photogragh Coding Experts Group(聯合照片專家組),是一種基於DCT的靜止圖像壓縮和解壓縮演算法,它由ISO(國際標准化組織)和CCITT(國際電報電話咨詢委員會)共同制定,並在1992年後被廣泛採納後成為國際標准。它是把冗長的圖像信號和其它類型的靜止圖像去掉,甚至可以減小到原圖像的百分之一(壓縮比100:1)。但是在這個級別上,圖像的質量並不好;壓縮比為20:1時,能看到圖像稍微有點變化;當壓縮比大於20:1時,一般來說圖像質量開始變壞。

★ MPEG:是Moving Pictures Experts Group(動態圖像專家組)的英文縮寫,實際上是指一組由ITU和ISO制定發布的視頻、音頻、數據的壓縮標准。它採用的是一種減少圖像冗餘信息的壓縮演算法,它提供的壓縮比可以高達200:1,同時圖像和音響的質量也非常高。現在通常有三個版本:MPEG-1、MPEG-2、MPEG-4以適用於不同帶寬和數字影像質量的要求。它的三個最顯著優點就是兼容性好、壓縮比高(最高可達200:1)、數據失真小。

★ DVI:其視頻圖像的壓縮演算法的性能與MPEG-1相當,即圖像質量可達到VHS的水平,壓縮後的圖像數據率約為1.5Mb/s。為了擴大DVI技術的應用,Intel公司最近又推出了DVI演算法的軟體解碼演算法,稱為Indeo技術,它能將為壓縮的數字視頻文

㈤ 對圖像進行基於DCT壓縮,

我正在做關於JPEG壓縮的論文,希望得到用MATLAB編寫基於離散正弦變換的圖像壓縮%計算二維DCT,矩陣T及其轉置是DCT函數P1*X*P2的參數
B=blkproc(I,[8,

㈥ 基於dct的jpeg編碼方法有哪些步驟

一.JPEG壓縮過程

JPEG壓縮分四個步驟實現:
1.顏色模式轉換及采樣;
2.DCT變換;
3.量化;
4.編碼。
二.
1.顏色模式轉換及采樣 RGB色彩系統是我們最常用的表示顏色的方式。JPEG採用的是YCbCr色彩系統。想要用JPEG基本壓縮法處理全彩色圖像,得先把RGB顏色模式圖像數據,轉換為YCbCr顏色模式的數據。Y代表亮度,Cb和Cr則代表色度、飽和度。通過下列計算公式可完成數據轉換。 Y=0.2990R+0.5870G+0.1140B Cb=-0.1687R-0.3313G+0.5000B+128 Cr=0.5000R-0.4187G-0.0813B+128 人類的眼晴對低頻的數據比對高頻的數據具有更高的敏感度,事實上,人類的眼睛對亮度的改變也比對色彩的改變要敏感得多,也就是說Y成份的數據是比較重要的。既然Cb成份和Cr成份的數據比較相對不重要,就可以只取部分數據來處理。以增加壓縮的比例。JPEG通常有兩種采樣方式:YUV411和YUV422,它們所代表的意義是Y、Cb和Cr三個成份的數據取樣比例。
2.DCT變換 DCT變換的全稱是離散餘弦變換(Discrete Cosine Transform),是指將一組光強數據轉換成頻率數據,以便得知強度變化的情形。若對高頻的數據做些修飾,再轉回原來形式的數據時,顯然與原始數據有些差異,但是人類的眼睛卻是不容易辨認出來。 壓縮時,將原始圖像數據分成8*8數據單元矩陣,例如亮度值的第一個矩陣內容如下:
JPEG將整個亮度矩陣與色度Cb矩陣,飽和度Cr矩陣,視為一個基本單元稱作MCU。每個MCU所包含的矩陣數量不得超過10個。例如,行和列采樣的比例皆為4:2:2,則每個MCU將包含四個亮度矩陣,一個色度矩陣及一個飽和度矩陣。 當圖像數據分成一個8*8矩陣後,還必須將每個數值減去128,然後一一代入DCT變換公式中,即可達到DCT變換的目的。圖像數據值必須減去128,是因為DCT轉換公式所接受的數字范圍是在-128到+127之間。 DCT變換公式:
x,y代表圖像數據矩陣內某個數值的坐標位置f(x,y)代表圖像數據矩陣內的數個數值u,v代表DCT變換後矩陣內某個數值的坐標位置F(u,v)代表DCT變換後矩陣內的某個數值 u=0 且 v=0 c(u)c(v)=1/1.414 u>0 或 v>0 c(u)c(v)=1 經過DCT變換後的矩陣數據自然數為頻率系數,這些系數以F(0,0)的值最大,稱為DC,其餘的63個頻率系數則多半是一些接近於0的正負浮點數,一概稱之為AC。
3、量化 圖像數據轉換為頻率系數後,還得接受一項量化程序,才能進入編碼階段。量化階段需要兩個8*8矩陣數據,一個是專門處理亮度的頻率系數,另一個則是針對色度的頻率系數,將頻率系數除以量化矩陣的值,取得與商數最近的整數,即完成量化。 當頻率系數經過量化後,將頻率系數由浮點數轉變為整數,這才便於執行最後的編碼。不過,經過量化階段後,所有數據只保留整數近似值,也就再度損失了一些數據內容,JPEG提供的量化表如下:

4、編碼 Huffman編碼無專利權問題,成為JPEG最常用的編碼方式,Huffman編碼通常是以完整的MCU來進行的。 編碼時,每個矩陣數據的DC值與63個AC值,將分別使用不同的Huffman編碼表,而亮度與色度也需要不同的Huffman編碼表,所以一共需要四個編碼表,才能順利地完成JPEG編碼工作。 DC編碼 DC是彩採用差值脈沖編碼調制的差值編碼法,也就是在同一個圖像分量中取得每個DC值與前一個DC值的差值來編碼。DC採用差值脈沖編碼的主要原因是由於在連續色調的圖像中,其差值多半比原值小,對差值進行編碼所需的位數,會比對原值進行編碼所需的位數少許多。例如差值為5,它的二進製表示值為101,如果差值為-5,則先改為正整數5,再將其二進制轉換成1的補數即可。所謂1的補數,就是將每個Bit若值為0,便改成1;Bit為1,則變成0。差值5應保留的位數為3,下表即列出差值所應保留的Bit數與差值內容的對照。
在差值前端另外加入一些差值的霍夫曼碼值,例如亮度差值為5(101)的位數為3,則霍夫曼碼值應該是100,兩者連接在一起即為100101。下列兩份表格分別是亮度和色度DC差值的編碼表。根據這兩份表格內容,即可為DC差值加上霍夫曼碼值,完成DC的編碼工作。
AC編碼 AC編碼方式與DC略有不同,在AC編碼之前,首先得將63個AC值按Zig-zag排序,即按照下圖箭頭所指示的順序串聯起來。
63個AC值排列好的,將AC系數轉換成中間符號,中間符號表示為RRRR/SSSS,RRRR是指第非零的AC之前,其值為0的AC個數,SSSS是指AC值所需的位數,AC系數的范圍與SSSS的對應關系與DC差值Bits數與差值內容對照表相似。 如果連續為0的AC個數大於15,則用15/0來表示連續的16個0,15/0稱為ZRL(Zero Rum Length),而(0/0)稱為EOB(Enel of Block)用來表示其後所剩餘的AC系數皆等於0,以中間符號值作為索引值,從相應的AC編碼表中找出適當的霍夫曼碼值,再與AC值相連即可。 例如某一組亮度的中間符為5/3,AC值為4,首先以5/3為索引值,從亮度AC的Huffman編碼表中找到1111111110011110霍夫曼碼值,於是加上原來100(4)即是用來取[5,4]的Huffman編碼1111111110011110100,[5,4]表示AC值為4的前面有5個零。 由於亮度AC,色度AC霍夫曼編碼表比較長,在此省略去,有興趣者可參閱相關書籍。 實現上述四個步驟,即完成一幅圖像的JPEG壓縮。 參考資料[1] 林福宗 《圖像文件格式(上)——Windows 編程》,清華大學出版社, 1996年[2] 李振輝、李仁各編著,《探索圖像文件的奧秘》,清華大學出版社,1996年[3] 黎洪松、成實譯《JPEG靜止數據壓縮標准》,學苑出版社,1996年

希望有點幫助

㈦ dct變換本身能不能壓縮數據,為什麼

dct變換本身不能壓縮數據,以圖像處理為例,dct變換只是將數據從空間域轉換到頻率域。但是dct變換之後的數據再用其他編碼方法進行壓縮可以實現很高的壓縮比。

㈧ 1.簡要地說明利用DCT變換進行圖像壓縮的方法。 2.簡要地說明利用傅里葉變換進行圖像去噪的方法。

圖像包含空間2維信息。DCT變換就是將空間2維信息變換到頻域上。在頻域上,可以利用人眼的視覺特性,進行壓縮處理。

圖像雜訊包含高頻信號分量。通過傅里葉變換,將圖像變換到頻域上。在頻域上通過低通濾波,可以濾到高頻雜訊。

基本思路都很類似。即,如果一些數據在一個域裡面不好處理,就把它變換到等效的另外一個域里處理。

㈨ 請問有關\"手機中的圖像壓縮技術\"這個題目,誰有資料可以告訴我一下么謝謝!

近年來,隨著新型感測技術的發展,遙感影像的時間、空間和光譜解析度不斷提高,隨著航天遙感技術的迅速發展,相應的數據規模呈幾何級數增長。遙感數據量日益龐大,有限的信道容量與傳輸大量遙感數據的需求之間的矛盾日益突出給數據的傳輸和存儲帶來了極大的困難。數據壓縮技術作為解決這一問題的有效途徑,在遙感領域越來越受到重視,尤其對於遙感圖象數據來說。一般說來,圖象解析度越高,相鄰采樣點的相關性越高,數據水分也越大。對遙感數據進行壓縮,有利於節省通信信道,提高信息的傳輸速率;數據壓縮之後有利於實現保密通訊,提高系統的整體可靠性。

一般地,圖像壓縮技術可分為兩大類:無損壓縮技術和有損(率失真)壓縮技術。無損壓縮利用數據的統計冗餘進行壓縮,可完全恢復原始數據而不引入任何失真,但壓縮率受到數據統計冗餘度的理論限制,一般為2:1到5:1。這類方法廣泛用於文本數據、程序和特殊應用場合的圖像數據(如指紋圖像、醫學圖像等)的壓縮。由於壓縮比的限制,僅使用無損壓縮方法不可能解決圖像和數字視頻的存儲和傳輸問題。有損壓縮方法利用了人類視覺對圖像中的某些頻率成分不敏感的特性,允許壓縮過程中損失一定的信息;雖然不能完全恢復原始數據,但是所損失的部分對理解原始圖像的影響較小,卻換來了大得多的壓縮比。有損壓縮廣泛應用於語音、圖像和視頻數據的壓縮。在多媒體應用中常用的壓縮方法有;PCM(脈沖編碼調制)、預測編碼、變換編碼(主成分變換或K-L變換、離散餘弦變換MT等)、插值和外推法(空域亞采樣、時域亞采樣、自適應)、統計編碼(Huffman編碼、算術編碼、Shannon-Fano編碼、行程編碼等)、矢量量化和子帶編碼等;混合編碼是近年來廣泛採用的方法。新一代的數據壓縮方法,如基於模型的壓縮方法、分形壓縮和小波變換方法等也己經接近實用化水平。

在遙感信息處理領域,根據信息處理的階段性,遙感圖像壓縮又可分為星上無損壓縮、星上有損壓縮和地面遙感數據壓縮。為了最大限度地保持遙感感測器所獲取的目標信息,星上壓縮一般採用無損壓縮方法。但當信息量大到無損壓縮難以滿足要求時,也考慮失真量較小的有損壓縮,即高保真壓縮方法。同時,為了適應遙感數據采樣率較高的特點,星上壓縮的實時性要求較高,因而要求壓縮方法計算簡單,硬體復雜度低。

二.目前數據壓縮方法標准概述

經常使用的無損壓縮方法有Shannon-Fano編碼法、Huffman編碼法、遊程(Run-length)編碼法、LZW編碼法(Lempel-Ziv-Welch)和算術編碼法等。

數據壓縮研究中應注意的問題是,首先,編碼方法必須能用計算機或VLSI硬體電路高速實現;其次,要符合當前的國際標准。

下面介紹三種流行的數據壓縮國際標准。

1、JPEG-靜止圖像壓縮標准

這是一個適用於彩色和單色多灰度或連續色調靜止數字圖像的壓縮標准。它包括基於DPCM(差分脈沖編碼調制、DCT(離散餘弦變換)和Huffman編碼的有損壓縮演算法兩個部分。前者不會產生失真,但壓縮此很小;後一種演算法進行圖像壓縮是信息雖有損失但壓縮比可以很大。 JPEG標准實際上有三個范疇:

1)基本順序過程Baseline Sequential processes) 實現有損圖像壓縮,重建圖像質量達到人眼難以觀察出來的要求。採用的是8x8像素自適應DCT演算法、量化及Huffman型的墒編碼器。

2)基於DCT的擴展過程(Extended DCT Based Process) 使用累進工作方式,採用自適應算術編碼過程。

3)無失真過程(Losslesss Process)採用預測編碼及Huffman編碼(或算術編碼),可保證重建圖像數據與原始圖像數據完全相同。

其中JPEG有以下五種方法:

(l)JPEG演算法

基本JPEG演算法操作可分成以下三個步驟:通過離散餘弦變換(DCT)去除數據冗餘;使用量化表對以DCT系數進行量化,量化表是根據人類視覺系統和壓縮圖像類型的特點進行優化的量化系數矩陣;對量化後的DCT系數進行編碼使其熵達到最小,熵編碼採用Huffman可變字長編碼。(2)離散餘弦變換(3)量 化

(4)遊程編碼(5)熵編碼

2、MPEG-運動圖像壓縮編碼

MPEG(Moving Pictures Experts Group)標准分成兩個階段:第一個階段(MPEG-I)是針對傳輸速率為 lMb/s到l.5Mb/s的普通電視質量的視頻信號的壓縮;第二個階段(MPEG-2)目標則是對每秒30幀的720x572解析度的視頻信號進行壓縮;在擴展模式下,MPEG-2可以對解析度達1440Xl152高清晰度電視(HDTV)的信號進行壓縮。但是MPEG壓縮演算法復雜、計算量大,其實現一般要專門的硬體支持。

MPEG視頻壓縮演算法中包含兩種基本技術:一種是基於l6x16子塊的運動補償技術,用來減少幀序列的時域冗餘;另一種是基於DCT的壓縮,用於減少幀序列的空域冗餘,在幀內壓縮及幀間預測中均使用了DCT變換。運動補償演算法是當前視頻圖像壓縮技術中使用最普遍的方法之一。

3、 H.261-視頻通信編碼標准

電視電話/會議電視的建議標准H.261常稱為Px64K標准,其中P是取值為 1到30的可變參數;P=l或2時支持四分之一中間格式(QCIF:Quarter Cmmon Intermedia Format)的幀率較低的視頻電話傳輸;P>=6時支持通用中間格式(CIF:Common Intermediate Format)的幀率較高的電視會議數據傳輸。Px64K視頻壓縮演算法也是一種混合編碼方案。

三.遙感影像數據壓縮的有效方法――小波壓縮

1.針對高解析度遙感影像,採用先進的圖象壓縮技術,實現對遙感影像的高保真快速壓縮,以解決大規模影像的傳輸和存儲問題。近年來,隨著新型感測技術的發展,遙感影像的時間、空間和光譜解析度不斷提高,相應的數據規模呈幾何級數增長,給數據的傳輸和存儲帶來了極大的困難。一般說來,圖象解析度越高,相鄰采樣點的相關性越高,數據水分也越大。對遙感數據進行壓縮,有利於節省通信信道,提高信息的傳輸速率;數據壓縮之後有利於實現保密通訊,提高系統的整體可靠性隨著INTERNET連到千家萬戶,遙感圖象正在逐漸成為信息傳遞的重要媒介。目前大多使用小波壓縮處理遙感圖像數據。

2 小波分析基本理論及其在圖像壓縮中的應用

與傅里葉變換相似,小波變換是一種同時具有時—頻二維解析度的變換。其優於傅氏變換之處在於它具有時域和頻域「變焦距」特性,十分有利於信號的精細分析。第一個正交小波基是Harr於1910年構造的;但Harr小波基是不連續的。到80年代,Meyer, Daubechies等人從尺度函數的角度出發構造出了連續正交小波基。1989年,Mallat等人在前人大量工作的基礎上提出多尺度分析的概念和基於多尺度分析的小波基構造方法,將小波正交基的構造納入統一的框架之中,使小波分析成為一種實用的信號分析工具。
該方法先對遙感圖像進行小波分解,然後以紋理復雜程度作為區域重要性度量,通過對紋理復雜的重要區域進行標量編碼來保證恢復圖像的質量,通過對平坦區(即不重要區)進行矢量編碼來提高壓縮比。實驗結果表明該方法具有壓縮率較高,圖像恢復質量好,速度快等優點,十分適合遙感數據的高保真壓縮。

小波變換在壓縮中提供了如下優點:(1) 多尺度分解提供了不同尺度下圖像的信息,並且變換後的能量大部分集中在低頻部分,方便了我們對不同尺度下的小波系數分別設計量化編碼方案,在提高圖像壓縮比的情況下保持好的視覺效果和較高的PSNR。(2) 小波分解和重構演算法是循環使用的,易於硬體實現.

JPEG的8×8分塊壓縮方法壓縮紋理復雜的塊時恢復誤差較大,具有比較明顯的方塊效應,而基於小波變換的圖像壓縮方法較好地克服了方塊效應的影響。通過對不同區域採用不同編碼方法,可以較好地保持原圖的紋理信息,並達到較高的壓縮比.

3. 自適應標量、矢量混合量化編碼方案

基於小波分解的圖像壓縮方法的一個重要因素是量化方案的選擇。一般說來,量化方法分為標量量化和矢量量化兩種。近年來,人們開始研究將標量、矢量量化相結合的方法,以同時獲取較高的壓縮比、恢復質量和時間性能,這是圖像壓縮技術的一個重要發展方向。
標量量化的關鍵是去相關和編碼。目前主要的去相關技術是預測方法,如DPCM預測;而編碼仍以熵編碼為主。標量量化的特點是可保持較高的圖像恢復質量,但壓縮率一般較低。目前最有效的基於小波分解的矢量量化方法有法國M. Barlaud等人提出的PLVQ塔式格型矢量量化方法和美國J. M. Shapiro提出的EZW方法。這兩種方法編碼效率較高,但計算非常復雜,不能適用於實時性要求較高的場合。
本文提出的編碼方案對圖像小波細節子圖劃分為4×4的塊,採用塊內的方差作為塊的紋理復雜度和重要性度量,對紋理復雜的重要塊用較多的位進行編碼,而對於較平坦的區域用較少的位進行編碼。這實際上相當於將各塊的元素組成一個矢量,對不重要的子塊採用矢量編碼方案,而對重要子塊採用標量編碼,使得各子塊的恢復誤差大致平衡。
本壓縮方法的具體步驟如下。
(1) 對圖像進行3層小波分解,對LL3子圖進行熵編碼,對HH1不編碼(解碼時以0填充)。
(2) 把小波分解圖的其它各細節子圖按4×4塊劃分,設定閾值0<T0<T1<T2。將方差小於T0的塊劃分為平坦區;方差大於T0小於T1的塊劃分為次平坦區;方差大於T1小於T2的塊劃分為次紋理區;方差大於T2的塊劃分為紋理區。
(3) 按各塊在圖中的位置進行塊的類別編碼。由於塊的類別數為4,採用兩位編碼。對不同類別的塊採用下述編碼方案:
● 對於平坦區,假設其均值為0,可認為塊中所有元素均為0;
● 對於次平坦區,用1位表示整個塊的均值,對於塊中每個元素再各用1位進行編碼,即塊中大於均值的元素對應碼號為1,否則對應碼號為0;
● 對於次紋理區,用2位表示整個塊的均值,對於塊中每個元素再各用2位進行編碼,把塊中各元素值對應到0—3這4個碼號上去;
● 對於紋理區,用6位表示整個塊的均值,用6位表示塊內方差,對塊中每個元素再各用5位進行編碼,把塊中各元素值對應到0—31這32個碼號上去。
(4) 對上述結果進行算術編碼。
上述演算法對於原圖4×4塊的128位數據,平坦區只用2位編碼,次平坦區用19位編碼,次紋理區用36位編碼,紋理區用2+16×5+6+6=94位編碼。

四. 演算法關鍵問題

4.1 小波基的選取

多尺度分析中小波基的選擇注意5個方面的因素。我們選擇了4組小波基對應的二次鏡面濾波器(QMF)研究它們的性質: (1) Battle和Lemarie的27-系數濾波器(簡稱B-L小波);(2) I. Daubechies的4-系數濾波器(簡稱D-4小波);(3) I. Daubechies的20-系數濾波器(簡稱D-20小波);(4) Antonini的一組雙正交小波基對應的濾波器。
(1) 正交性。用正交小波基由多尺度分解得到的各子帶數據分別落在相互正交的L2(R2)的子空間中,使各子帶數據相關性減小。但能准確重建的、正交的、線性相位、有限沖擊響應濾波器組是不存在的,此時一般放寬正交性條件為雙正交。
(2) 支撐集。為了得到有限長度的濾波器組h(n),g(n);避免濾波過程中的截斷誤差,要求小波基是緊支集的。

(3) 對稱性。對稱濾波器組具有兩個優點:(1)人類的視覺系統對邊緣附近對稱的量化誤差較非對稱誤差更不敏感;(2)對稱濾波器組具有線性相位特性,對圖像邊緣作對稱邊界擴展時,重構圖像邊緣部分失真較小,有利於復雜特性的分析(如序列目標檢測和分類)〔9〕。

(4) 規則性(Regularity)。

(5) 消失矩階數。

可見,本系統採用的雙正交小波基具有良好的性能。

4.2 閾值的選取

本方法的一個關鍵因素是3個閾值T0,T1和T2的選取。直觀地說,3個閾值越大,壓縮比越高,而圖像恢復質量越差。另外,根據人類的視覺生理、心理特點以及實驗結果,不同級別的小波分解系數所含的能量是不同的,因而在圖像重構時其重要性也有差異,應區別對待。級別越高,小波系數所含能量越大,量化應越精細。在矢量編碼方案中,一般採取級別高的小波子圖矢量維數低就是這個道理。通過對不同級別的子圖採用不同的閾值可以實現對不同級別子圖的區別對待,即級別越高,閾值越小。
進一步,上述3個閾值的選取有兩條途徑: 一是由用戶根據需要交互地給出,而由系統給出一個較優的預設值。通過對圖遙感圖像進行實驗可以獲得各閾值與壓縮系統性能指標PSNR和CR(峰值信噪比和壓縮比)的關系。

另一種方法是通過對小波分解子圖進行統計分析後自適應獲得,由前面的討論我們認為這是不必要的,理由有二: (1) 不同閾值的選取以及同一設定對不同圖像造成的壓縮性能影響不太大;(2) 自適應選取方法時間性能大大降低,不適合於實時性要求較高的場合。

4.3 演算法的實時性問題

目前小波分解已經有快速演算法,並可用硬體實現,使研製基於小波分解的實時圖像壓縮技術成為可能,這對於星上數據壓縮具有十分重要的意義。為了提高編碼過程的速度,我們沒有採用一般用於度量數據能量的方差指標,而代之以4×4子塊的塊內數據變化范圍(即最大最小值之差),從而減少了一次對塊中所有元素的掃描,且避免了求方差時的乘法運算,只需作16次浮點數比較(即減法)操作,縮短了編碼時間,而圖像恢復質量基本沒有下降。
另外,對於多波段遙感數據,我們先對它們進行K-L變換,然後對各K-L變換子圖使用上述方法進行壓縮,效果良好。

4.4 實驗結果分析

以上方法在保持較高的保真度情況下壓縮比遠高於無損壓縮,而壓縮比和PSNR值均優於JPEG方法。顯然,在性能基本不變的情況下,使用變化范圍的方法速度要快約40%。該方法在多波段遙感數據的高保真壓縮方面也具有良好的效果。

五.圖象壓縮方法比較:

與現有的彩色序列圖象壓縮與解壓演算法相比,我們的演算法有了很大的改進。根據遙感圖像局部相關性較弱、紋理復雜豐富的特點,提出了基於小波分析理論的自適應標量、矢量混合量化壓縮方法。該方法根據遙感圖像小波變換後高頻子圖的局部塊紋理強弱將這些塊劃分為4類,對平坦塊進行高倍壓縮,對紋理塊進行高保真壓縮,使各塊的恢復誤差大致平衡。其主要特點是避免了矢量編碼過程中的碼書訓練和碼書搜索,因而時間性能好,並且對單幅圖像的壓縮比和峰值信噪比(PSNR)優於JPEG方法。此方法與K-L變換去波段相關技術相結合,應用於多波段遙感圖像壓縮領域,收到了良好的效果。

㈩ 多媒體壓縮標准有哪些

H.261:由CCITT(國際電報電話咨詢委員會)通過的用於音頻視頻服務的視頻編碼解碼器(也稱Px64標准),它使用兩種類型的壓縮:一幀中的有損壓縮(基於DCT)和用於幀間壓縮的無損編碼,並在此基礎上使編碼器採用帶有運動估計的DCT和DPCM(差分脈沖編碼調制)的混合方式。這種標准與JPEG及MPEG標准間有明顯的相似性,但關鍵區別是它是為動態使用設計的,並提供完全包含的組織和高水平的交互控制。
JPEG:全稱是Joint Photogragh Coding Experts Group(聯合照片專家組),是一種基於DCT的靜止圖像壓縮和解壓縮演算法,它由ISO(國際標准化組織)和CCITT(國際電報電話咨詢委員會)共同制定,並在1992年後被廣泛採納後成為國際標准。它是把冗長的圖像信號和其它類型的靜止圖像去掉,甚至可以減小到原圖像的百分之一(壓縮比100:1)。但是在這個級別上,圖像的質量並不好;壓縮比為20:1時,能看到圖像稍微有點變化;當壓縮比大於20:1時,一般來說圖像質量開始變壞。
MPEG:是Moving Pictures Experts Group(動態圖像專家組)的英文縮寫,實際上是指一組由ITU和ISO制定發布的視頻、音頻、數據的壓縮標准。它採用的是一種減少圖像冗餘信息的壓縮演算法,它提供的壓縮比可以高達200:1,同時圖像和音響的質量也非常高。現在通常有三個版本:MPEG-1、MPEG-2、MPEG-4以適用於不同帶寬和數字影像質量的要求。它的三個最顯著優點就是兼容性好、壓縮比高(最高可達200:1)、數據失真小。
DVI:其視頻圖像的壓縮演算法的性能與MPEG-1相當,即圖像質量可達到VHS的水平,壓縮後的圖像數據率約為1.5Mb/s。

熱點內容
java返回this 發布:2025-10-20 08:28:16 瀏覽:593
製作腳本網站 發布:2025-10-20 08:17:34 瀏覽:888
python中的init方法 發布:2025-10-20 08:17:33 瀏覽:582
圖案密碼什麼意思 發布:2025-10-20 08:16:56 瀏覽:765
怎麼清理微信視頻緩存 發布:2025-10-20 08:12:37 瀏覽:684
c語言編譯器怎麼看執行過程 發布:2025-10-20 08:00:32 瀏覽:1013
郵箱如何填寫發信伺服器 發布:2025-10-20 07:45:27 瀏覽:255
shell腳本入門案例 發布:2025-10-20 07:44:45 瀏覽:114
怎麼上傳照片瀏覽上傳 發布:2025-10-20 07:44:03 瀏覽:806
python股票數據獲取 發布:2025-10-20 07:39:44 瀏覽:713