采樣率轉換演算法
① 關於視頻的比特率怎麼換算啊
視頻中的比特率(碼率)原理與聲音中的相同,都是指由模擬信號轉換為數字信號的采樣率。
●碼率計算公式
基本的演算法是:文件體積=時間X碼率/8
這里時間單位是秒,碼率除以8,就不用說了。舉例,D5的碟,容量4.3G,考慮到音頻的不同格式,佔用一定的空間,姑且算為600M,視頻文件應不大於3.7G,視頻長度100分鍾(6000秒),計算結果:碼率應為4900K。
●碼率幾點原則
1、碼率和質量成正比,但是文件體積也和碼率成正比。
2、碼率超過一定數值,對圖像的質量沒有多大影響。
3、DVD的容量有限,無論是標準的4.3G,還是超刻,或是D9,都有極限。
② 720P的 比特率 應該是多少
720P的比特率沒有固定值,不過視頻比特率至少要1024Kbps,音頻至少要128Kbps。
比特率越高,傳送數據速度越快。聲音中的比特率是指將模擬聲音信號轉換成數字聲音信號後,單位時間內的二進制數據量,是間接衡量音頻質量的一個指標。視頻中的比特率(碼率)原理與聲音中的相同,都是指由模擬信號轉換為數字信號後,單位時間內的二進制數據量。
720P是美國電影電視工程師協會(SMPTE)制定的高等級高清數字電視的格式標准,有效顯示格式為:1280×720。720P是一種在逐行掃描下達到1280×720的解析度的顯示格式。是數字電影成像技術和計算機技術的融合。
(2)采樣率轉換演算法擴展閱讀:
音頻采樣率是指錄音設備在一秒鍾內對聲音信號的采樣次數,采樣頻率越高聲音的還原就越真實越自然。換句話說:采樣率好,次數多,就等於存的數據越精細。舉個簡單的例子:一定時間內,例如1hz,那就是一個音節,同樣100hz就是100個音節,越多記錄的節點越小,就越准確。
在當今的主流採集卡上,采樣頻率一般分為8000Hz 、11025Hz 、22050Hz、32000Hz 、44100Hz 、47250Hz 、48000Hz 、50000Hz 、50400Hz、96000或192000Hz,以及384000HZ等。
③ 錄音采樣率48000還是4100
作者:漂流
鏈接:https://www.hu.com/question/21896882/answer/163800013
來源:知乎
著作權歸作者所有。商業轉載請聯系作者獲得授權,非商業轉載請註明出處。
為什麼是44.1kHz,這可不是某某科學家或者業界菊苣揚言44.1kHz的采樣率就足以記錄音頻文件中的全部有用信息這么一回事。這種說法是瞎編的,也是非常不負責任的。再有人告訴你44.1是某個音頻領域專家說的,你就可以一個巴掌扇上去然後給他講講下面這個故事(笑)。
事實上,最早的數字錄音就是由一台錄像機和一部PCM編碼器來完成的。當時比較通用的PAL錄像制式,其場頻50Hz,乘以可用掃描線數294條,乘以一條視頻掃描線的磁跡中記錄3個音頻數據塊,等於44100。
然而44100這個數字是極其蛋疼的,說它是數字音頻領域的萬惡之源也不為過。
96年,英特爾喊上了創新、雅馬哈、美國國家半導體、ADI這幾個行業巨頭,以減少製造成本和降低電路干擾為目標,共同制定了一個叫做AC97的音效卡電路規范。說的是音效卡要將數字線路和模擬線路兩部分分開並分別使用兩塊晶元,然後內置音效,還有就是要求統一音頻輸出采樣率為48kHz。
最終版本的AC97已經取消了48kHz的硬性規定,不過大部分以AC97規范為標準的音效卡都沒有遵循最終版而是之前的版本來設計製作的。後來在04年,英特爾又聯合了80多家公司和廠商制定了HD Audio規范。這個規范就要比AC97好得多,支持更多采樣率,並且能夠繞過SRC的干擾。AC97規范的音效卡已經開始逐漸被HD Audio替代了,我們現在用的很多筆記本上的瑞昱(Realtek)音效卡就是HD Audio。設置裡面也可以改為獨占模式,允許應用程序獨占控制該設備。
-----------------------------------------------------------------------
簡單總結一下,如果你是在電腦上播放,最好還是用48000,當然96000也是可以的,如果用44100,就會遇到 采樣率轉換的問題,如果演算法不好,就會失真。
④ C/C++,如何將wav文件采樣頻率從44100轉成22050
這是我前段時間寫wav文件的一個創建wav文件頭的函數,可以參考一下,建議你去看下wav頭的格式
typedef struct
{
int iChannel; //聲道 1 單聲道、2 立體聲
int iSamplesPerSec; //采樣頻率11025, 22050, 44100
int iBitsPerSample; //采樣大小每個樣本的大小, 取值 8、16
}WAVESETTING,*PWAVESETTING;
BOOL WriteWaveHeader(TCHAR *pszPath, PWAVESETTING pSetting, int iSize, BOOL bCreate)
{
BOOL bRet = FALSE;
HMMIO h;
MMCKINFO ckiRiff, ckiFmt, ckiData;
WAVEFORMATEX fmt;
ZeroMemory(&ckiRiff, sizeof(MMCKINFO));
ckiRiff.cksize = iSize + 36;
ckiRiff.fccType = mmioFOURCC('W','A','V','E');
ZeroMemory(&ckiFmt, sizeof(MMCKINFO));
ckiFmt.ckid = mmioFOURCC('f','m','t',' ');
ZeroMemory(&ckiData, sizeof(MMCKINFO));
ckiData.ckid = mmioFOURCC('d','a','t','a');
ckiData.cksize = iSize;
fmt.wFormatTag = WAVE_FORMAT_PCM;
fmt.nChannels = pSetting->iChannel;
fmt.nSamplesPerSec = pSetting->iSamplesPerSec;
fmt.nAvgBytesPerSec = pSetting->iSamplesPerSec * pSetting->iChannel * pSetting->iBitsPerSample / 8;
fmt.nBlockAlign = pSetting->iChannel * pSetting->iBitsPerSample / 8;
fmt. wBitsPerSample = pSetting->iBitsPerSample;
fmt.cbSize = 0; //When the wFormatTag is PCM, the parameter is abort.
h = mmioOpen(pszPath, NULL, MMIO_CREATE | MMIO_WRITE);
if (h)
{
if ((mmioCreateChunk(h, &ckiRiff, MMIO_CREATERIFF) == MMSYSERR_NOERROR) &&
(mmioCreateChunk(h, &ckiFmt, 0) == MMSYSERR_NOERROR) &&
(mmioWrite(h, PCHAR(&fmt), sizeof(WAVEFORMATEX)) == sizeof(WAVEFORMATEX)) &&
(mmioAscend(h, &ckiFmt, 0) == MMSYSERR_NOERROR) &&
(mmioCreateChunk(h, &ckiData, 0) == MMSYSERR_NOERROR))
bRet = TRUE;
mmioClose(h, 0);
}
return bRet;
}
⑤ 音質的 碼率(速率)和采樣頻率有什麼聯系轉換的時候可以把采樣頻率調大點
它們都是采樣的參數啊.
具體看下面吧.我也懶得打字了:P
音頻采樣 解釋
數碼音頻系統是通過將聲波波形轉換成一連串的二進制數據來再現原始聲音的,實現這個步驟使用的設備是模/數轉換器(A/D)它以每秒上萬次的速率對聲波進行采樣,每一次采樣都記錄下了原始模擬聲波在某一時刻的狀態,稱之為樣本。將一串的樣本連接起來,就可以描述一段聲波了,把每一秒鍾所采樣的數目稱為采樣頻率或采率,單位為HZ(赫茲)。采樣頻率越高所能描述的聲波頻率就越高。采樣率決定聲音頻率的范圍(相當於音調),可以用數字波形表示。以波形表示的頻率范圍通常被稱為帶寬。要正確理解音頻采樣可以分為采樣的位數和采樣的頻率。
1.采樣的位數
采樣位數可以理解為採集卡處理聲音的解析度。這個數值越大,解析度就越高,錄制和回放的聲音就越真實。我們首先要知道:電腦中的聲音文件是用數字0和1來表示的。所以在電腦上錄音的本質就是把模擬聲音信號轉換成數字信號。反之,在播放時則是把數字信號還原成模擬聲音信號輸出。採集卡的位是指採集卡在採集和播放聲音文件時所使用數字聲音信號的二進制位數。採集卡的位客觀地反映了數字聲音信號對輸入聲音信號描述的准確程度。8位代表2的8次方--256,16位則代表2的16次方--64K。比較一下,一段相同的音樂信息,16位音效卡能把它分為64K個精度單位進行處理,而8位音效卡只能處理256個精度單位,造成了較大的信號損失,最終的采樣效果自然是無法相提並論的。
如今市面上所有的主流產品都是16位的採集卡,而並非有些無知商家所鼓吹的64位乃至128位,他們將採集卡的復音概念與采樣位數概念混淆在了一起。如今功能最為強大的採集卡系列採用的EMU10K1晶元雖然號稱可以達到32位,但是它只是建立在Direct Sound加速基礎上的一種多音頻流技術,其本質還是一塊16位的音效卡。應該說16位的采樣精度對於電腦多媒體音頻而言已經綽綽有餘了。
2.音頻采樣級別(音頻采樣頻率)
數碼音頻系統是通過將聲波波形轉換成一連串的二進制數據來再現原始聲音的,實現這個步驟使用的設備是模/數轉換器(A/D)它以每秒上萬次的速率對聲波進行采樣,每一次采樣都記錄下了原始模擬聲波在某一時刻的狀態,稱之為樣本。將一串的樣本連接起來,就可以描述一段聲波了,把每一秒鍾所采樣的數目稱為采樣頻率或采率,單位為HZ(赫茲)。采樣頻率越高所能描述的聲波頻率就越高。
采樣頻率是指錄音設備在一秒鍾內對聲音信號的采樣次數,采樣頻率越高聲音的還原就越真實越自然。在當今的主流採集卡上,采樣頻率一般共分為22.05KHz、44.1KHz、48KHz三個等級,22.05 KHz只能達到FM廣播的聲音品質,44.1KHz則是理論上的CD音質界限,48KHz則更加精確一些。對於高於48KHz的采樣頻率人耳已無法辨別出來了,所以在電腦上沒有多少使用價值。
5kHz的采樣率僅能達到人們講話的聲音質量。
11kHz的采樣率是播放小段聲音的最低標准,是CD音質的四分之一。
22kHz采樣率的聲音可以達到CD音質的一半,目前大多數網站都選用這樣的采樣率。
44kHz的采樣率是標準的CD音質,可以達到很好的聽覺效果。
3. 位速說明
位速是指在一個數據流中每秒鍾能通過的信息量。您可能看到過音頻文件用 「128–Kbps MP3」 或 「64–Kbps WMA」 進行描述的情形。Kbps 表示 「每秒千位元組數」,因此數值越大表示數據越多:128–Kbps MP3 音頻文件包含的數據量是 64–Kbps WMA 文件的兩倍,並佔用兩倍的空間。(不過在這種情況下,這兩種文件聽起來沒什麼兩樣。原因是什麼呢?有些文件格式比其他文件能夠更有效地利用數據,64–Kbps WMA 文件的音質與 128–Kbps MP3 的音質相同。)需要了解的重要一點是,位速越高,信息量越大,對這些信息進行解碼的處理量就越大,文件需要佔用的空間也就越多。
為項目選擇適當的位速取決於播放目標:如果您想把製作的 VCD 放在 DVD 播放器上播放,那麼視頻必須是 1150 Kbps,音頻必須是 224 Kbps。典型的 206 MHz Pocket PC 支持的 MPEG 視頻可達到 400 Kbps—超過這個限度播放時就會出現異常。
VBR(Variable Bitrate)動態比特率。也就是沒有固定的比特率,壓縮軟體在壓縮時根據音頻數據即時確定使用什麼比特率。這是Xing發展的演算法,他們將一首歌的復雜部分用高Bitrate編碼,簡單部分用低Bitrate編碼。主意雖然不錯,可惜Xing編碼器的VBR演算法很差,音質與CBR相去甚遠。幸運的是,Lame完美地優化了VBR演算法,使之成為MP3的最佳編碼模式。這是以質量為前提兼顧文件大小的方式,推薦編碼模式。
ABR(Average Bitrate)平均比特率,是VBR的一種插值參數。Lame針對CBR不佳的文件體積比和VBR生成文件大小不定的特點獨創了這種編碼模式。ABR也被稱為「Safe VBR」,它是在指定的平均Bitrate內,以每50幀(30幀約1秒)為一段,低頻和不敏感頻率使用相對低的流量,高頻和大動態表現時使用高流量。舉例來說,當指定用192kbps ABR對一段wav文件進行編碼時,Lame會將該文件的85%用192kbps固定編碼,然後對剩餘15%進行動態優化:復雜部分用高於192kbps來編碼、簡單部分用低於192kbps來編碼。與192kbps CBR相比,192kbps ABR在文件大小上相差不多,音質卻提高不少。ABR編碼在速度上是VBR編碼的2到3倍,在128-256kbps范圍內質量要好於CBR。可以做為VBR和CBR的一種折衷選擇。
CBR(Constant Bitrate),常數比特率,指文件從頭到尾都是一種位速率。相對於VBR和ABR來講,它壓縮出來的文件體積很大,但音質卻不會有明顯的提高。
對MP3來說Bitrate是最重要的因素,它用來表示每秒鍾的音頻數據佔用了多少個bit(bit per second,簡稱bps)。這個值越高,音質就越好。
心理聲學音頻壓縮
心理聲學 一詞似乎很令人費解,其實很簡單,它就是指「人腦解釋聲音的方式」。壓縮音頻的所有形式都是用功能強大的演算法將我們聽不到的音頻信息去掉。例如,如果我扯著嗓子喊一聲,同時輕輕地踏一下腳,您就會聽到我的喊聲,但可能聽不到我踏腳的聲音。通過去掉踏腳聲,就會減少信息量,減小文件的大小,但聽起來卻沒有區別。
⑥ SRC 對於音質會有怎樣的影響
原因簡單解釋就是:采樣率對音頻信號有影響,非整數倍采樣率轉換可能會對信號的質量會產生影響,安卓系統劣質的轉換演算法會把這種影響必然化。采樣率是什麼?這個東西,我是這么理解的,不算很准確。一段音頻是一個整體,讀取信號的設備它是不能一個整體來讀取的,而是在這個音頻上選了無數個點來讀,形成無限接近原來信號的讀取後數據。這個選取點的制式(密度?速率?)就算是采樣率吧。當然采樣率高了好,越高選的點越多讀取的數據越接近原信號唄。 系統本身一般也就只輸出一個采樣率,所以SRC本身是不可避免的,不過SRC好壞差別比較大,情況也各有不同,早期音效卡也喜歡標榜自己有良好的SRC能力。 非整數倍采樣率轉換可能存在對信號不良影響。192是48的整數倍,把母聲帶改成小格式的時候,轉換成48khz的就好很多,轉成音樂44.1khz就可能對質量產生影響了。這個有點復雜。在一條線上均勻打192個點,把線擦掉,然後192個點以平均消除的方式去掉四分之三,把剩下48個點連起來,和原來的線差別不大。但是你要192個點留下44.1個點就麻煩了,形狀就和原來不一樣了。 優質的音效卡一般都可以解決這個問題,有好一點的演算法來完成這種非整數倍的轉換,信號損失可以盡量降低。 安卓系統的SRC顯然是一種比較差的演算法……也不知道為啥一直不願意改,據說和底層語言有關,改起來牽一發動全身拿著安卓機放個48khz音頻正玄波掃下頻率,諧波還是多的嚇人! 正常的應該是所以安卓系統音頻確實是有比較有大的缺點。 只是很多人沒意識到,原因是下載來的MP3大部分都是44.1khz的,視頻流是48khz的但是一般人看視頻又不會聽那麼細致。如果不幸你聽了48KHZ的MP3,這種采樣率的MP3還是有一些的,就會感覺這首歌聽起來音質很差!聲音亂亂的,噪音多,彷彿卡帶機時代的輕微攪帶! 不了解的人肯定覺得就這么一首歌差,應該是片源的問題,也就沒多想過去了! 所以這個問題關注的人少,有的廠家估計都不知道 到今年國內的vivo申請了解決這個問題的專利VRS,才有其他手機廠家關注吧。 據我所知,目前有些機型和vivo的產品解決這個問題,應該用的不是優化演算法的方式,這個種方式對手機能耗較大。用的應該是自適應切換的方式,算是發揮了中國人聰明才智,搞了個小動作讓兩種采樣率都不用切換了!
⑦ 采樣頻率如何降低
用一麥克風錄制的PCM數據,為16bit、48KHz、單聲道,而我希望得到的是16KHz采樣率的PCM數據,那就通過降低采樣率的方法,去實現48000HZ到16000HZ采樣率的轉換。
轉換原理比較簡單,48000HZ降到16000HZ,實際上降了3倍,同一時間的單位區間內,48000HZ采樣了3個點,16000HZ則采樣了1個點,即從48000HZ的文件中每讀取3個數據,就要根據這3個數據去推算得到1個數據,而這個數據對應的就是16000HZ文件中的一個數據。
這里寫圖片描述
具體實現如下
C語言實現
#define OLD_FILE_PATH "file.pcm"
#define DOWN_FILE_PATH "downsample.pcm"
void pcm_downsample(void)
{
short sRead = 0;
short tempSum = 0;
int size = 0;
int flag = 0;
FILE *fp = fopen(OLD_FILE_PATH, "rb+");
FILE *fp_down = fopen(DOWN_FILE_PATH, "wb+");
while(!feof(fp))
{
size = fread(&sRead, 2, 1, fp); // 一次讀兩個位元組,16bit
if(size>0)
{
tempSum = tempSum + sRead; // 求和
flag++;
if(flag == 3) // 如果取了三個點
{
flag = 0;
tempSum = tempSum/3; // 求平均值,你可以根據自己需要去修改,不一定要求平均值,可以直接取一個點
fwrite(&tempSum, 2, 1, fp_down);
tempSum = 0;
}
}
}
fclose(fp);
fclose(fp
這里我將3個點轉換成1個點的演算法,是求取平均值的演算法,你可以利用其他演算法去轉換也可以,如果想降低成其他采樣率的,只要按照對應的比例去采樣,即可。
⑧ mp3中的頻率 44100 Hz ,比特 16 Bits ,碼率 128 Kbps 它們三個的關系是怎麼樣的怎麼換算
MP3各項參數的意義 頻率(如44100Hz),比特(如16Bits),碼率(如128Kbps)
首先了解一下:音頻采樣
數碼音頻系統是通過將聲波波形轉換成一連串的二進制數據來再現原始聲音的,實現這個步驟使用的設備是模/數轉換器(A/D)它以每秒上萬次的速率對聲波進行采樣,每一次采樣都記錄下了原始模擬聲波在某一時刻的狀態,稱之為樣本。將一串的樣本連接起來,就可以描述一段聲波了,把每一秒鍾所采樣的數目稱為采樣頻率或采率,單位為HZ(赫茲)。采樣頻率越高所能描述的聲波頻率就越高。采樣率決定聲音頻率的范圍(相當於音調),可以用數字波形表示。以波形表示的頻率范圍通常被稱為帶寬。要正確理解音頻采樣可以分為采樣的位數和采樣的頻率。
1.頻率(如44100Hz):音頻采樣級別(音頻采樣頻率)
采樣位數可以理解為採集卡處理聲音的解析度。這個數值越大,解析度就越高,錄制和回放的聲音就越真實。我們首先要知道:電腦中的聲音文件是用數字0和1來表示的。所以在電腦上錄音的本質就是把模擬聲音信號轉換成數字信號。反之,在播放時則是把數字信號還原成模擬聲音信號輸出。採集卡的位是指採集卡在採集和播放聲音文件時所使用數字聲音信號的二進制位數。採集卡的位客觀地反映了數字聲音信號對輸入聲音信號描述的准確程度。8位代表2的8次方--256,16位則代表2的16次方--64K。比較一下,一段相同的音樂信息,16位音效卡能把它分為64K個精度單位進行處理,而8位音效卡只能處理256個精度單位,造成了較大的信號損失,最終的采樣效果自然是無法相提並論的。
如今市面上所有的主流產品都是16位的採集卡,而並非有些無知商家所鼓吹的64位乃至128位,他們將採集卡的復音概念與采樣位數概念混淆在了一起。如今功能最為強大的採集卡系列採用的EMU10K1晶元雖然號稱可以達到32位,但是它只是建立在Direct Sound加速基礎上的一種多音頻流技術,其本質還是一塊16位的音效卡。應該說16位的采樣精度對於電腦多媒體音頻而言已經綽綽有餘了。
2.比特(如16Bits):音頻采樣的位數
數碼音頻系統是通過將聲波波形轉換成一連串的二進制數據來再現原始聲音的,實現這個步驟使用的設備是模/數轉換器(A/D)它以每秒上萬次的速率對聲波進行采樣,每一次采樣都記錄下了原始模擬聲波在某一時刻的狀態,稱之為樣本。將一串的樣本連接起來,就可以描述一段聲波了,把每一秒鍾所采樣的數目稱為采樣頻率或采率,單位為HZ(赫茲)。采樣頻率越高所能描述的聲波頻率就越高。
采樣頻率是指錄音設備在一秒鍾內對聲音信號的采樣次數,采樣頻率越高聲音的還原就越真實越自然。在當今的主流採集卡上,采樣頻率一般共分為22.05KHz、44.1KHz、48KHz三個等級,22.05 KHz只能達到FM廣播的聲音品質,44.1KHz則是理論上的CD音質界限,48KHz則更加精確一些。對於高於48KHz的采樣頻率人耳已無法辨別出來了,所以在電腦上沒有多少使用價值。
5kHz的采樣率僅能達到人們講話的聲音質量。
11kHz的采樣率是播放小段聲音的最低標准,是CD音質的四分之一。
22kHz采樣率的聲音可以達到CD音質的一半,目前大多數網站都選用這樣的采樣率。
44kHz的采樣率是標準的CD音質,可以達到很好的聽覺效果。
3.碼率(如128Kbps):碼率就是比特率的另一種叫法,也叫位速
比特是二進制單位,就是位元組,8位二進制為1比特。位速是指在一個數據流中每秒鍾能通過的信息量。您可能看到過音頻文件用 「128–Kbps MP3」 或 「64–Kbps WMA」 進行描述的情形。Kbps 表示 「每秒千位元組數」,因此數值越大表示數據越多:128–Kbps MP3 音頻文件包含的數據量是 64–Kbps WMA 文件的兩倍,並佔用兩倍的空間。(不過在這種情況下,這兩種文件聽起來沒什麼兩樣。原因是什麼呢?有些文件格式比其他文件能夠更有效地利用數據,64–Kbps WMA 文件的音質與 128–Kbps MP3 的音質相同。)需要了解的重要一點是,位速越高,信息量越大,對這些信息進行解碼的處理量就越大,文件需要佔用的空間也就越多。
為項目選擇適當的位速取決於播放目標:如果您想把製作的 VCD 放在 DVD 播放器上播放,那麼視頻必須是 1150 Kbps,音頻必須是 224 Kbps。典型的 206 MHz Pocket PC 支持的 MPEG 視頻可達到 400 Kbps—超過這個限度播放時就會出現異常。
VBR(Variable Bitrate)動態比特率。也就是沒有固定的比特率,壓縮軟體在壓縮時根據音頻數據即時確定使用什麼比特率。這是Xing發展的演算法,他們將一首歌的復雜部分用高Bitrate編碼,簡單部分用低Bitrate編碼。主意雖然不錯,可惜Xing編碼器的VBR演算法很差,音質與CBR相去甚遠。幸運的是,Lame完美地優化了VBR演算法,使之成為MP3的最佳編碼模式。這是以質量為前提兼顧文件大小的方式,推薦編碼模式。
ABR(Average Bitrate)平均比特率,是VBR的一種插值參數。Lame針對CBR不佳的文件體積比和VBR生成文件大小不定的特點獨創了這種編碼模式。ABR也被稱為「Safe VBR」,它是在指定的平均Bitrate內,以每50幀(30幀約1秒)為一段,低頻和不敏感頻率使用相對低的流量,高頻和大動態表現時使用高流量。舉例來說,當指定用192kbps ABR對一段wav文件進行編碼時,Lame會將該文件的85%用192kbps固定編碼,然後對剩餘15%進行動態優化:復雜部分用高於192kbps來編碼、簡單部分用低於192kbps來編碼。與192kbps CBR相比,192kbps ABR在文件大小上相差不多,音質卻提高不少。ABR編碼在速度上是VBR編碼的2到3倍,在128-256kbps范圍內質量要好於CBR。可以做為VBR和CBR的一種折衷選擇。
CBR(Constant Bitrate),常數比特率,指文件從頭到尾都是一種位速率。相對於VBR和ABR來講,它壓縮出來的文件體積很大,但音質卻不會有明顯的提高。
對MP3來說Bitrate是最重要的因素,它用來表示每秒鍾的音頻數據佔用了多少個bit(bit per second,簡稱bps)。這個值越高,音質就越好。
心理聲學音頻壓縮
心理聲學 一詞似乎很令人費解,其實很簡單,它就是指「人腦解釋聲音的方式」。壓縮音頻的所有形式都是用功能強大的演算法將我們聽不到的音頻信息去掉。例如,如果我扯著嗓子喊一聲,同時輕輕地踏一下腳,您就會聽到我的喊聲,但可能聽不到我踏腳的聲音。通過去掉踏腳聲,就會減少信息量,減小文件的大小,但聽起來卻沒有區別。
(附:心理視覺視頻壓縮
心理視覺視頻壓縮與和其對等的音頻壓縮相似。心理視覺模型去掉的不是我們聽不到的音頻數據,而是去掉眼睛不需要的視頻數據。假設有一個在 60 秒的時間內顯示位於同一位置的一把椅子的未經壓縮的視頻片段,在每幀圖像中,都將重復這把椅子的同一數據。如果使用了心理視覺壓縮,就會把一幀圖像中椅子的數據存儲下來,以在接下來的幀中使用。這種壓縮類型—叫做「統計數據冗餘」—是 WMV、MPEG 和其他視頻格式用於壓縮視頻並同時保持高質量的一種數學竅門。)
一首MP3音樂主要有這么幾個參數:頻率,比特,碼率,長度等。
要理解這些東西,還需要說到音樂文件是怎麼在計算機上存儲的。請看:
讓我們來看看一個很短的例子。要把自然界的模擬聲音變成計算機存儲的數字文件,需要進行模、數轉換。如果按CD質量保存,所以你以44.1KHz的采樣頻率,立體聲,每個采樣值16比特的方式進行采樣。44.1KHz意味著每秒鍾有44100個采樣值從你的聲音卡(或輸入文件)里出來。乘以2是因為你有兩個通道。再乘以2是因為每個采樣值有兩個位元組(這是16比特的意思)。那首歌總共會占據:
44100 (樣本值/秒) * 2(兩個通道)* 2(每樣本值兩個位元組)*60(每分鍾60秒) =10584000 (位元組)
壓縮率,比特率和質量
因為壓縮率是比較難以測量,專家們在談及壓縮的強度時使用術語比特率。比特率表示一秒的聲音數據會消耗的平均BITS的數量。這里的通常單位是KBPS,即每秒1000 BITS.
在CD上的數字音頻信號,比特率是1411.2KBPS。使用了MPEG-2ACC,如同CD音質的聲音質量可以達到96KBPS的比特率。
一首標準的MP3,頻率,比特,碼率這幾個參數的值一般都是這樣的:44100 Hz,16 Bits,128 Kbps.需要聲明的是比特和比特率是不一樣的概念:比特就是每個采樣值用幾比特的二進制代碼表示,一般都是8比特,因為是2個通道,所以是16比特。其中碼率就是比特率的另一種叫法。128Kbps的意思就是每秒鍾消耗128比特的存儲空間
說說立體聲吧:我們人的耳朵有兩個,當一個聲源發出聲音的時候,因為我們的兩只耳朵分別接受到聲音,而且因為聲音傳輸的距離不同,造成給兩只耳朵的感覺就不同,我們人就通過這二者的差別來判斷聲源的位置。如果只有一隻耳朵的話,那麼我們不能判斷聲源的位置,只能知道聲音的大小。立體聲音樂至少需要兩個通道,當然可以有很多個,來保存不同位置的聲音信息,我們聽起來就有一種身臨其境的感覺。如果我們聽的是單聲道音樂,給我們的感覺就是聲源始終在我們腦袋中間位置。假如你玩立體聲的射擊游戲,你可以真實的感覺子彈是從哪裡打到你身上。
flv轉換mp3或者錄制MP3的時候,只有比特這個參數影響生成文件的大小,所以采樣率盡量選高點吧,聲音層次感更清楚。
⑨ 什麼是轉換采樣率
轉換采樣率是一種音頻操作,其目的是在不個改變音樂音調的情況下轉換采樣率。在通常情況下,整數倍的采樣率轉換往往可以達到更好的效果,比如44.1KHz到22.05,48KHz到96KHz等等,但假如運用一個從48KHz到44.1KHz的采樣率轉換,拿創新以往的EMU10K系列產品來說,就會出現問題。其結症在於大多數音樂的標准采樣率都是44.1KHz,而創新EMU10K系列的采樣率是固定在48KHz上的,這就意味著音頻在晶元要受到一進一出兩個SRC操作,而這種非整數倍的轉換,會有較大的雜訊或者諧波出現,這些雜訊因轉換器的質量高低、演算法好壞而定,不合理的演算法會比較嚴重的影響聽感。
⑩ lte的采樣頻率為什麼是30.72mhz
ofdm中20Mhz的采樣點是2048個,而子載波間隔是15khz,那麼2048x15khz=30720khz=30.72Mhz了