采样率转换算法

发布时间: 2022-10-20 17:19:48

① 关于视频的比特率怎么换算啊

视频中的比特率（码率）原理与声音中的相同，都是指由模拟信号转换为数字信号的采样率。
●码率计算公式
基本的算法是：文件体积=时间X码率/8
这里时间单位是秒，码率除以8，就不用说了。举例，D5的碟，容量4.3G，考虑到音频的不同格式，占用一定的空间，姑且算为600M，视频文件应不大于3.7G，视频长度100分钟（6000秒），计算结果：码率应为4900K。
●码率几点原则
1、码率和质量成正比，但是文件体积也和码率成正比。
2、码率超过一定数值，对图像的质量没有多大影响。
3、DVD的容量有限，无论是标准的4.3G，还是超刻，或是D9，都有极限。

② 720P的比特率应该是多少

720P的比特率没有固定值，不过视频比特率至少要1024Kbps，音频至少要128Kbps。

比特率越高，传送数据速度越快。声音中的比特率是指将模拟声音信号转换成数字声音信号后，单位时间内的二进制数据量，是间接衡量音频质量的一个指标。视频中的比特率（码率）原理与声音中的相同，都是指由模拟信号转换为数字信号后，单位时间内的二进制数据量。

720P是美国电影电视工程师协会（SMPTE)制定的高等级高清数字电视的格式标准，有效显示格式为：1280×720。720P是一种在逐行扫描下达到1280×720的分辨率的显示格式。是数字电影成像技术和计算机技术的融合。

(2)采样率转换算法扩展阅读：

音频采样率是指录音设备在一秒钟内对声音信号的采样次数，采样频率越高声音的还原就越真实越自然。换句话说：采样率好，次数多，就等于存的数据越精细。举个简单的例子：一定时间内，例如1hz，那就是一个音节，同样100hz就是100个音节，越多记录的节点越小，就越准确。

在当今的主流采集卡上，采样频率一般分为8000Hz 、11025Hz 、22050Hz、32000Hz 、44100Hz 、47250Hz 、48000Hz 、50000Hz 、50400Hz、96000或192000Hz，以及384000HZ等。

③ 录音采样率48000还是4100

作者：漂流
链接：https://www.hu.com/question/21896882/answer/163800013
来源：知乎
着作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

为什么是44.1kHz，这可不是某某科学家或者业界菊苣扬言44.1kHz的采样率就足以记录音频文件中的全部有用信息这么一回事。这种说法是瞎编的，也是非常不负责任的。再有人告诉你44.1是某个音频领域专家说的，你就可以一个巴掌扇上去然后给他讲讲下面这个故事（笑）。
事实上，最早的数字录音就是由一台录像机和一部PCM编码器来完成的。当时比较通用的PAL录像制式，其场频50Hz，乘以可用扫描线数294条，乘以一条视频扫描线的磁迹中记录3个音频数据块，等于44100。
然而44100这个数字是极其蛋疼的，说它是数字音频领域的万恶之源也不为过。
96年，英特尔喊上了创新、雅马哈、美国国家半导体、ADI这几个行业巨头，以减少制造成本和降低电路干扰为目标，共同制定了一个叫做AC97的声卡电路规范。说的是声卡要将数字线路和模拟线路两部分分开并分别使用两块芯片，然后内置音效，还有就是要求统一音频输出采样率为48kHz。
最终版本的AC97已经取消了48kHz的硬性规定，不过大部分以AC97规范为标准的声卡都没有遵循最终版而是之前的版本来设计制作的。后来在04年，英特尔又联合了80多家公司和厂商制定了HD Audio规范。这个规范就要比AC97好得多，支持更多采样率，并且能够绕过SRC的干扰。AC97规范的声卡已经开始逐渐被HD Audio替代了，我们现在用的很多笔记本上的瑞昱（Realtek）声卡就是HD Audio。设置里面也可以改为独占模式，允许应用程序独占控制该设备。
-----------------------------------------------------------------------
简单总结一下，如果你是在电脑上播放，最好还是用48000，当然96000也是可以的，如果用44100，就会遇到采样率转换的问题，如果算法不好，就会失真。

④ C/C++，如何将wav文件采样频率从44100转成22050

这是我前段时间写wav文件的一个创建wav文件头的函数，可以参考一下，建议你去看下wav头的格式
typedef struct
{
int iChannel; //声道 1 单声道、2 立体声
int iSamplesPerSec; //采样频率11025, 22050, 44100
int iBitsPerSample; //采样大小每个样本的大小, 取值 8、16
}WAVESETTING,*PWAVESETTING;

BOOL WriteWaveHeader(TCHAR *pszPath, PWAVESETTING pSetting, int iSize, BOOL bCreate)
{
BOOL bRet = FALSE;
HMMIO h;
MMCKINFO ckiRiff, ckiFmt, ckiData;
WAVEFORMATEX fmt;

ZeroMemory(&ckiRiff, sizeof(MMCKINFO));
ckiRiff.cksize = iSize + 36;
ckiRiff.fccType = mmioFOURCC('W','A','V','E');

ZeroMemory(&ckiFmt, sizeof(MMCKINFO));
ckiFmt.ckid = mmioFOURCC('f','m','t',' ');

ZeroMemory(&ckiData, sizeof(MMCKINFO));
ckiData.ckid = mmioFOURCC('d','a','t','a');
ckiData.cksize = iSize;

fmt.wFormatTag = WAVE_FORMAT_PCM;
fmt.nChannels = pSetting->iChannel;
fmt.nSamplesPerSec = pSetting->iSamplesPerSec;
fmt.nAvgBytesPerSec = pSetting->iSamplesPerSec * pSetting->iChannel * pSetting->iBitsPerSample / 8;
fmt.nBlockAlign = pSetting->iChannel * pSetting->iBitsPerSample / 8;
fmt. wBitsPerSample = pSetting->iBitsPerSample;
fmt.cbSize = 0; //When the wFormatTag is PCM, the parameter is abort.

h = mmioOpen(pszPath, NULL, MMIO_CREATE | MMIO_WRITE);
if (h)
{
if ((mmioCreateChunk(h, &ckiRiff, MMIO_CREATERIFF) == MMSYSERR_NOERROR) &&
(mmioCreateChunk(h, &ckiFmt, 0) == MMSYSERR_NOERROR) &&
(mmioWrite(h, PCHAR(&fmt), sizeof(WAVEFORMATEX)) == sizeof(WAVEFORMATEX)) &&
(mmioAscend(h, &ckiFmt, 0) == MMSYSERR_NOERROR) &&
(mmioCreateChunk(h, &ckiData, 0) == MMSYSERR_NOERROR))
bRet = TRUE;
mmioClose(h, 0);
}

return bRet;
}

⑤ 音质的码率（速率）和采样频率有什么联系转换的时候可以把采样频率调大点

它们都是采样的参数啊.
具体看下面吧.我也懒得打字了:P

音频采样解释

数码音频系统是通过将声波波形转换成一连串的二进制数据来再现原始声音的，实现这个步骤使用的设备是模/数转换器（A/D）它以每秒上万次的速率对声波进行采样，每一次采样都记录下了原始模拟声波在某一时刻的状态，称之为样本。将一串的样本连接起来，就可以描述一段声波了，把每一秒钟所采样的数目称为采样频率或采率，单位为HZ（赫兹）。采样频率越高所能描述的声波频率就越高。采样率决定声音频率的范围（相当于音调），可以用数字波形表示。以波形表示的频率范围通常被称为带宽。要正确理解音频采样可以分为采样的位数和采样的频率。

1.采样的位数

采样位数可以理解为采集卡处理声音的分辨率。这个数值越大，分辨率就越高，录制和回放的声音就越真实。我们首先要知道：电脑中的声音文件是用数字0和1来表示的。所以在电脑上录音的本质就是把模拟声音信号转换成数字信号。反之，在播放时则是把数字信号还原成模拟声音信号输出。采集卡的位是指采集卡在采集和播放声音文件时所使用数字声音信号的二进制位数。采集卡的位客观地反映了数字声音信号对输入声音信号描述的准确程度。8位代表2的8次方--256，16位则代表2的16次方--64K。比较一下，一段相同的音乐信息，16位声卡能把它分为64K个精度单位进行处理，而8位声卡只能处理256个精度单位，造成了较大的信号损失，最终的采样效果自然是无法相提并论的。
如今市面上所有的主流产品都是16位的采集卡，而并非有些无知商家所鼓吹的64位乃至128位，他们将采集卡的复音概念与采样位数概念混淆在了一起。如今功能最为强大的采集卡系列采用的EMU10K1芯片虽然号称可以达到32位，但是它只是建立在Direct Sound加速基础上的一种多音频流技术，其本质还是一块16位的声卡。应该说16位的采样精度对于电脑多媒体音频而言已经绰绰有余了。

2.音频采样级别（音频采样频率）

数码音频系统是通过将声波波形转换成一连串的二进制数据来再现原始声音的，实现这个步骤使用的设备是模/数转换器（A/D）它以每秒上万次的速率对声波进行采样，每一次采样都记录下了原始模拟声波在某一时刻的状态，称之为样本。将一串的样本连接起来，就可以描述一段声波了，把每一秒钟所采样的数目称为采样频率或采率，单位为HZ（赫兹）。采样频率越高所能描述的声波频率就越高。
采样频率是指录音设备在一秒钟内对声音信号的采样次数，采样频率越高声音的还原就越真实越自然。在当今的主流采集卡上，采样频率一般共分为22.05KHz、44.1KHz、48KHz三个等级，22.05 KHz只能达到FM广播的声音品质，44.1KHz则是理论上的CD音质界限，48KHz则更加精确一些。对于高于48KHz的采样频率人耳已无法辨别出来了，所以在电脑上没有多少使用价值。
5kHz的采样率仅能达到人们讲话的声音质量。
11kHz的采样率是播放小段声音的最低标准，是CD音质的四分之一。
22kHz采样率的声音可以达到CD音质的一半，目前大多数网站都选用这样的采样率。
44kHz的采样率是标准的CD音质，可以达到很好的听觉效果。

3. 位速说明
位速是指在一个数据流中每秒钟能通过的信息量。您可能看到过音频文件用 “128–Kbps MP3” 或 “64–Kbps WMA” 进行描述的情形。Kbps 表示 “每秒千字节数”，因此数值越大表示数据越多：128–Kbps MP3 音频文件包含的数据量是 64–Kbps WMA 文件的两倍，并占用两倍的空间。（不过在这种情况下，这两种文件听起来没什么两样。原因是什么呢？有些文件格式比其他文件能够更有效地利用数据，64–Kbps WMA 文件的音质与 128–Kbps MP3 的音质相同。）需要了解的重要一点是，位速越高，信息量越大，对这些信息进行解码的处理量就越大，文件需要占用的空间也就越多。
为项目选择适当的位速取决于播放目标：如果您想把制作的 VCD 放在 DVD 播放器上播放，那么视频必须是 1150 Kbps，音频必须是 224 Kbps。典型的 206 MHz Pocket PC 支持的 MPEG 视频可达到 400 Kbps—超过这个限度播放时就会出现异常。

VBR(Variable Bitrate)动态比特率。也就是没有固定的比特率，压缩软件在压缩时根据音频数据即时确定使用什么比特率。这是Xing发展的算法，他们将一首歌的复杂部分用高Bitrate编码，简单部分用低Bitrate编码。主意虽然不错，可惜Xing编码器的VBR算法很差，音质与CBR相去甚远。幸运的是，Lame完美地优化了VBR算法，使之成为MP3的最佳编码模式。这是以质量为前提兼顾文件大小的方式，推荐编码模式。

ABR(Average Bitrate)平均比特率，是VBR的一种插值参数。Lame针对CBR不佳的文件体积比和VBR生成文件大小不定的特点独创了这种编码模式。ABR也被称为“Safe VBR”，它是在指定的平均Bitrate内，以每50帧(30帧约1秒)为一段，低频和不敏感频率使用相对低的流量，高频和大动态表现时使用高流量。举例来说，当指定用192kbps ABR对一段wav文件进行编码时，Lame会将该文件的85%用192kbps固定编码，然后对剩余15%进行动态优化：复杂部分用高于192kbps来编码、简单部分用低于192kbps来编码。与192kbps CBR相比，192kbps ABR在文件大小上相差不多，音质却提高不少。ABR编码在速度上是VBR编码的2到3倍，在128-256kbps范围内质量要好于CBR。可以做为VBR和CBR的一种折衷选择。

CBR(Constant Bitrate)，常数比特率，指文件从头到尾都是一种位速率。相对于VBR和ABR来讲，它压缩出来的文件体积很大，但音质却不会有明显的提高。
对MP3来说Bitrate是最重要的因素，它用来表示每秒钟的音频数据占用了多少个bit(bit per second,简称bps)。这个值越高，音质就越好。

心理声学音频压缩
心理声学一词似乎很令人费解，其实很简单，它就是指“人脑解释声音的方式”。压缩音频的所有形式都是用功能强大的算法将我们听不到的音频信息去掉。例如，如果我扯着嗓子喊一声，同时轻轻地踏一下脚，您就会听到我的喊声，但可能听不到我踏脚的声音。通过去掉踏脚声，就会减少信息量，减小文件的大小，但听起来却没有区别。

⑥ SRC 对于音质会有怎样的影响

原因简单解释就是：采样率对音频信号有影响，非整数倍采样率转换可能会对信号的质量会产生影响，安卓系统劣质的转换算法会把这种影响必然化。采样率是什么？这个东西，我是这么理解的，不算很准确。一段音频是一个整体，读取信号的设备它是不能一个整体来读取的，而是在这个音频上选了无数个点来读，形成无限接近原来信号的读取后数据。这个选取点的制式（密度？速率？）就算是采样率吧。当然采样率高了好，越高选的点越多读取的数据越接近原信号呗。系统本身一般也就只输出一个采样率，所以SRC本身是不可避免的，不过SRC好坏差别比较大，情况也各有不同，早期声卡也喜欢标榜自己有良好的SRC能力。非整数倍采样率转换可能存在对信号不良影响。192是48的整数倍，把母声带改成小格式的时候，转换成48khz的就好很多，转成音乐44.1khz就可能对质量产生影响了。这个有点复杂。在一条线上均匀打192个点，把线擦掉，然后192个点以平均消除的方式去掉四分之三，把剩下48个点连起来，和原来的线差别不大。但是你要192个点留下44.1个点就麻烦了，形状就和原来不一样了。优质的声卡一般都可以解决这个问题，有好一点的算法来完成这种非整数倍的转换，信号损失可以尽量降低。安卓系统的SRC显然是一种比较差的算法……也不知道为啥一直不愿意改，据说和底层语言有关，改起来牵一发动全身拿着安卓机放个48khz音频正玄波扫下频率，谐波还是多的吓人！正常的应该是所以安卓系统音频确实是有比较有大的缺点。只是很多人没意识到，原因是下载来的MP3大部分都是44.1khz的，视频流是48khz的但是一般人看视频又不会听那么细致。如果不幸你听了48KHZ的MP3，这种采样率的MP3还是有一些的，就会感觉这首歌听起来音质很差！声音乱乱的，噪音多，仿佛卡带机时代的轻微搅带！不了解的人肯定觉得就这么一首歌差，应该是片源的问题，也就没多想过去了！所以这个问题关注的人少，有的厂家估计都不知道到今年国内的vivo申请了解决这个问题的专利VRS，才有其他手机厂家关注吧。据我所知，目前有些机型和vivo的产品解决这个问题，应该用的不是优化算法的方式，这个种方式对手机能耗较大。用的应该是自适应切换的方式，算是发挥了中国人聪明才智，搞了个小动作让两种采样率都不用切换了！

⑦ 采样频率如何降低

用一麦克风录制的PCM数据，为16bit、48KHz、单声道，而我希望得到的是16KHz采样率的PCM数据，那就通过降低采样率的方法，去实现48000HZ到16000HZ采样率的转换。
转换原理比较简单，48000HZ降到16000HZ，实际上降了3倍，同一时间的单位区间内，48000HZ采样了3个点，16000HZ则采样了1个点，即从48000HZ的文件中每读取3个数据，就要根据这3个数据去推算得到1个数据，而这个数据对应的就是16000HZ文件中的一个数据。
这里写图片描述
具体实现如下
C语言实现
#define OLD_FILE_PATH "file.pcm"
#define DOWN_FILE_PATH "downsample.pcm"
void pcm_downsample(void)
{
short sRead = 0;
short tempSum = 0;
int size = 0;
int flag = 0;
FILE *fp = fopen(OLD_FILE_PATH, "rb+");
FILE *fp_down = fopen(DOWN_FILE_PATH, "wb+");
while(!feof(fp))
{
size = fread(&sRead, 2, 1, fp); // 一次读两个字节，16bit
if(size>0)
{
tempSum = tempSum + sRead; // 求和
flag++;
if(flag == 3) // 如果取了三个点
{
flag = 0;
tempSum = tempSum/3; // 求平均值，你可以根据自己需要去修改，不一定要求平均值，可以直接取一个点
fwrite(&tempSum, 2, 1, fp_down);
tempSum = 0;
}
}
}

fclose(fp);
fclose(fp
这里我将3个点转换成1个点的算法，是求取平均值的算法，你可以利用其他算法去转换也可以，如果想降低成其他采样率的，只要按照对应的比例去采样，即可。

⑧ mp3中的频率 44100 Hz ，比特 16 Bits ，码率 128 Kbps 它们三个的关系是怎么样的怎么换算

MP3各项参数的意义频率（如44100Hz），比特（如16Bits），码率（如128Kbps）
首先了解一下：音频采样

数码音频系统是通过将声波波形转换成一连串的二进制数据来再现原始声音的，实现这个步骤使用的设备是模/数转换器（A/D）它以每秒上万次的速率对声波进行采样，每一次采样都记录下了原始模拟声波在某一时刻的状态，称之为样本。将一串的样本连接起来，就可以描述一段声波了，把每一秒钟所采样的数目称为采样频率或采率，单位为HZ（赫兹）。采样频率越高所能描述的声波频率就越高。采样率决定声音频率的范围（相当于音调），可以用数字波形表示。以波形表示的频率范围通常被称为带宽。要正确理解音频采样可以分为采样的位数和采样的频率。

1.频率（如44100Hz）：音频采样级别（音频采样频率）

采样位数可以理解为采集卡处理声音的分辨率。这个数值越大，分辨率就越高，录制和回放的声音就越真实。我们首先要知道：电脑中的声音文件是用数字0和1来表示的。所以在电脑上录音的本质就是把模拟声音信号转换成数字信号。反之，在播放时则是把数字信号还原成模拟声音信号输出。采集卡的位是指采集卡在采集和播放声音文件时所使用数字声音信号的二进制位数。采集卡的位客观地反映了数字声音信号对输入声音信号描述的准确程度。8位代表2的8次方--256，16位则代表2的16次方--64K。比较一下，一段相同的音乐信息，16位声卡能把它分为64K个精度单位进行处理，而8位声卡只能处理256个精度单位，造成了较大的信号损失，最终的采样效果自然是无法相提并论的。
如今市面上所有的主流产品都是16位的采集卡，而并非有些无知商家所鼓吹的64位乃至128位，他们将采集卡的复音概念与采样位数概念混淆在了一起。如今功能最为强大的采集卡系列采用的EMU10K1芯片虽然号称可以达到32位，但是它只是建立在Direct Sound加速基础上的一种多音频流技术，其本质还是一块16位的声卡。应该说16位的采样精度对于电脑多媒体音频而言已经绰绰有余了。

2.比特（如16Bits）：音频采样的位数

数码音频系统是通过将声波波形转换成一连串的二进制数据来再现原始声音的，实现这个步骤使用的设备是模/数转换器（A/D）它以每秒上万次的速率对声波进行采样，每一次采样都记录下了原始模拟声波在某一时刻的状态，称之为样本。将一串的样本连接起来，就可以描述一段声波了，把每一秒钟所采样的数目称为采样频率或采率，单位为HZ（赫兹）。采样频率越高所能描述的声波频率就越高。
采样频率是指录音设备在一秒钟内对声音信号的采样次数，采样频率越高声音的还原就越真实越自然。在当今的主流采集卡上，采样频率一般共分为22.05KHz、44.1KHz、48KHz三个等级，22.05 KHz只能达到FM广播的声音品质，44.1KHz则是理论上的CD音质界限，48KHz则更加精确一些。对于高于48KHz的采样频率人耳已无法辨别出来了，所以在电脑上没有多少使用价值。
5kHz的采样率仅能达到人们讲话的声音质量。
11kHz的采样率是播放小段声音的最低标准，是CD音质的四分之一。
22kHz采样率的声音可以达到CD音质的一半，目前大多数网站都选用这样的采样率。
44kHz的采样率是标准的CD音质，可以达到很好的听觉效果。

3.码率（如128Kbps）：码率就是比特率的另一种叫法，也叫位速

比特是二进制单位，就是字节，8位二进制为1比特。位速是指在一个数据流中每秒钟能通过的信息量。您可能看到过音频文件用 “128–Kbps MP3” 或 “64–Kbps WMA” 进行描述的情形。Kbps 表示 “每秒千字节数”，因此数值越大表示数据越多：128–Kbps MP3 音频文件包含的数据量是 64–Kbps WMA 文件的两倍，并占用两倍的空间。（不过在这种情况下，这两种文件听起来没什么两样。原因是什么呢？有些文件格式比其他文件能够更有效地利用数据，64–Kbps WMA 文件的音质与 128–Kbps MP3 的音质相同。）需要了解的重要一点是，位速越高，信息量越大，对这些信息进行解码的处理量就越大，文件需要占用的空间也就越多。
为项目选择适当的位速取决于播放目标：如果您想把制作的 VCD 放在 DVD 播放器上播放，那么视频必须是 1150 Kbps，音频必须是 224 Kbps。典型的 206 MHz Pocket PC 支持的 MPEG 视频可达到 400 Kbps—超过这个限度播放时就会出现异常。

VBR(Variable Bitrate)动态比特率。也就是没有固定的比特率，压缩软件在压缩时根据音频数据即时确定使用什么比特率。这是Xing发展的算法，他们将一首歌的复杂部分用高Bitrate编码，简单部分用低Bitrate编码。主意虽然不错，可惜Xing编码器的VBR算法很差，音质与CBR相去甚远。幸运的是，Lame完美地优化了VBR算法，使之成为MP3的最佳编码模式。这是以质量为前提兼顾文件大小的方式，推荐编码模式。

ABR(Average Bitrate)平均比特率，是VBR的一种插值参数。Lame针对CBR不佳的文件体积比和VBR生成文件大小不定的特点独创了这种编码模式。ABR也被称为“Safe VBR”，它是在指定的平均Bitrate内，以每50帧(30帧约1秒)为一段，低频和不敏感频率使用相对低的流量，高频和大动态表现时使用高流量。举例来说，当指定用192kbps ABR对一段wav文件进行编码时，Lame会将该文件的85%用192kbps固定编码，然后对剩余15%进行动态优化：复杂部分用高于192kbps来编码、简单部分用低于192kbps来编码。与192kbps CBR相比，192kbps ABR在文件大小上相差不多，音质却提高不少。ABR编码在速度上是VBR编码的2到3倍，在128-256kbps范围内质量要好于CBR。可以做为VBR和CBR的一种折衷选择。

CBR(Constant Bitrate)，常数比特率，指文件从头到尾都是一种位速率。相对于VBR和ABR来讲，它压缩出来的文件体积很大，但音质却不会有明显的提高。
对MP3来说Bitrate是最重要的因素，它用来表示每秒钟的音频数据占用了多少个bit(bit per second,简称bps)。这个值越高，音质就越好。

心理声学音频压缩
心理声学一词似乎很令人费解，其实很简单，它就是指“人脑解释声音的方式”。压缩音频的所有形式都是用功能强大的算法将我们听不到的音频信息去掉。例如，如果我扯着嗓子喊一声，同时轻轻地踏一下脚，您就会听到我的喊声，但可能听不到我踏脚的声音。通过去掉踏脚声，就会减少信息量，减小文件的大小，但听起来却没有区别。

(附:心理视觉视频压缩
心理视觉视频压缩与和其对等的音频压缩相似。心理视觉模型去掉的不是我们听不到的音频数据，而是去掉眼睛不需要的视频数据。假设有一个在 60 秒的时间内显示位于同一位置的一把椅子的未经压缩的视频片段，在每帧图像中，都将重复这把椅子的同一数据。如果使用了心理视觉压缩，就会把一帧图像中椅子的数据存储下来，以在接下来的帧中使用。这种压缩类型—叫做“统计数据冗余”—是 WMV、MPEG 和其他视频格式用于压缩视频并同时保持高质量的一种数学窍门。)

一首MP3音乐主要有这么几个参数：频率，比特，码率，长度等。
要理解这些东西，还需要说到音乐文件是怎么在计算机上存储的。请看：

让我们来看看一个很短的例子。要把自然界的模拟声音变成计算机存储的数字文件，需要进行模、数转换。如果按CD质量保存，所以你以44.1KHz的采样频率，立体声，每个采样值16比特的方式进行采样。44.1KHz意味着每秒钟有44100个采样值从你的声音卡（或输入文件）里出来。乘以2是因为你有两个通道。再乘以2是因为每个采样值有两个字节（这是16比特的意思）。那首歌总共会占据：

44100 （样本值/秒） * 2（两个通道）* 2（每样本值两个字节）*60（每分钟60秒） =10584000 （字节）

压缩率，比特率和质量

因为压缩率是比较难以测量，专家们在谈及压缩的强度时使用术语比特率。比特率表示一秒的声音数据会消耗的平均BITS的数量。这里的通常单位是KBPS，即每秒1000 BITS.

在CD上的数字音频信号，比特率是1411.2KBPS。使用了MPEG-2ACC，如同CD音质的声音质量可以达到96KBPS的比特率。

一首标准的MP3，频率，比特，码率这几个参数的值一般都是这样的：44100 Hz，16 Bits，128 Kbps.需要声明的是比特和比特率是不一样的概念：比特就是每个采样值用几比特的二进制代码表示，一般都是8比特，因为是2个通道，所以是16比特。其中码率就是比特率的另一种叫法。128Kbps的意思就是每秒钟消耗128比特的存储空间

说说立体声吧：我们人的耳朵有两个，当一个声源发出声音的时候，因为我们的两只耳朵分别接受到声音，而且因为声音传输的距离不同，造成给两只耳朵的感觉就不同，我们人就通过这二者的差别来判断声源的位置。如果只有一只耳朵的话，那么我们不能判断声源的位置，只能知道声音的大小。立体声音乐至少需要两个通道，当然可以有很多个，来保存不同位置的声音信息，我们听起来就有一种身临其境的感觉。如果我们听的是单声道音乐，给我们的感觉就是声源始终在我们脑袋中间位置。假如你玩立体声的射击游戏，你可以真实的感觉子弹是从哪里打到你身上。

flv转换mp3或者录制MP3的时候，只有比特这个参数影响生成文件的大小，所以采样率尽量选高点吧，声音层次感更清楚。

⑨ 什么是转换采样率

转换采样率是一种音频操作，其目的是在不个改变音乐音调的情况下转换采样率。在通常情况下，整数倍的采样率转换往往可以达到更好的效果，比如44.1KHz到22.05，48KHz到96KHz等等，但假如运用一个从48KHz到44.1KHz的采样率转换，拿创新以往的EMU10K系列产品来说，就会出现问题。其结症在于大多数音乐的标准采样率都是44.1KHz，而创新EMU10K系列的采样率是固定在48KHz上的，这就意味着音频在芯片要受到一进一出两个SRC操作，而这种非整数倍的转换，会有较大的噪声或者谐波出现，这些噪声因转换器的质量高低、算法好坏而定，不合理的算法会比较严重的影响听感。

⑩ lte的采样频率为什么是30.72mhz

ofdm中20Mhz的采样点是2048个，而子载波间隔是15khz，那么2048x15khz=30720khz=30.72Mhz了

阅读全文

热点内容

取随机数php 发布：2025-07-12 12:58:16 浏览：840

如何配置组合音响发布：2025-07-12 12:53:54 浏览：93

c语言幂计算发布：2025-07-12 12:52:36 浏览：566

兔费WLAN密码多少发布：2025-07-12 12:50:59 浏览：861

阿里云分布式存储发布：2025-07-12 12:45:04 浏览：535

sql日志压缩发布：2025-07-12 12:39:53 浏览：343

红点角标算法发布：2025-07-12 12:11:16 浏览：844

开心消消乐服务器繁忙什么情况发布：2025-07-12 12:11:14 浏览：239

数据库的封锁协议发布：2025-07-12 12:10:35 浏览：725

如何配置一台长久耐用的电脑发布：2025-07-12 11:43:03 浏览：602

采样率转换算法

(2)采样率转换算法扩展阅读：

与采样率转换算法相关的资讯