簡單的聲音數據ADPCM壓縮方法-電子發燒友網

| 聚豐開發方案開發設計及PCBA批量交付|

▼▼▼

前兩天有朋友發郵件給我，他有2~3k大小的圖像，想用AVR的單片機進行壓縮處理，看我有什么建議。

《刪繁就簡-單片機入門到精通》（我寫的~(#^.^#)）一書中有一章節的內容和數據壓縮有關，我在網上也發布了相關的測試源代碼，這些代碼可以用做參考。

我們常使用的JPG圖片是一種效率較高的壓縮方法，在圖像細節沒有明顯失真的情況下可以達到10倍的壓縮率，不過這個10倍是針對尺寸比較大的圖像，對于小尺寸圖像并不適用。原因是通用的壓縮方法，都需要包含一個頭信息，頭信息會占用一定空間，這樣對于小尺寸圖像雖然圖像數據能有比較好的壓縮率，但加上頭信息最后得到的全部數據縮小的比率就有限。

越是壓縮率高的方法，其算法自然也越復雜，像這位朋友用的是AVR單片機，處理復雜算法的能力有限，幾年前我們用51的單片機測試過160*120大小的圖像，壓縮成JPG需要3~4秒的時間，完全不能滿足應用需求。（壓縮會比解壓縮更費時間）

除了圖像，聲音數據也常常需要進行壓縮處理，不過聲音的壓縮處理方法和圖像會有所不同，大多是提取聲音數據的規律，用數學模型來模擬人喉嚨發聲，這種方法壓縮率高，但需要非常復雜的運算，也不適合低速的單片機用程序實現。

但有一種簡單的聲音壓縮方法例外，這種方法完全是基于被壓縮的數據分布特性，認為聲音數據是在0幅度上下正態分布，幅度越大的值出現的幾率越小，而且采樣所得的數據通常是平滑相連，出現上一點幅度為正最大而下一點幅度為負最小的可能性幾乎為零，兩點間的變化差異大都局限于一定范圍之內，于是將聲音數據處理相鄰兩點的變化值，從而起到壓縮效果，這樣處理的算法也比較簡單。

這里給大家介紹一種簡單的ADPCM處理方法，是我以前在網上收集的。用這種方法實際上也可以用來處理前面圖像數據壓縮的問題，只是需要先將圖像數據預處理為RGB或YUV分量，然后進行壓縮處理。

IMA-ADPCM 算法

-------------------------------------------------------

IMA-ADPCM (ADPCM Adaptive Differential Pulse Code Modulation), 是一種針對 16bit (或者更高?) 聲音波形數據的一種有損壓縮算法, 它將聲音流中每次采樣的 16bit 數據以 4bit 存儲, 所以壓縮比 1:4. 而壓縮/解壓縮算法非常的簡單, 所以是一種低空間消耗,高質量聲音獲得的好途徑. 著名的 WestWood 在它的許多游戲里都使用了這個技術, DUNE II, C&C, RA 等等, 保存聲音的數據文件后綴名為 .AUD 的大多用 IMA-ADPCM 壓縮. (不過 WestWood 的游戲數據文件大多經過打包, 這些小文件統統放進了一個 .MIX 文件包中, 關于解開 .MIX 文件包, 見http://www.geocities.com/SiliconValley/8682)

ADPCM 主要是針對連續的波形數據的, 保存的是波形的變化情況, 以達到描述整個波形的目的. 本文并不想詳細介紹 ADPCM 算法原理, 那些是數學知識,有高等數學基礎的朋友可以自己研究, 云風數學馬馬虎虎, 這里也講不清楚, 但是它的編碼和解碼的過程卻很簡潔, 列在后面, 相信大家能夠看明白.

先給不熟悉聲音信號的儲存的朋友補一課, 不想看就跳過吧 ^_^: 一般游戲中用到的聲音有兩種不同性質的, 一是波形數據, 是經過事先聲音采樣錄制下來的, 采樣時一般按每秒 8千到 4 萬次的頻率(8Khz ~44.4Khz)記錄每次采樣時的聲音強度, 在播放時, 再以同一頻率, 按樣本聲音的強弱變化觸發揚聲器, 聲音就被重現了, 如果你將采樣數據流標在坐標紙上,就會發現是一條波形曲線, 如果采樣時將聲音信號強弱分為 256 級, 就是我們說的 8bit 采樣, 如果分為 65536 級, 就是 16bit 采樣了; 另一是 MIDI 類的, 它是將各種樂器的聲學性質都事先記錄下來, 而數據流中仍舊是按一定頻率記錄, 但不是每秒數千上萬次了, 大約只有幾 Hz 到幾十 Hz, 將幾種樂器按某一音頻和強度觸發描述下來, 經過聲卡合成為波形信號就可以播放了.

8bit 采樣的聲音人耳是可以接受的, 比如 Win95 啟動的音樂, 而 16bit 采樣的聲音可以算是高音質了, 現代游戲中也多采用它. (將聲音強度分的更細沒有太多的意義, 通常都是提高采樣頻率來近一步提高音質) ADPCM 算法卻可以將每次采樣得到的 16bit 數據壓縮到 4bit ;-) 需要注意的是, 如果要壓縮/接壓縮立體聲信號, 請注意采樣時, 聲音信號是放在一起的, 需要將兩個聲道分別處理. OK, 下面列出了其中的奧妙, 請細細品味:

----------------------------------------------------------------

IMA-ADPCM 壓縮過程

首先我們認為聲音信號都是從零開始的,那么需要初始化兩個變量

int index="0",prev_sample:=0;

下面的循環將依次處理聲音數據流, 注意其中的 getnextsample() 應該得到一個 16bit 的采樣數據, 而 outputdata() 可以將計算出來的數據保存起來,程序中用到的 step_table[], index_adjust[] 附在后面:
int index="0",prev_sample:=0;

while (還有數據要處理) {
cur_sample=getnextsample(); // 得到當前的采樣數據
delta="cur"_sample-prev_sample; // 計算出和上一個的增量
if (delta<0) delta="-delta",sb=8;???
else sb="0"; // sb 保存的是符號位

code = 4*delta / step_table[index]; // 根據 steptable[] 得到一個 0~7 的值
if (code>7) code="7"; // 它描述了聲音強度的變化量

index+=index_adjust[code]; // 根據聲音強度調整下次取 steptable 的序號
if (index<0) index="0";??????????? // 便于下次得到更精確的變化量的描述
else if (index>88) index="88";

prev_sample=cur_sample;

outputode(code|sb); // 加上符號位保存起來
}

---------------------------------------------------------

IMA-ADPCM 解壓縮過程

接壓縮實際是壓縮的一個逆過程, 同樣其中的 getnextcode() 應該得到一個編碼, 而 outputsample() 可以將解碼出來的聲音信號保存起來. 這段代碼同樣使用了同一個的 setp_table[] 和 index_adjust() 附在后面:

int index="0",cur_sample:=0;

while (還有數據要處理) {
code="getnextcode"(); // 得到下一個數據

if ((code & 8) != 0) sb="1" else sb="0";
code&=7; // 將 code 分離為數據和符號

delta=(step_table[index]*code) /4 + step_table[index] / 8;
// 后面加的一項是為了減少誤差

if (sb==1) delta="-delta";

cur_Sample+=delta; // 計算出當前的波形數據
if (cur_sample>32767) cur_sample=32767;
else if (cur_sample<-32768) cur_sample:=-32768;

output_sample(cur_sample);

index+=index_adjust[code];
if (index<0) index="0";
if (index>88) index="88";
}

---------------------------------------------------------

附表

int index_adjust[8] = {-1,-1,-1,-1,2,4,6,8};

int step_table[89] = { 7, 8, 9, 10, 11, 12, 13, 14, 16, 17, 19, 21, 23, 25, 28, 31, 34, 37, 41, 45, 50, 55, 60, 66, 73, 80, 88, 97, 107, 118, 130, 143, 157, 173, 190, 209, 230, 253, 279, 307, 337, 371, 408, 449, 494, 544, 598, 658, 724, 796, 876, 963, 1060, 1166, 1282, 1411, 1552, 1707, 1878, 2066, 2272, 2499, 2749, 3024, 3327, 3660, 4026, 4428, 4871, 5358, 5894, 6484, 7132, 7845, 8630, 9493, 10442, 11487, 12635, 13899, 15289, 16818, 18500, 20350, 22385, 24623, 27086, 29794, 32767 };

---------------------------------------------------------
關于 WestWood 的 .AUD 文件,結構比較簡單, 這里順帶提一下, 有興趣可以自己寫處理 AUD 文件的程序 ;-) 其 8bit 的聲音壓縮算法尚不知曉, 但用的最廣泛的 16bit 聲音正是用 IMA-ADPCM 壓縮, 每個 AUD 文件都有一個文件頭, 結構如下:

struct {
unsigned short int samplespersec; // 頻率
long int size; // 除掉文件頭的大小
long int outsize; // 輸出數據大小 (通常是 4 倍)
unsigned char flags; // 位 0 描述是否立體聲, 位 1 描述是否 16 bit
unsigned char type; // 1=WW 壓縮, 99=IMA ADPCM
}

AUD 文件的聲音信號是按塊存放的, 每塊大約 512 字節, 沒一塊都有一個塊頭結構:

struct {
unsigned short int size; // 壓縮過的數據大小
unsigned short int outsize; // 輸出數據大小 (通常是 4 倍)
long int id; // 永遠是 0x0000DEAF
}

---------------------------------------------------------
本文參考了 Vladan Bato 寫的 AUD 文件格式描述. 可以去他的網頁http://www.geocities.com/SiliconValley/8682找到原文和他寫的 AUD,WAV 轉換程序.另外, Allegro 的愛好者可能想自己加入 AUD 的支持(Allegro 3.1 新增 Plug-In 支持, 增加新文件類型很方便), 不妨看看http://www.alphalink.com.au/~tjaden, 這里有完成了的 AUD 支持庫.
---------------------------------------------------------

聚豐開發網址：http://www.qd573.com/kf/

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

方案開發

方案開發

+關注

關注
0

文章
20

瀏覽量
2651
電子開發者

電子開發者

+關注

關注
0

文章
2

瀏覽量
3639

嵌入式操作教程_數字信號處理_音頻編解碼：3-6 AAC音頻解碼實驗

音軌、支持多達15個低頻音軌、具有多種語言的兼容能力、還有多達15個內嵌數據流。 (5)AAC支持更寬的聲音頻率范圍，最高可達到96kHz，最低可達8KHz，遠寬于MP3的16KHz-48kHz的范圍

發表于 04-11 09:22

高性能無損數據解壓縮FPGA IP，LZO無損數據解壓縮IP

LZOAccel-D是一個無損數據解壓縮引擎的FPGA硬件實現，兼容LZO 2.10標準。 Core接收壓縮的輸入數據塊，產生解壓縮后的

發表于 02-25 09:59 ?129次閱讀

高性能無損<b class='flag-5'>數據</b>解<b class='flag-5'>壓縮</b>FPGA IP，LZO無損<b class='flag-5'>數據</b>解<b class='flag-5'>壓縮</b>IP

高性能無損數據壓縮FPGA IP，LZO無損數據壓縮IP

LZOAccel-C是一個無損數據壓縮引擎的FPGA硬件實現，兼容LZO 2.10標準。 Core接收未壓縮的輸入數據塊，產生壓縮后的數據

發表于 01-25 13:39 ?279次閱讀

高性能無損<b class='flag-5'>數據壓縮</b>FPGA IP，LZO無損<b class='flag-5'>數據壓縮</b>IP

線束端子壓縮比的定義及計算方法

端子壓接面積的壓縮比根據行業可以分為三3類，第1是汽車類，第2是家電類，第3是電子類。汽車類的標準最為嚴格，壓縮比需要控制在80%至90%，即端子所有銅線的面積如果以1來表示，壓接后的面積必須在0.8到0.9之間。

發表于 11-28 09:33 ?3387次閱讀

線束端子<b class='flag-5'>壓縮</b>比的定義及計算<b class='flag-5'>方法</b>

MCU通過安全裝載修改壓縮數據有噪音的原因？

MCU通過安全裝載修改壓縮數據,有噪音,壓縮數據來自SigmaStudio, 但裝入 EQ時沒有噪音。原因為何 ?

發表于 11-28 06:18

增益壓縮的意義及矢網實操測量方法

放大器的1dB壓縮點是當實際輸出功率與理想輸出功率相差1dB時，將輸入輸出功率進行簡單計算，即可得到增益和壓縮特性。理想情況下，圖1.1中(輸出功率vs輸入功率)對輸入功率都是線性的

發表于 10-29 10:39 ?438次閱讀

增益<b class='flag-5'>壓縮</b>的意義及矢網實操測量<b class='flag-5'>方法</b>

PCB走線鍍錫：用這種方法，既簡單又漂亮！

發表于 10-17 15:10 ?1868次閱讀

PCB走線鍍錫：用這種<b class='flag-5'>方法</b>，既<b class='flag-5'>簡單</b>又漂亮！

如何用Java播放聲音

聲音API播放一個音頻文件。播放聲音的Java APIs 一般來說， javax.sound 包中的Java Sound APIs提供了兩種播放音頻的方法。在這兩種方法之間，在如何

發表于 10-09 10:56 ?2164次閱讀

Linux中常用的壓縮和解壓縮命令介紹

在Linux中，壓縮和解壓縮文件是常見的操作。有時候，我們需要將大文件壓縮成較小的文件，以便于傳輸和存儲。同時，我們也需要解壓縮文件來獲得原始數據

發表于 07-31 11:50 ?2103次閱讀

transformer模型詳解：Transformer 模型的壓縮方法

剪枝在高稀疏率時往往不可避免地刪除表達神經元，這將導致模型性能嚴重降低。低秩近似則旨在壓縮表達神經元，它對于壓縮神經元中的相干部分十分有效，其本質就是提取神經元共享相干子空間的公共基，該方法在 Transformer 結構上也遇

發表于 07-17 10:50 ?1440次閱讀

從原始音頻數據中檢測火花聲音

電子發燒友網站提供《從原始音頻數據中檢測火花聲音.zip》資料免費下載

發表于 07-03 11:45 ?1次下載

關于1dB增益壓縮點的基本測試方法分享

今天要給大家分享的是關于1dB增益壓縮點的基本測試方法，眾所周知，現代矢量網絡分析儀往往具有功率掃描的功能，可以非常方便地測出1dB增益壓縮點。不過今天介紹的是基于頻譜儀的手動測試方法

發表于 06-13 15:41 ?3264次閱讀

基于QAT硬件壓縮加速器和ZFS文件系統實現

壓縮作為一種有效降低SSD數據寫入量的方法由于受到CPU壓縮/解壓效率不高的影響，在某些情況下吞吐量甚至低于非壓縮IO系統。

發表于 06-09 10:02 ?995次閱讀

數據無損壓縮

在數據存儲和傳輸系統中，增加冗余數據可提高數據的可靠性，而消除或減少冗余數據可降低對存儲容量和傳輸帶寬的要求。本章的核心內容是介紹幾種消除或減少冗余

發表于 06-05 17:34 ?0次下載

LG電視沒有聲音的原因及解決方法

LG電視沒有聲音可能是多種原因導致的，以下是一些常見的原因和解決方法。　　1. 音量未開啟或太低：首先，確認電視的音量是否被關閉或設置得太低，如果是，按下遙控器的音量加號按鈕來增加音量。如果發現音量已經很高，但仍沒有聲音

發表于 06-03 10:31 ?1.2w次閱讀