Android音訊開發（4）：如何儲存和解析wav檔案

阿新 • • 發佈：2019-01-28

無論是文字、影象還是聲音，都必須以一定的格式來組織和儲存起來，這樣播放器才知道以怎樣的方式去解析這一段資料，例如，對於原始的影象資料，我們常見的格式有 YUV、Bitmap，而對於音訊來說，最簡單常見的格式就是 wav 格式了。

wav 格式，與 bitmap 一樣，都是微軟開發的一種檔案格式規範，它們都有一個相似之處，就是整個檔案分為兩部分，第一部分是“檔案頭”，記錄重要的引數資訊，對於音訊而言，就包括：取樣率、通道數、位寬等等，對於影象而言，就包括：影象的寬高、色彩位數等等；第二部分是“資料塊”，即一幀一幀的二進位制資料，對於音訊而言，就是原始的 PCM 資料；對於影象而言，就是 RGB 資料。

前面幾篇文章講了如何利用 Android 平臺的 API 完成原始音訊訊號的採集和播放，而本文則重點關注如何在 Android 平臺上，將採集到的 PCM 音訊資料儲存到 wav 檔案，同時，也介紹如何讀取和解析 wav 檔案。

而文章最後，我還會給出一段 AudioDemo 程式，該程式將最近的幾篇文章涉及到的程式碼綜合起來了，演示了一個完整的 Android 音訊從採集到播放的全過程。

下面言歸正傳，講講如何讀寫 wav 檔案格式。

1. 檔案頭

我們可以簡單地分析一下這個 wav 格式頭，它主要分為三個部分：

第一部分，屬於最“頂層”的資訊塊，通過“ChunkID”來表示這是一個 “RIFF”格式的檔案，通過“Format”填入“WAVE”來標識這是一個 wav 檔案。而“ChunkSize”則記錄了整個 wav 檔案的位元組數。

第二部分，屬於“fmt”資訊塊，主要記錄了本 wav 音訊檔案的詳細音訊引數資訊，例如：通道數、取樣率、位寬等等（含義請參考我的第一篇文章《Android音訊開發（1）：基礎知識》）

第三部分，屬於“data”資訊塊，由“Subchunk2Size”這個欄位來記錄後面儲存的二進位制原始音訊資料的長度。

分析到這裡，我想大家應該就明白了，其實，做一種多媒體格式的解析，也不是一件特別複雜的事，說白了，格式就是一種規範，告訴你，我的二進位制資料是怎麼儲存的，你應該按照什麼樣的方式來解析。

具體而言，我們可以定義一個如下的 Java 類來抽象和描述 wav 檔案頭：

/*

* COPYRIGHT NOTICE

* https://github.com/Jhuster/AudioDemo

*

* @license under the Apache License, Version 2.0

*

* @file WavFileHeader.java

*

* @date 2016/03/19

*/

package com.jhuster.audiodemo.api;

public class WavFileHeader {

public String mChunkID = "RIFF";

public int mChunkSize = 0;

public String mFormat = "WAVE";

public String mSubChunk1ID = "fmt ";

public int mSubChunk1Size = 16;

public short mAudioFormat = 1;

public short mNumChannel = 1;

public int mSampleRate = 8000;

public int mByteRate = 0;

public short mBlockAlign = 0;

public short mBitsPerSample = 8;

public String mSubChunk2ID = "data";

public int mSubChunk2Size = 0;

public WavFileHeader() {

}

public WavFileHeader(int sampleRateInHz, int bitsPerSample, int channels) {

mSampleRate = sampleRateInHz;

mBitsPerSample = (short)bitsPerSample;

mNumChannel = (short)channels;

mByteRate = mSampleRate*mNumChannel*mBitsPerSample/8;

mBlockAlign = (short)(mNumChannel*mBitsPerSample/8);

}

具體每一個欄位的含義，可以參考我上面給出的連結，下面我們再看看如何讀寫 wav 檔案。

2. 讀寫 wav 檔案

文章開頭已經說過，其實說白了，wav 檔案就是一段“檔案頭”+“音訊二進位制資料”，因此：

（1）寫 wav 檔案，其實就是先寫入一個 wav 檔案頭，然後再繼續寫入音訊二進位制資料即可

（2）讀 wav 檔案，其實也就是先讀一個 wav 檔案頭，然後再繼續讀出音訊二進位制資料即可

那麼，在動手寫程式碼之前，有兩點你需要搞清楚：

（1） wav 檔案頭中，有哪些是“變化的”，哪些是“不變的”？

比如：檔案頭開頭的“RIFF”字串就是“不變的”部分，而用來記錄音訊資料總長度的“Subchunk2Size”變數就是屬於“變化的”部分，因為，再音訊資料沒有徹底全部寫完之前，你是無法知道一共寫入了多少位元組的音訊資料的，因此，這個部分，需要用一個變數記錄起來，到全部寫完之後，再使用 Java 的“RandomAccessFile”類，將檔案指標跳轉到“Subchunk2Size”欄位，改寫一下預設值即可。

（2）如何把 int、short 變數與 byte[] 的轉換

因為 wav 檔案都是二進位制的方式讀寫，因此，“WavFileHeader”類中定義的變數都需要轉換為byte位元組流，具體轉換方法如下：

private static byte[] intToByteArray(int data) {

return ByteBuffer.allocate(4).order(ByteOrder.LITTLE_ENDIAN).putInt(data).array();

}

private static byte[] shortToByteArray(short data) {

return ByteBuffer.allocate(2).order(ByteOrder.LITTLE_ENDIAN).putShort(data).array();

}

private static short byteArrayToShort(byte[] b) {

return ByteBuffer.wrap(b).order(ByteOrder.LITTLE_ENDIAN).getShort();

}

private static int byteArrayToInt(byte[] b) {

return ByteBuffer.wrap(b).order(ByteOrder.LITTLE_ENDIAN).getInt();

}

關於 wav 檔案讀寫的類我已經幫大家“封裝”好了，並且結合著前面幾篇文章給出的音訊採集和播放的程式碼，完成了一個 AudioDemo 程式，放在我的 Github 上了，歡迎大家下載執行測試，然後結合著程式碼具體學習 Android 音訊相關技術，程式碼地址：

注：本系列文章的所有程式碼，以後都會併入到該 demo 專案中。

Android音訊開發（4）：如何儲存和解析wav檔案

Android音訊開發（4）：如何儲存和解析wav檔案

Android音訊開發（1）：基礎知識

多媒體開發（12）：解碼aac到wav檔案

使用bottle進行web開發（4）：HTTPError

tensorflow學習（4）：儲存模型Saver.save()的引數命名機制以及restore並建立手寫字型識別引擎

Android專案開發（4）-忘記密碼---驗證碼驗證頁面功能實現

ArcGISEngine二次開發（4）：屬性查詢（2）

ONVIF協議網路攝像機（IPC）客戶端程式開發（4）：使用gSOAP生成Web Services框架程式碼

android Bluetooth 開發（二）：開啟、關閉、搜尋、允許搜尋、檢視

~雜記（4）：阿里和華為rtos 的接管中斷邏輯探索

四國軍棋引擎開發（4）子力判斷和局面評估初步

pytorch學習筆記（五）：儲存和載入模型

Performanced C++ 經驗規則（4）：靜態和多型，亦敵亦友

使用Eclipse RCP進行桌面程式開發（三）：檢視和透檢視

Android開發（2）：資料儲存之一：SharedPrefrences和檔案讀寫

Android-影象識別專案OpenCV（4）：開發思路以及問題

即時通訊音視訊開發（七）：音訊基礎及編碼原理入門

即時通訊音視訊開發（六）：如何開始音訊編解碼技術的學習

iOS開發簡記（4）：錄音AVAudioRecorder

Android studio3.0對於百度地圖api開發（4）——百度地圖地圖覆蓋物製作

Android音訊開發（4）：如何儲存和解析wav檔案

相關推薦