音訊演算法之小黃人變聲附完整C程式碼

阿新 • • 發佈：2018-12-11

都稍微講過變聲的原理和具體實現。

大家都知道，演算法從實現到最後工程應用，中間的環節和問題特別多。

尤其是編碼的架構設計，好的資料結構和程式碼邏輯封裝肯定是可複用，元件化的。

我也提及到了。

會做一些演算法編碼優化相關的分享。

而有時候我總覺得文字表達很蒼白，

所以我儘可能地把程式碼寫得簡潔易懂，

一方面是便於基礎差的朋友學習。

另一方面也是為了自己在編碼以及思考的時候，能更加清晰。

當然，變聲演算法絕大多數朋友都會選擇一些開源的或者商業sdk去做二次開發。

例如:

但如果僅僅停留在使用的階段，它就是一個黑盒子。

知其然，卻不知其所以然。

是遠遠不夠的。

有時候我們是要站在巨人的肩膀上去看到更美麗的風景。

但是，我希望是一群人，而不是一個人。

也許大家也發現了，我寫的大多數演算法，是純c無第三方依賴的。

是不是就會懷疑，我就只會寫c語言？

不是的，我所掌握的程式語言：

主要： c,c++,python,彙編

其次：pascal,c#,js,lua,go等

程式語言只是一個工具，關鍵還是演算法思路。

用純c寫的主要目的，是為了破除一些第三方依賴，

不要一知半解地使用黑盒子。

當然，其次的好處就是跨平臺，便攜，可複用。

這樣，一切瞭然於心。

為什麼不可以造輪子呢？

只要你造的輪子是有用的，

不管是用於觀賞用於學習還是其他用途。

在我瞭解到一些音訊演算法的思路之後，

變聲演算法的思路，

我覺得它的思路非常適用於擴充套件到大多數音訊演算法實現，

而且可複用度比較高。

所以，將它梳理開源，就顯得特別有意義。

而大家可以基於這個實現，進一步去改進或者學習音訊演算法，

例如降噪，增益等等。

因為這個編碼實現的設計是完全可以適用到音訊演算法應用場景的。

邏輯也非常清晰。

專案地址：

當然為了便於一些朋友的學習使用，

示例程式碼提供一個簡易的實現，

模擬變聲為小黃人。

int main(int argc, char *argv[]) {
    printf("Audio Processing \n");
    printf("blog:http://cpuimage.cnblogs.com/ \n");
    printf("Pitch Shifting Using The Fourier Transform\n 
");

    if (argc < 2)
        return -1;

    char *in_file = argv[1];
    uint32_t sampleRate = 0;
    uint64_t totalSampleCount = 0;
    uint32_t channels = 0;
    short *data_in = wavRead_s16(in_file, &sampleRate, &totalSampleCount, &channels);
    if (data_in != NULL) {
        float pitchShift = 0.9f;
        size_t ms = 50;
        size_t overSampling = 4;
        size_t frameSize = sampleRate * ms / 1000;
        frameSize += frameSize % 2;
        planData pitchPlanData = {0};
        double startTime = now();
        makePlanData(frameSize, overSampling, sampleRate, &pitchPlanData);
        pitchshift(pitchShift, data_in, data_in, totalSampleCount, &pitchPlanData);
        // turn to minion pitch
        {
            totalSampleCount /= 2;
            short *samples = data_in;
            for (int i = 0; i < totalSampleCount; i++) {
                data_in[i] = samples[0];
                samples += 2;
            }
        }
        double time_interval = calcElapsed(startTime, now());
        freePlanData(&pitchPlanData);
        printf("time interval: %f ms\n ", (time_interval * 1000));
    }
    char drive[3];
    char dir[256];
    char fname[256];
    char ext[256];
    char out_file[1024];
    splitpath(in_file, drive, dir, fname, ext);
    sprintf(out_file, "%s%s%s_out%s", drive, dir, fname, ext);
    wavWrite_s16(out_file, data_in, sampleRate, totalSampleCount);
    if (data_in) {
        free(data_in);
    }
    printf("press any key to exit.\n");
    getchar();
    return 0;
}

不做多解釋，大家可以參閱pitchshift函式的實現，

主要實現位於檔案PitchShift.h。

整個演算法不到200行，邏輯非常清晰，

已經做了一定程度上的工程化優化。

當然還有很大的改進空間，

不過這份程式碼，更多的意義在於學習。

授人以魚不如授人以漁。

若有其他相關問題或者需求也可以郵件聯絡俺探討。

郵箱地址是: [email protected]

音訊演算法之小黃人變聲附完整C程式碼

都稍微講過變聲的原理和具體實現。大家都知道，演算法從實現到最後工程應用，中間的環節和問題特別多。尤其是編碼的架構設計，好的資料結構和程式碼邏輯封裝肯定是可複用，元件化的。我也提及到了。會做一些演算法編碼優化相關的分享。而有時候我總覺得文字表達很蒼白，所以我儘可能地把程式碼寫得簡潔易懂，一方面

基於RNN的音訊降噪演算法 (附完整C程式碼)

本文轉載自部落格：https://cloud.tencent.com/developer/article/1094567 ---------------------------------------------------------------------------------------

傳統高斯模糊與優化演算法(附完整C++程式碼)

高斯模糊（英語：Gaussian Blur），也叫高斯平滑，是在Adobe Photoshop、GIMP以及Paint.NET等影象處理軟體中廣泛使用的處理效果，通常用它來減少影象噪聲以及降低細節層次。這種模糊技術生成的影象，其視覺效果就像是經過一個半透明螢幕在觀

磨皮美顏演算法附完整C程式碼

前言 2017年底時候寫了這篇《集降噪美顏虛化增強為一體的極速影象潤色演算法附Demo程式》這也算是學習過程中比較有成就感的一個演算法。自2015年做演算法開始到今天，還有個把月，就滿五年了。歲月匆匆，人生能有多少個五年。這五年裡，從音訊影象到視訊，從傳統演算法到深度學習，從2D到3D各種

靜態分析第三發 so文件分析（小黃人快跑)

調試代碼 lin 很大的 inline fse ati line 運算本文作者：i春秋作家——HAI_ 0×00 工具 1.IDA pro 2.Android Killer 0×01 環境小黃人快跑下載地址http://download.csdn.net/dow

演算法之LOWB三人組之選擇排序

選擇排序思想是在一個列表中每次迴圈一遍，拿到最小值，接著再從剩下的無序區中繼續拿最小值，如此迴圈，直到結束。 # 最簡單的一個選擇排序，迴圈一個列表，拿到最小值，新增到一個新列表，之後在列表中刪除這個最小值，繼續再剩下的值中找最小值，往復迴圈。 def select_sort_simple(li):

前端學習筆記day09 小黃人制作

<!DOCTYPE html> <html lang="zh-CN"> <head> <meta charset="UTF-8"> <title>Document</title> <style>

繪製可愛的小黃人插圖

（本教程由尋圖示icon.52112.com提供）設定專案檔案屬性啟動並執行Illustrator，建立一個新文件（File> New或Control-N）：畫板數量：1 寬度： 320畫素高度：&

小黃人詳細教程

（此教程來自尋圖）設定專案檔案屬性啟動並執行Illustrator，建立一個新文件（File> New或Control-N）：畫板數量：1 寬度： 320畫素高度： 600畫素單位：畫素進入“高階”選項卡：色彩模式：RGB 柵格效果：螢

Leetcode中級演算法之最長迴文子串(5)C++

給定一個字串 s，找到 s 中最長的迴文子串。你可以假設 s 的最大長度為 1000。示例 1：輸入: “babad” 輸出: “bab” 注意: “aba” 也是一個有效答案。示例 2：輸入: “cbbd” 輸出: “bb” 這道題在網上看到了許多解法，如動態規劃，

微信小程式上傳圖片(附後端程式碼)

幾乎每個程式都需要用到圖片。在小程式中我們可以通過image元件顯示圖片。當然小程式也是可以上傳圖片的，微信小程式文件也寫的很清楚。上傳圖片首先選擇圖片通過wx.chooseImage(OBJECT)實現官方示例程式碼

Dijkstra演算法求最短路徑問題完整C程式碼

<pre name="code" class="cpp">/* Dijkstra演算法求圖的最短路徑問題C程式碼 */ #include <stdio.h> #include <string.h> #include <stdlib.h> #define Ma

SM2橢圓曲線公鑰密碼演算法，完整c程式碼，前人栽樹，後人乘涼

某電信安資訊保安數學基礎實驗要求實現SM2橢圓曲線公鑰密碼演算法這是基於mircal庫實現的，沒有mircal庫的下載我以前的部落格發的檔案，根據教程在vs上搭建。一共四個檔案 SM2.c SM2.h SM3.c SM3.h SM2.c #include <st

unity3D學習之音訊播放、實時變聲簡化版-audio菜鳥筆記5

using SoundTouch; using System.Collections; using System.Collections.Generic; using UnityEngine; using UnityEngine.UI; using System.IO; #if SOUNDTOUCH_INT

【數學】kd 樹演算法之思路篇（憂傷的小兔子）

導語：kd 樹是一種二叉樹資料結構，可以用來進行高效的 kNN 計算。kd 樹演算法偏於複雜，本篇將先介紹以二叉樹的形式來記錄和索引空間的思路，以便讀者更輕鬆地理解 kd 樹。圖較多，小心流量作者：肖睿編輯：巨集觀經濟算命師本文由JoinQuant量化課堂推出，本文的難度屬於

HTML5呼叫攝像頭+視訊特效+錄製視訊+錄音+截圖+變聲+濾波+音訊視覺化

1.寫在前面根據最近的學習，寫了一個demo, 可以通過navigator.mediaDevices.getUserMedia()方法呼叫電腦攝像頭，並實現了錄製音訊，錄製視訊，對攝像頭的內容進行截圖下載；通過AudioContext使用web audio

noip資料結構與演算法之基礎小演算法 4 二維差值維護

noip資料結構與演算法之基礎小演算法 4 二維差值維護二維差值維護問題實際上是對一維差值維護問題的擴充套件，相信來看二維差值維護的各位都已經對一維差值維護問題有足夠的認識了。下面先看一下二維差值維護的問題。問題描述：已知一個n*n的矩陣a，有m次操作，每次

微信小程式展示列表之表頭固定不變

微信小程式表頭固定螢幕頂部下面的例子適合於表頭直接在頂部的需求沒有查詢條件之類的元件在上面 wxml中的程式碼的關鍵程式碼是 style="position:fixed; top:0;" 和 style='margin-top:{{marginTop}

演算法學習——貪心演算法之刪數字（求最小值）

演算法描述在給定的n位數字，刪除其中的k位數字（ k < n），使得最後的n-k為數字為最小值（原次序不變）演算法思路考慮到是要移出數字，我們使用連結串列設計此演算法較為方便，連結串列可以直接移出某個位置的元素使用貪心演算法，每一步都要達到最優從最高位開始，若下一位比上一位要小，則將上一

資料結構之小演算法（快慢指標原理）

如何找到未知長度單鏈表的中間節點? 思路1: 遍歷單鏈表獲取長度n，n/2再遍歷得到中間節點，時間複雜度為O(n+n/2)=O(3/2n) 思路2：利用快慢指標原理，設定兩個指標*search，*mid，都指向單鏈表第一個元素,假設單鏈表有頭結點，則為 search

音訊演算法之小黃人變聲 附完整C程式碼

相關推薦

音訊演算法之小黃人變聲附完整C程式碼