1. 程式人生 > >小程式音視訊功能的原理及應用

小程式音視訊功能的原理及應用

本文由雲+社群發表

作者:常青

騰訊視訊雲是做什麼的?騰訊視訊雲既不做資料庫,也不做儲存,也不做網路,我們只做音視訊服務,也就是直播、點播、視訊通話、這類面向B類客戶的音視訊PAAS業務。

今天主要是跟大家講的是騰訊視訊雲在過去一年時間裡跟小程式結合,看看怎麼去把這樣一個高技術含量的一個能力去跟小程式這樣一個非常輕量級的平臺發揮1+1>2的效應。

今天的話題分四部分,第一個是小程式音視訊能拿來做什麼,第二部分是將其內部是怎麼做到的?第三就是講騰訊視訊雲的音視訊技術的一些技術細節;第四個是介紹一下微信上做音視訊的應用的一些稽核問題以及應對方案。

我們現在開始第一部分。

img

我先開篇來個小故事,講講1944年,1944年其實是歐洲二戰戰場的最後的階段,當時盟軍有很多的戰艦逼近歐洲戰場,德國為了儘量減少這些戰艦的威脅,就開發了反艦導彈。這個導彈其實說白了就是給重磅航空炸彈裝了一個火箭發動機,點火之後就直接衝出去,威力是很大但準度很差,離遠了投放很容易就偏離目標了。所以如果不解決制導問題,這種武器其實沒什麼用處。

當時太平洋戰場的日本人為了解決這個問題,直接將人裝在導彈裡然後把門焊死,這種方法雖然簡單有效,但畢竟並不適合德國。

德國人技術還不錯,他們採用一個更加有技術含量的做法:在導彈前頭裝一個電視攝像頭,講攝像頭捕獲的影像通過導彈尾端的八木天先,直接傳送給投放導彈的轟炸機(躲得目標遠遠的),在轟炸機上面則安裝有一個電視接收器(請注意,這是在1944年,想想1944年我們在幹嘛),這樣以來,轟炸機上的投彈手就可以看到導彈前端的所有影像,再通過控制遙感直接操控導彈飛向目標戰艦,這其實就是實時音視訊技術在軍事上的一個典型應用。

img

我們接下來不講那麼遠的歷史,我們講講2018年。2018年小程式在今年熱度非常高,數量也特別多。但大家會看到很多小程式做的事情大多數對於H5公眾號的翻版,功能無外乎還是那些。但我要告訴你,如果小程式跟音視訊結合,有很多事情是H5做不了的事情,舉個例子我們現在看到這裡面視訊通話應用。

我們先以平安95511為例,比如說早晨您開車上班,我知道北京的早高峰還是比較堵的,可能一不小心就跟別的車擠到一起擦花了,這時候你的選擇就是打電話給保險公司報險,保險公司接下來會讓你在事發地點慢慢等著,等半小時?等一小時?這要看當時交通情況或者擁堵程度了。

那現在有小程式線上定損方案,您只需要開啟微信,搜尋平安95511,也不用安裝APP,1-2秒鐘就能報險,大概2-3分鐘就能把報險流程走完。

您可能會問,為什麼通過視訊的方案解決不通過電話呢?因為僅靠電話,保險公司並不能有效的區分電話的另一端是不是在騙保,而通過實時音視訊通話,造假就幾乎就不可能了。

接下來大家就問微信裡視訊通話為什麼不能用呢?如果大家跟女朋友做一些很私密的聊天你用微信通話是可以的,它跟文字訊息一樣,全程不留底,絕大多是1v1通話都是p2p直連,即使過伺服器的音視訊流也只是簡單的中轉。但在商用音視訊場景裡,比如遠端客服、遠端醫療、遠端定損等等,國家的相關法律法規就規定要全程錄製,不然無法維護普通使用者的合法利益。

除了平安這類比較偏保險行業的案例,新零售領域我們跟寶馬也有一些合作。比如說您考慮一下寶馬系的車,之前可能只能去4S店,雖然確實看真車比較直觀,但最多也就是進去看看內飾,而且有不少靦腆的年輕人礙於面子並不想進寶馬的店鋪。通過遠端視訊的方式跟銷售聊,您只需要在小程式裡面搜尋“寶馬實車互動平臺”,就有一個銷售1v1跟您溝通,他/她會拿手機直接給你看內飾怎麼樣,外觀怎麼樣,遠端看各種細節,而且我們專門校調了720p的高清解析度,絕對可以看清每一個細節。

當然還有遠端庭審,以及遠端醫療等專案,都有很多不錯的應用案例。

這裡我們就可以發現,小程式音視訊可以解決兩個現實的傳統應用解決不了的問題:

第一個是傳統電話只有聲音沒有畫面,很多不好用語言表述的事情用小程式音視訊就能很好的解決;第二,它可以很大程度上解決裝一個有視訊通話功能的APP非常費勁的事情。

接下來要從技術層面講講我們是怎麼做到的,怎麼實現這個能力,這個分成幾部分:

img

首先,我們講我們的音視訊SDK嵌入到微信APP裡面,然後外面包裝了兩個標籤,一個叫<live-pusher>,一個叫 <live-player>,然後用小程式的jsbridge做了內部的橋接。有了這樣一個能力之後,我們現在其實具備了兩個基礎功能,一個是<live-pusher>可以做到音視訊流的上行,再有一個<live-player>是做音視訊流的下行。

img

上行和下行什麼意思?上行是把本地的畫面往伺服器上傳,下行就是把伺服器的畫面往本地拉,這個最典型的應用就是直播。大家可以看到我們如果假設像看到鬥魚、虎牙的直播不錯,你回去可以用5分鐘或者10分鐘在小程式做一個,放一個<live-pusher>,它可以傳到騰訊雲的邊緣節點,通過轉碼叢集進入CDN,再用一個<live-player>進行播放,這可以組合出目前所有直播的應用能力。而直播質量的保證主要是在於CDN,CDN很大的一個作用不僅僅是下圖片,也不僅僅是下檔案,像視訊類的CDN我們可以做到近幾萬幾十萬併發的,我們大型的直播活動、賽事直播都可以來實現。

img

但是有了這套架構之後有一個問題,它的應用場景還是比較偏小眾的,所謂的娛樂直播、遊戲直播,光看直播其實我覺得還是沒有辦法體現小程式的價值,接下來我們要做一些嘗試,首先降低延時。就是主播這邊說一句話、體育賽事的球進了你這邊看大概需要5秒或者10秒。我們降低延時怎麼做?很簡單地思路就是把鏈路的傳出延時降低,像這樣一段鏈路它延時很高,我們採用加速節點,這些加速節點中間採用UDP直接傳輸,比如說我在北京,你在深圳,我們在北京找一個雲上的節點,深圳找一個雲上的節點,中間用專線打通,這樣整個鏈路的延時是非常低的,單項傳輸延時可以控制在500毫秒以內。有了它可以監控一些監控攝像頭這樣一些場景。

但這樣所用的場景還是有限,我們可以再拉一路低延時鏈路,這樣就變成了大家看到應用場景非常廣泛的雙向視訊通話。也就是,A有一個鏈路到B那邊,B也有一個鏈路到A這邊,延時都很低,A和B兩邊就可以溝通了(當然還要做好迴音消除的工作)。

img

大家會說有雙路是不是也可以做多路呢?當然可以,只要手機效能扛得住,並行多路也是沒有問題,目前我們可以同時開啟8路小畫面,再高就不行了,手機效能可能扛不住。

img

但是有這個的話,其實我們會發現還不夠優秀,我們其實還需要做一次延伸,將它跟Chrome瀏覽器打通。谷歌在收購了音視訊公司之後進行開源,這套技術在Chrome瀏覽器是有的,我們可以把這兩個鏈路通過遠端的協議模組進行互通,這樣就可以做到微信上用小程式,但是在PC上可以用瀏覽器。這對於什麼場景非常有用呢?對於企業的服務場景,尤其是視訊服務,對於客服人員是用PC但是對於有問題諮詢的使用者而言他們用微信就可以解決了。

img

大家可以看到,類似這樣的一些事情,如果真的要做成的話,除了像兩端的能力之外,我們還需要說在服務端做一些事情。比如說像大家打10086都需要排隊,很多時候告訴你坐席比較忙,主要是因為客服人員有限,客服人員有限我們就要有排隊系統。

img

再包括像醫院的場景,不僅僅是打通一個就可以,大家知道這醫生站在這裡它要接很多單的,不是一個視訊聊天做完就搞定了,他要看客戶的滿意度,看客戶的病歷,這裡面除了排隊系統還有病歷服務、建檔服務這樣一些事情,在稽核裡面周邊的工作還是要做的。我今天被拉過來,我們後面也會跟小程式的雲開發進行深度合作來減少雲開發的複雜度。

img

同時,過去一段時間,我們在音視訊質量上也做了不少優化,最新的微信版本中(目前尚未釋出),在卡頓率上我們做了很大的改進,如上圖。

最後一分鐘說一下關於微信稽核問題,我們和微信的團隊一起想了很多辦法來更好地解決國家的政策稽核問題。騰訊雲提供了1v1視訊通話外掛和1vn直播外掛,前者主要用於解決線上客服場景的需求,後者則主要用於電商直播。這兩款外掛均有後臺的AI和人工稽核團隊進行 7x24 小時的智慧安全稽核,所以政府部分同意授權使用這兩款外掛的小程式可以使用微信小程式的音視訊能力。

img

此文已由騰訊雲+社群在各渠道釋出

獲取更多新鮮技術乾貨,可以關注我們騰訊雲技術社群-雲加社群官方號及知乎