1. 程式人生 > >華為新一代企業數字化協作,有哪些黑科技?

華為新一代企業數字化協作,有哪些黑科技?

自動分析 聲源定位 bps 方案 必須 增強 ESS 基礎 幫助

技術分享圖片
華為在全球170多個國家和地區擁有1023個辦公室,這背後正是高效敏捷的數字化IT平臺,支撐了全球化高效運營。對於華為來說,高效的溝通與協作在企業的生產過程中發揮著舉足輕重的作用,支撐著華為分布在全球超過18萬名員工及合作夥伴協作,完成了華為在2017年超過6000億人民幣的銷售收入、2018年上半年同比增長達到15%的業績。

2018年9月,在華為企業通信CloudLink新品發布會上,發布了包括會議終端CloudLink Board、編碼器CloudLink Box、專業智能導播CloudLink Bar等在內的協作智真系列產品,全面引領企業通信與協作邁入智能時代。CloudLink系列新品凝聚了華為辦公IT數字化轉型的經驗,重新定義企業通信方式,將企業帶入全新的協作時代。那麽,CloudLink背後都有哪些黑科技?

人工智能掌控全場

技術分享圖片

(上圖:基於人臉識別的電子銘牌)

如何讓員工能夠提升會議體驗及效率,成為華為企業數字化轉型的關鍵任務之一。如今,華為在全球共計部署了7300套視頻會議系統,平均每天有7萬4千場視頻會議召開。2017年,華為專門成立了“數字化會議變革項目”,旨在用最新的數字技術來重新定義會議。

華為全新一代CloudLink系列產品,不僅僅體現了華為公司對未來數字化、智能化的探索創新,更是緊密結合了數字華為的優秀實踐,以及諸多人工智能等諸多黑科技。

黑科技一:智能語音會控。傳統視頻會議系統對於管理者來說是比較復雜的鍵控方式,而將人工智能技術集成進來,通過語音智能控制會議系統,完成會議發起及結束、會議成員添加、靜音、畫面切換、材料共享、音量調節等所有會控管理,可大幅簡化會議操作復雜度,提升用戶體驗。CloudLink協作智真系列產品內嵌智能助理“小微”,綜合運用語音助手、語音喚醒、遠場拾音、語音識別(ASR)、自然語言處理(NLP)、語音合成(TTS)等多項關鍵技術,實現高準確率語音會控。CloudLink通過對不同回聲和雙講等場景進行調優,提高會議室聲音信噪比,從而讓“小薇”聽得清語音;同時采用業界最高語言識別能力的神經網絡算法,對常用指令進行幾十萬種說法訓練,讓“小微”聽得懂語音指令。

黑科技二:基於人臉識別的電子銘牌。在傳統會議中經常會出現參會人員互相不清楚其它參會人員姓名、所在單位或部門以及其它必要信息,因此需要在會前做自我介紹,但往往又難以在短時間內記住所有的信息,這就給溝通交流帶來不便。如果會議系統能自動識別參會人,給出銘牌顯示,就可以避免參會人員互不認識的尷尬場面。CloudLink協作智真系列產品支持基於人臉識別的電子銘牌,運用動態場景分析算法和業界最高水準的人臉識別算法,基於內置AI處理器的強大處理能力,完成人臉檢測、人臉跟蹤及人臉識別,提供實時電子銘牌,最遠識別距離超過12米。

黑科技三:智能導播。在傳統會議中,對發言人跟蹤、場景切換等導播動作都是依靠專業人員手工操作完成的。而會議畫面呈現效果,也依賴於導播人員的反應速度和準確性。現在,將人工智能技術運用於會議導播,可實現發言人精準定位及自動跟蹤、個人特寫/雙人對話/全景總覽三種畫面自由選擇等智能導播功能。CloudLink協作智真系列產品支持基於聲音+圖像雙重定位的智能導播,首先采用聲源定位算法,準確判斷聲音方向;然後通過人臉檢測和三維定位算法,精準判斷發言人位置,可準確區分肩並肩的不同發言人;自動估算發言人距離,智能調整PTZ(pan/tilt/zoom)變焦倍數,輸出發言人最優畫面;智能區分單人/雙人交替/無人等不同發言場景,在個人特寫、雙人對話、全景畫面之間進行流暢切換,呈現最優的會議體驗;特別是提供了5倍光學變焦、8M的導播距離,可滿足專業級導播要求。

增強沈浸感的音視頻體驗

技術分享圖片

(上圖:核心ISP圖像處理算法效果對比)

CloudLink系列產品被稱為“協作智真”,其中“協作”指的是會議與協作融為一體,讓企業的交流更加高效、自由;而“智”代表的是人工智能,讓企業通信與人工智能充分融合到一起;“真”體現的則是從高清到極清,這種清晰度上的提升了用戶在遠程會議中的帶入感和沈浸感,也讓企業通信的應用場景更加廣泛。

黑科技四:H.265編解碼+活動圖像增強VME(Video Motion Enhance)“雙核”處理技術。在視頻會議中,視頻體驗與網絡帶寬往往是矛盾的兩面。然而,視頻的清晰度是視頻會議能否帶來更自然體驗的重要指標,企業一直在追求從標清到高清、再到4K極清,甚至4K30極清流暢視頻體驗。為了得到廣泛的應用,必須解決網絡帶寬限制的問題。如何實現低帶寬條件下4K30效果,是行業公認的難題。

CloudLink協作智真系列產品采用H.265編解碼+自研活動圖像增強VME(Video Motion Enhance) “雙核”處理技術,實現了2Mbps帶寬下4K30極清流暢視頻效果。其中,內置強大的硬編×××,支持64*64的宏塊結構編碼和RQT自適應塊結構技術,更多復雜預測算法及並行化方式計算,最高可實現雙路4K30極清視頻;同時運用基於運動檢測的智能時域、空域視頻濾波降噪算法,使圖像還原PSNR提升7.18%;運用ROI技術,智能區分人眼感興趣的人臉、皮膚等區域以及及背景、大幅紋理等人眼不感興趣區域,將有限帶寬應用到人眼感興趣部分;通過後圖像處理增強技術,可根據每幀圖像特征自動分析出每個像素的濾波強度,消除塊狀效應,保留更多的圖像細節。

黑科技五:核心ISP圖像處理算法。如今,視頻編解碼技術已經發展到H.265, 其編碼效率比上一代H.264HP又提升了近30%。但高度壓縮的圖像在還原後,難免存在失真,尤其在人眼感敏感的邊緣區域、色彩豐富性、光線陰暗區域等方面,很容易被人眼感知出來。後期圖像處理的結果,將直接影響被還原圖像的逼真度。CloudLink協作智真系列產品采用核心ISP圖像處理算法,可將圖像邊緣清晰度提升20%,顏色準確性提升100%;運用自適應清晰度增強技術ADE,準確還原真實世界每個點的灰度,提升圖像邊緣清晰度;精確色彩還原技術(ACR)可智能拓展顏色空間,讓畫面色彩更豐富;基於人眼圖像寬動態WDR技術,可支持感光器件像素級亮度控制,讓圖像亮度還原更真實。

黑科技六:超強糾錯技術SEC3.0。基於互聯網的視頻會議已成為主要的工作方式,隨時隨地開會是企業的基本需求,但由於互聯網帶寬不穩定性,視頻會議經常出現聲音斷續、畫面模糊,甚至中斷的情況。網絡的不穩定性、視頻會議解決方案的網絡傳輸糾錯能力,直接影響到系統網絡適應性,從而影響到視頻會議的溝通協作體驗。CloudLink協作智真系列產品支持音視頻超強糾錯技術,具備超強的網絡適應性:在視頻方面,綜合運用ARS網絡模型檢測、HARQ超強丟包重傳、SEC3.0前向冗余算法、AJB技術和適應秒級網絡延遲及抖動等技術,實現視頻抗丟包率達到30%;在音頻方面,采用可變碼率編碼、NetATE網絡適應性技術、前端FEC及RED抗丟包算法和後端PLC處理,可實現音頻抗丟包率達到70%。

極致體驗擴展協作空間

技術分享圖片

(上圖:前向智能波束拾音+後向“音幕”)

華為新一代CloudLink企業通信解決方案主要希望幫助企業達成數字化辦公空間、智能化工作方式、行業化生產使能三個核心目標。在行業化生產使能方面,根據IDC報告,華為視訊系統和終端已經連續五年在中國市場排名第一,在政府、公安、教育、醫療、金融、軌道、交通、電力等大行業,以及教育、互聯網金融等行業,已經具有較高占有率。

在已經有的市場份額基礎上,如何進一步拓展新的行業協作空間?這就必須要創造更極致的體驗,才能打開新的空間,這其中就包括更遠的拾音距離、更精準的音源定位、更高清和更細膩的圖像與視頻捕捉。

黑科技七:前向智能波束拾音+後向“音幕”。CloudLink協作智真系列產品采用智能波束拾音技術+後向專用MIC濾噪技術,正面利用12個全向MIC,使用Beamforming技術,形成多個拾音波束;通過多個拾音波束,可提高信噪比,提升遠距離拾音效果,同時通過增強去混響能力讓聲音更清晰,還能根據智能切換算法來選擇最優聲音效果的音頻數據對會議音頻進行增強處理。什麽叫0.5度音源精準定位?也就是運用高性能定位算法,可對在6米距離、水平相差5cm的兩位發言人,進行精準的音源定位。而除了正向MIC外,還在背部部署後向降噪MIC,形成可屏蔽後向幹擾聲音的“音幕”。

黑科技八:5K極清攝像。高清視頻作為一種主要的溝通方式,已經在各行各業得以普遍應用。而在醫療、精密設計等高端設計行業,需要更高分辨率攝像設備、更好感光元器件,才能確保圖像采集足夠清晰、細節足夠豐富,環境適應性足夠強,從而為行業應用提供更清晰地圖像呈現。CloudLink Board產品采用集成了5K分辨率攝像頭,1英寸光照面、2.4um感光單元CMOS等核心元件的極清攝像方案,可讓單位像素進光更充分、畫面噪點更少、基礎圖像更清晰更細膩,結合華為針對自研ISP算法及專有ISP處理硬件,達到震撼的畫面效果。同時,CloudLink Board產品還可支持7680X4320的8K分辨率,8K分辨率相當於4倍4K分辨率以及16倍全高清的分辨率,也是目前顯示領域應用到的最高分辨率,超過了大多數單反相機的像素值。

有了更遠的拾音距離、更精準的音源定位、更高清和更細膩的圖像與視頻捕捉,這實際上相當於大幅增加了企業對環境的認知能力,特別是對於人工智能應用來說,打開了全新的價值空間。目前的人工智能,已經在聲音識別、圖像識別和視頻識別方面達到了成熟商用的程度,結合CloudLink系列產品更高清的聲音、圖像和視頻輸入數據,就有機會把用於內部協作和運營的視頻會議工具轉型為企業創造價值的新平臺。

數字化轉型衍生出很多新的行業機會,企業通信正在從成本節約變成價值創造中心,比如遠程教育、遠程醫療、遠程庭審、遠程提訊等,這些都促成了一個新的生產方式,被稱之為遠程經濟。而高分辨率的聲音、圖像和視頻,也是Gartner所提出的數字化轉型的分辨率革命,即更豐富的捕捉物理世界的信息並數字化,可能帶來重塑行業的機會。

華為中國區企業雲通信解決方案銷售部總經理彭曉東表示:“隨著企業數字化轉型深入、雲和AI技術的成熟應用,我們正進入全新的協作時代。”而在全新的協作方式下,原先用於輔助內部協作和溝通的視頻通信系統也在轉型成為企業的生產力工具。CloudLink協作智真系列產品把所有聯接匯聚到雲,為企業員工和組織提供無處不在的聯接,其背後的八大黑科技讓員工和組織之間的協作更高效、更專註、更簡單、更安全、更極致,進而打開數字化創新的空間,接下來就有賴於生態夥伴一起,共同把數字化產業的蛋糕做得更大。(文/寧川)

華為新一代企業數字化協作,有哪些黑科技?