「達芬奇計劃」:華為雲端AI戰略揭祕,普惠AI讓技術走下神壇

ofollow,noindex" target="_blank">李澤南 原創
李澤南 原創
「達芬奇計劃」:華為雲端AI戰略揭祕,普惠AI讓技術走下神壇
今年 7 月,海外媒體 The Information 曝光了華為神祕的「達芬奇計劃」,其中包括人工智慧應用和 AI 雲端晶片。華為的 AI 戰略會是怎樣的?對於現在已經競爭激烈的 AI 市場又會產生怎樣的影響?這一訊息引起了人們的議論和猜測。
近日,我們從一名接近華為的訊息人士處獲知:華為的「達芬奇計劃」確實存在,並且很可能在 10 月的全聯接大會上釋出該計劃的詳情,包括 AI 雲晶片、跨平臺深度學習框架的例項都可能出現在下個月舉辦的大會上。看來,華為即將釋出的產品非常重磅。
在 2018 中國國際大資料產業博覽會上,華為雲 BU 總裁鄭葉來提出了華為「普惠」AI 概念,為 AI 技術的發展提出了更加實用的發展方向:讓 AI 高而不貴、讓所有企業使用者用得起、用得好、用得放心。這些新產品也將成為華為全新雲端戰略的重要組成部分。
「達芬奇計劃」的重要一步
在這一波 AI 浪潮中,BAT、京東、今日頭條等公司在人工智慧領域都發出了較大聲音:不論是人才投入、技術研究,還是產業應用,它們的行動都廣為所知。而華為的人工智慧研究一直以來都處於較為低調的狀態,以至於每次有關華為 AI 動態的訊息放出,都會引起業內極大的關注。
首先,是達芬奇計劃。
據瞭解,「達芬奇」是華為內部的 AI 專案代號,但並非是最終正式釋出的產品或方案名字。該專案是由華為輪值董事長徐直軍帶隊執行。作為華為目前規模最大的新專案,這家公司已在「達芬奇」計劃上投入了非常大的精力。
有跡象表明,華為即將推出的解決方案不僅是單純的晶片,而且還將包含面向開發者的開發板、基於公有云的 AI 加速器服務,以及私有云伺服器上搭載的硬體能力。所有這些產品都會配以相應的軟體開發工具並同時釋出。據稱,屆時釋出的產品將非常有「震撼力」。
面向開發者打造全平臺深度學習框架
在 AI 雲服務領域,華為並沒有先發優勢。而作為後來者,華為如何能夠在競爭激烈的 AI 領域站穩腳跟?據透露,華為很可能會面向開發者釋出全套的人工智慧軟體、硬體開發平臺,並在展會上向所有參會者開放。在 AI 晶片之外,深度學習框架將可能成為華為區別於其他 AI 廠商的殺手鐗。
在人工智慧應用的開發過程中,人們經常會遇到不同客戶端移植的問題。開發者需要使用神經網路框架(如TensorFlow、PyTorch)進行建模,在雲平臺中進行訓練。但在實際應用部署中,深度學習模型卻很難利用到谷歌 TPU 等深度學習晶片的加速。
另一方面,人工智慧演算法的訓練、部署和推理需要不同的硬體需求。對於開發者來說,將模型從雲端遷移到手機上,總會面臨大量繁雜的工作。統一的深度學習框架可以讓人們從這些工作中解放出來。基於此,華為的深度學習框架將為廣大 AI 開發者的工作帶來更多便利。
在今年六月的全球夥伴開發者大會上,餘承東提出了全面開放華為「芯-端-雲」能力的願景。華為的深度學習框架將佔據其中什麼樣的位置?
如同谷歌、百度等科技公司一樣,我們可以看到,華為正希望通過 AI 戰略聚集更多開發者,並逐漸形成活躍的社群,發力打造以晶片為載體的人工智慧解決方案完整開發者生態。
在未來,華為旗下全系列的產品將有可能具備統一的人工智慧能力,讓人們在做開發時能夠實現一次開發、一次調優、一次部署,大大提升開發效率。
不過,眾所周知,在深度學習的神經網路框架中,谷歌的TensorFlow 和 Facebook 的 PyTorch 已經成為主流。華為提出的框架要想在開發者社群中佔據一席之地,或許還需要很多努力。
普惠 AI 戰略
在 2018 中國數博會上,華為雲 BU 總裁鄭葉來首次提出了「普惠 AI」概念。華為認為,AI 將在未來成為一種基本生產力,AI 並不是一個簡單的獨立產品,更不是一個封閉系統。在華為看來,AI 技術適用於大部分的經濟活動。基於這種思考,華為提出了讓普通人「用得好、用得起、用得安心」的普惠 AI 概念。
AI 是基礎生產力,這個觀點是華為通過自身的實踐總結出的經驗。AI 技術已深刻地改變了華為的製造、物流和零售過程。
在鄭葉來的介紹中,我們可以得知:在製造方面,華為使用雲邊協調的影象處理技術和深度學習智慧判定,將裝置成品率提升到了 99.55%,與此對應的 AOI 檢測員工作量則下降了 48%;在物流方面,AI 使得例外費用下降 30%,裝箱率提升 15%,運作效率提升 10%;在零售方面,AI 使得線下實現智慧防衝量,線上實現智慧風控,助力 CBG(華為消費者業務)手機銷量幾何智慧變革,大大提升了零售安全。
可以看到,華為能夠在近兩年取得高速發展,裝置銷售價格越來越有競爭力,經營情況越來越好,除了注重科技研發外,在內部大力應用 AI 技術也是至關重要的因素。
現在,華為希望這些 AI 技術能夠幫助所有企業提高生產效率。
AI 雲晶片:眾星雲集的戰場
作為 AI 雲服務的重要部分,為深度神經網路任務專門加速的雲端晶片,一直被認為是未來晶片領域的重要發展方向。隨著人工智慧技術的發展,各家科技公司都在加緊研發自己的 AI 雲晶片。
谷歌是首個將專用雲晶片大規模應用的公司,其自行研發的張量處理器(TensorProcessing Unit,TPU)於 2016 年 5 月首次面世,今天已發展至第三代,據稱已在服務全球超過 10 億使用者。谷歌稱,TPU 使深度神經網路(DNN)的計算速度提高了 15-30 倍,而其能耗效率比現有類似技術的 CPU 和 GPU 提高了 30-80 倍。
谷歌 TPU
雖然 TPU 是一種專用積體電路,但它適用於神經網路框架TensorFlow 下的大量程式,驅動了谷歌資料中心的許多重要應用,其中包括影象識別、翻譯、搜尋和遊戲。
2018 年 2 月,谷歌雲 TPU 宣佈向外部使用者開放,其價格約為每雲 TPU 每小時 6.50 美元。此舉意味著這種曾支援圍棋程式AlphaGo的強大晶片將很快成為各家科技公司開展人工智慧業務的強大資源。
今年 7 月 4 日的百度 Create 開發者大會上,李彥巨集也釋出了屬於百度的雲端 AI 晶片「崑崙」系列。百度的雲晶片分為兩個型號:訓練晶片崑崙 818-300 和推理晶片 818-100。「崑崙」採用了三星 14nm 工藝,算力可達 260Tops、記憶體頻寬 512 GB/s;功耗則為 100 瓦特,由幾萬個小核心構成。百度稱,這是中國第一款雲端全功能 AI 晶片,也是目前為止業內設計算力最高的 AI 晶片。
除了常用深度學習演算法等雲端需求,百度的雲晶片還能適配諸如自然語言處理、大規模語音識別、自動駕駛、大規模推薦等具體終端場景的計算需求。
與其他科技巨頭相比,著力發展通訊產品的華為在 AI 硬體上首先推出的是移動端晶片。2017 年 9 月,華為釋出了世界首款手機 AI 晶片麒麟 970,其中搭載了來自寒武紀的神經網路處理單元 NPU。華為稱,麒麟 970 在機器學習任務上與 CPU 相比,計算速度可提升 25 倍,能耗效率提高 50 倍。華為的多款手機,包括 Mate 10/Pro、榮耀 V10 都搭載了麒麟 970 晶片。
今年 8 月 31 日,華為釋出了麒麟 980,成為了全球首款採用 7 奈米工藝的手機 AI 晶片,同時也引入了雙核 NPU 設計。新款新品讓手機的 AI 計算能力翻了一倍。
而據訊息人士稱,華為 10 月份即將釋出的雲端 AI 晶片,效能絕對不會比目前業界已有的其他晶片遜色。
華為在晶片和人工智慧領域有著深厚的積累,目前已經發展了自己的公有云、產品平臺,更有著大量搭載了 AI 晶片的終端裝置。未來的雲服務競爭可能會成為人工智慧實力的比拼,華為希望通過 AI 建立自身雲服務的核心優勢。
目前看來,有關「達芬奇計劃」的更多細節會在 10 月的全聯接大會上公佈,讓我們拭目以待。
產業 華為 AI晶片 人工智慧應用
相關資料
Artificial Intelligence
在學術研究領域,人工智慧通常指能夠感知周圍環境並採取行動以實現最優的可能結果的智慧體(intelligent agent)
來源: Russell, S., & Norvig, P. (2003). Artificial Intelligence: A Modern Approach.
Neural Network
(人工)神經網路是一種起源於 20 世紀 50 年代的監督式機器學習模型,那時候研究者構想了「感知器(perceptron)」的想法。這一領域的研究者通常被稱為「聯結主義者(Connectionist)」,因為這種模型模擬了人腦的功能。神經網路模型通常是通過反向傳播演算法應用梯度下降訓練的。目前神經網路有兩大主要型別,它們都是前饋神經網路:卷積神經網路(CNN)和迴圈神經網路(RNN),其中 RNN 又包含長短期記憶(LSTM)、門控迴圈單元(GRU)等等。深度學習是一種主要應用於神經網路幫助其取得更好結果的技術。儘管神經網路主要用於監督學習,但也有一些為無監督學習設計的變體,比如自動編碼器和生成對抗網路(GAN)。
來源:機器之心
AlphaGo
阿爾法圍棋是於2014年開始由英國倫敦Google DeepMind公司開發的人工智慧圍棋程式。AlphaGo是第一個打敗人類職業棋手的計算機程式,也是第一個打敗圍棋世界冠軍的計算機程式,可以說是歷史上最強的棋手。 技術上來說,AlphaGo的演算法結合了機器學習(machine learning)和樹搜尋(tree search)技術,並使用了大量的人類、電腦的對弈來進行訓練。AlphaGo使用蒙特卡洛樹搜尋(MCTS:Monte-Carlo Tree Search),以價值網路(value network)和策略網路(policy network)為指導,其中價值網路用於預測遊戲的勝利者,策略網路用於選擇下一步行動。價值網路和策略網路都是使用深度神經網路技術實現的,神經網路的輸入是經過預處理的圍棋面板的描述(description of Go board)。
來源: Deepmind
Deep neural network
深度神經網路(DNN)是深度學習的一種框架,它是一種具備至少一個隱層的神經網路。與淺層神經網路類似,深度神經網路也能夠為複雜非線性系統提供建模,但多出的層次為模型提供了更高的抽象層次,因而提高了模型的能力。
來源:機器之心 Techopedia
Image processing
影象處理是指對影象進行分析、加工、和處理,使其滿足視覺、心理或其他要求的技術。 影象處理是訊號處理在影象領域上的一個應用。 目前大多數的影象均是以數字形式儲存,因而影象處理很多情況下指數字影象處理。
來源: 維基百科
Machine Learning
機器學習是人工智慧的一個分支,是一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、計算複雜性理論等多門學科。機器學習理論主要是設計和分析一些讓計算機可以自動“學習”的演算法。因為學習演算法中涉及了大量的統計學理論,機器學習與推斷統計學聯絡尤為密切,也被稱為統計學習理論。演算法設計方面,機器學習理論關注可以實現的,行之有效的學習演算法。
來源:Mitchell, T. (1997). Machine Learning. McGraw Hill.
Natural language processing
自然語言處理(英語:natural language processing,縮寫作 NLP)是人工智慧和語言學領域的分支學科。此領域探討如何處理及運用自然語言;自然語言認知則是指讓電腦“懂”人類的語言。自然語言生成系統把計算機資料轉化為自然語言。自然語言理解系統把自然語言轉化為計算機程式更易於處理的形式。
來源: 維基百科
self-driving
從 20 世紀 80 年代首次成功演示以來(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)),自動駕駛汽車領域已經取得了巨大進展。儘管有了這些進展,但在任意複雜環境中實現完全自動駕駛導航仍被認為還需要數十年的發展。原因有兩個:首先,在複雜的動態環境中執行的自動駕駛系統需要人工智慧歸納不可預測的情境,從而進行實時推論。第二,資訊性決策需要準確的感知,目前大部分已有的計算機視覺系統有一定的錯誤率,這是自動駕駛導航所無法接受的。
來源: 機器之心
Speech Recognition
自動語音識別是一種將口頭語音轉換為實時可讀文字的技術。自動語音識別也稱為語音識別(Speech Recognition)或計算機語音識別(Computer Speech Recognition)。自動語音識別是一個多學科交叉的領域,它與聲學、語音學、語言學、數字訊號處理理論、資訊理論、電腦科學等眾多學科緊密相連。由於語音訊號的多樣性和複雜性,目前的語音識別系統只能在一定的限制條件下獲得滿意的效能,或者說只能應用於某些特定的場合。自動語音識別在人工智慧領域佔據著極其重要的位置。
Deep learning
深度學習(deep learning)是機器學習的分支,是一種試圖使用包含複雜結構或由多重非線性變換構成的多個處理層對資料進行高層抽象的演算法。 深度學習是機器學習中一種基於對資料進行表徵學習的演算法,至今已有數種深度學習框架,如卷積神經網路和深度置信網路和遞迴神經網路等已被應用在計算機視覺、語音識別、自然語言處理、音訊識別與生物資訊學等領域並獲取了極好的效果。
來源: LeCun, Y., Bengio, Y., & Hinton, G. (2015). Deep learning. nature, 521(7553), 436.
Cambricon
寒武紀科技成立於2016年3月,是全球智慧晶片領域的先行者,宗旨是打造各類智慧雲伺服器、智慧終端以及智慧機器人的核心處理器晶片。公司創始人、執行長陳天石教授,在處理器架構和人工智慧領域深耕十餘年,是國內外學術界享有盛譽的傑出青年科學家,曾獲國家自然科學基金委員會“優青”、CCF-Intel青年學者獎、中國計算機學會優秀博士論文獎等榮譽。團隊骨幹成員均畢業於國內頂尖高校,具有豐富的晶片設計開發經驗和人工智慧研究經驗,從事相關領域研發的平均時間達七年以上。寒武紀科技是全球第一個成功流片並擁有成熟產品的智慧晶片公司,擁有終端和伺服器兩條產品線。2016年推出的寒武紀1A處理器(Cambricon-1A)是世界首款商用深度學習專用處理器,面向智慧手機、安防監控、可穿戴裝置、無人機和智慧駕駛等各類終端裝置,在執行主流智慧演算法時效能功耗比全面超越CPU和GPU,與特斯拉增強型自動輔助駕駛、IBM Watson等國內外新興資訊科技的傑出代表同時入選第三屆世界網際網路大會評選的十五項“世界網際網路領先科技成果”。目前公司與智慧產業的各大上下游企業建立了良好的合作關係。在人工智慧大爆發的前夜,寒武紀科技的光榮使命是引領人類社會從資訊時代邁向智慧時代,做支撐智慧時代的偉大晶片公司。
Bytedance
“今日頭條”是一款基於資料探勘技術的個性化推薦引擎產品,它為使用者推薦有價值的、個性化的資訊,提供連線人與資訊的新型服務,是國內移動網際網路領域成長最快的產品之一。
Tensor
張量是一個可用來表示在一些向量、標量和其他張量之間的線性關係的多線性函式,這些線性關係的基本例子有內積、外積、線性對映以及笛卡兒積。其座標在 維空間內,有 個分量的一種量,其中每個分量都是座標的函式,而在座標變換時,這些分量也依照某些規則作線性變換。稱為該張量的秩或階(與矩陣的秩和階均無關係)。 在數學裡,張量是一種幾何實體,或者說廣義上的“數量”。張量概念包括標量、向量和線性運算元。張量可以用座標系統來表達,記作標量的陣列,但它是定義為“不依賴於參照系的選擇的”。張量在物理和工程學中很重要。例如在擴散張量成像中,表達器官對於水的在各個方向的微分透性的張量可以用來產生大腦的掃描圖。工程上最重要的例子可能就是應力張量和應變張量了,它們都是二階張量,對於一般線性材料他們之間的關係由一個四階彈性張量來決定。
來源: 維基百科

You will always be lucky if you know how to make friends with strange cats.