1. 程式人生 > >【深度學習】【物聯網】深度解讀:深度學習在IoT大資料和流分析中的應用

【深度學習】【物聯網】深度解讀:深度學習在IoT大資料和流分析中的應用

作者|Natalie
編輯|Emily
AI 前線導讀:在物聯網時代,大量的感知器每天都在收集併產生著涉及各個領域的資料。由於商業和生活質量提升方面的訴求,應用物聯網(IoT)技術對大資料流進行分析是十分有價值的研究方向。這篇論文對於使用深度學習來改進 IoT 領域的資料分析和學習方法進行了詳細的綜述。從機器學習視角,作者將處理 IoT 資料的方法分為 IoT 大資料分析和 IoT 流資料分析。論文對目前不同的深度學習方法進行了總結,並詳細討論了使用深度學習方法對 IoT 資料進行分析的優勢,以及未來面臨的挑戰。

更多幹貨內容請關注微信公眾號“AI 前線”,(ID:ai-front)

論文貢獻
  • 為了更好的在 IoT 領域內應用深度學習方法,作者分析了 IoT 資料的關鍵特徵和主要問題。

  • 作者對於目前最先進的深度學習方法及其在物聯網領域對於大資料和流資料的應用進行了詳細的總結。

  • 作者對於目前應用了深度學習方法的大量 IoT 應用進行了介紹,並且對不同型別的深度神經網路在各種 IoT 領域的應用進行了概括和對比。

  • 強調了深度學習與物聯網應用成功結合所面臨的挑戰和未來的研究方向。

論文結構

物聯網資料特徵及分析要求
IoT 快速流資料

目前流資料分析都是基於資料平行計算或增量處理的框架,儘管這些技術減少了從流資料分析框架返回響應的時間延遲,對於 IoT 應用的嚴格時間要求,它們並不是最佳方案。IoT 需要在資料來源附近的平臺(甚至是 IoT 裝置自身)上進行快速流資料分析,以達到實時或近實時性的要求,傳統的流資料分析方法則面臨著計算、儲存以及資料來源能量方面的侷限和挑戰。

IoT 大資料
 IoT 大資料具有“6V”特點:

容量(Volume): 資料量是將資料集視為大資料、或傳統的大規模 / 超大資料的一個決定性因素,使用物聯網裝置產生的資料量比以前要多得多,明顯符合這一特點。

速度(Velocity): 物聯網大資料產生和處理速率要足夠高,以支援實時大資料的可用性。鑑於這種高資料率,也證明了需要先進的工具和技術分析才能有效地運作。

多樣性(Variety): 一般來說,大資料有不同的形式和型別。這可能包括結構化的、半結構化的和非結構化的資料。各種各樣的資料型別可以通過物聯網產生,如文字、音訊、視訊、感測器資料等等。

真實性(Veracity): 真實性是指質量,一致性,和資料的可信性,有真實性的資料才能進行準確的分析。這一點對於物聯網來說尤其重要,特別是那些群體感知資料。

易變性(Variability): 這個屬性是指資料流的速率不同。由於物聯網應用的性質,不同的資料生成元件可能會有不一致的資料流。此外,在特定時間,一個數據源的資料載入速率可能不同。例如,利用物聯網感測器的停車服務應用在高峰期的資料載入會達到峰值。

價值(Value): 價值是指大資料轉化成為有用的資訊和內容,為組織帶來競爭優勢。資料的價值的高度不僅僅取決於對資料的處理過程或服務,還取決於對待資料的方式。

資料流處理的主要障礙是缺少能部署在系統邊緣,甚至是 IoT 裝置上的框架或演算法。當採用深度學習方法時,也要折衷考慮執行在系統邊緣的網路的深度和效能。

深度學習

與其他傳統機器學習方法相比,深度學習結構在近幾年受到越來越廣泛的關注。

Google Trend 顯示近幾年對深度學習的關注呈上升趨勢。

深度學習整體訓練機制

 結構

深度學習模型總結。

1)卷積神經網路(Convolutional Neural Networks,CNN)

CNN 的核心結構是卷積層,有一系列可學習的引數,稱作濾波器。訓練過程中,濾波器在全圖按照卷積順序進行移動,計算輸入和濾波器的乘積,得到該濾波器的特徵圖。CNN 的另一個結構是池化層,將輸入劃分成不重疊的區域,然後用每個區域的最大值作為輸出。CNN 的最後一個結構是 ReLU 啟用函式層,既可以縮短訓練時間,也能避免影響網路的泛化能力。

CNN 和 DNN 的主要區別在於 CNN 具有區域性相連、權值共享的特性,因此在視覺任務中具有獨特的優越性,並且降低了網路的複雜性。

2)迴圈神經網路(Recurrent Neural Networks,RNN)

迴圈神經網路結構圖。

RNN 主要適用於輸入為序列(例如語音和文字)或時間序列的資料(感測器資料)。RNN 的輸入既包括當前樣例,也包括之前觀察的樣例。也就是說,時間為 t-1 時 RNN 的輸出會影響時間為 t 的輸出。RNN 的每個神經元都有一個反饋環,將當前的輸出作為下一步的輸入。該結構可以解釋為 RNN 的每個神經元都有一個內部儲存,保留了用之前輸入進行計算得到的資訊。

3)長短時記憶(Long Short Term Memory,LSTM)

LSTM 記憶單元結構。

LSTM 是 RNN 的一種擴充套件。LSTM 中,每個神經元除了有反饋環這一儲存資訊的機制,還有用於控制神經元資訊通過的“遺忘門”、“輸入層門”及“輸出層門”,防止不相關的資訊造成的擾動。

4)自動編碼器(Autoencoders,AE)

自編碼器網路結構。

AE 的輸入層和輸出層由一個或多個隱層相連線,其輸入和輸出神經元數量相同。該網路的目標是通過用最簡單的方式將輸入變換到輸出,以重建輸入資訊。

5)變分自動編碼器(Variational Autoencoders,VAE)

變分自動編碼器結構。

VAE 對資料結構的假設並不強,是較為流行的生成模型框架。它很適用於 IoT 解決方案,因為 IoT 資料呈現的多樣性,以及標記資料的缺失。模型由兩個子網路組成:一個生成樣例,一個進行假設推理。

6)生成對抗網路(Generative Adversarial Networks,GAN)

生成對抗網路概念圖。

GAN 由兩個神經網路組成,一個生成網路,一個判別網路,共同工作來產生合成的、高質量資料。生成器根據資料在訓練資料集中的分佈生成新資料,判別器學習判別真實資料和生成器生成的假資料。GAN 的目標函式是基於極大極小博弈的,一個網路要最大化目標函式,而另一個要最小化目標函式。

7)受限玻爾茲曼機(Restricted Boltzmann Machine,RBM)

受限玻爾茲曼機結構。

RBM 是一種隨機神經網路,由兩層組成,一層是包含輸入的可見層,一層是含有隱變數的隱藏層。RBM 中的限制是指同一層的任意兩個神經元互不相連。除此之外,偏置單元與所有的可見層和隱藏層單元都相連。

8)深度信念網路(Deep Belief Network,DBN)

深度信念網路結構圖。虛線表示特徵提取通道,實現表示生成通道。DBN 是一種生成神經網路,由一個可見層可幾個隱層組成。可以提取訓練資料的多層表示,並且對輸入資料進行重構。DBN 的訓練過程是逐層訓練,將每一層視作一個 RBM,在前一層的基礎上進行訓練。這樣的機制使 DBN 成為深度學習中有效且快速的網路之一。

9)階梯網路(Ladder Network)

兩層階梯網路。

階梯網路在無監督和半監督學習任務中達到了先進的水平。階梯網路由兩個編碼器和一個解碼器組成。編碼器作為網路的有監督部分,解碼器進行無監督學習。訓練目標是最小化有監督部分和無監督網路的損失和。

快速實時深度學習結構

使用深度學習模型對資料流進行快速實時的處理仍在起步階段。早期工作

【1】是對超限學習機(Extreme learning machine,ELM)的擴充套件——OS-ELM,將一個實時序列學習演算法應用到單隱層的前饋神經網路。Ren 等人

【2】提出的 Faster-RCNN 在圖片中的目標檢測中達到了接近實時的速度。他們的目標檢測框架的執行時間為 5-17fps。然而對於影象處理任務,真正的實時效果需要系統的處理和分析時間達到 30fps 或更高。Redmon 等人

【3】提出了 YOLO,將目標檢測的速度提高到 45fps,以及更小版本的 YOLO,速度更是達到了 155fps,已經適用於智慧相機。

 深度學習與其他方法結合

1)深度增強學習(Deep Reinforcement Learning)

深度增強學習是將增強學習和深度神經網路相結合的產物。其目標是建立能自主學習的個體(agent),通過建立成功的互動過程以獲得長期的最大正反饋(reward)。當環境(environment)可由大量狀態表示時,傳統的增強學習方法稍顯不足,而深度神經網路則彌補了這一點。在 IoT 領域,【4】使用深度增強學習實現了半監督條件下智慧校園環境中的定位。

2)遷移學習與深度模型(Transfer Learning with Deep Models)

遷移學習主要應用在域適應和多工學習的領域。遷移學習對於許多難以收集訓練資料的 IoT 應用來說都是一個可用的解決方案。例如訓練一個通過智慧手機的低功耗藍芽和 Wifi fingerpringting 的定位系統,同一時間,在同一地點的 RSSI 值(Received Signal Strength Indication 接收的訊號強度指示)對於不同的平臺來說可能不同。如果我們對一個平臺訓練了一個模型,該模型可以遷移到其他平臺,而不需要對新平臺再收集訓練資料。

3)深度學習與線上學習演算法

由於 IoT 的應用產生的資料流會上傳到雲平臺來分析,線上機器學習演算法的角色變得越來越重要,因為訓練模型需要隨資料的增加而更新。

框架

近幾年,隨著深度學習在各個領域的應用熱潮,各種深度學習框架也應運而生。

Tensorflow: Tensorflow 是機器學習系統的開源庫,可以使用多種深度神經網路。Tensorflow 使用圖表示來建立神經網路模型。開發人員也在使用 TensorBoard,能視覺化神經網路模型,並且觀測學習過程,包括引數更新。

Torch: Torch 是一個機器學習開源框架,包含大量深度學習演算法,可用於深度神經網路模型的簡單開發。它基於 Lua 語言開發,是訓練深度學習演算法的輕量級快速框架。支援在 CPU 和 GPU 上開發機器學習模型,並且提供了訓練深度神經網路的平行計算庫。

Caffe: Caffe 是一個深度學習演算法和參考模型集的開源框架。基於 C++,支援 CUDA 進行 GPU 運算,並且提供 Python 和 Matlab 介面。Caffe 通過配置檔案定義模型,而不需要在原始碼中定義引數,將模型表示和實現分開。

深度學習框架對比。

深度學習在 IoT 領域的應用

IoT 應用和基礎服務。

 基礎服務

1)影象識別:

IoT 的一大部分應用場景中,輸入深度學習的資料是圖片或視訊。每天,每個人都在用手機的高清攝像頭拍攝者圖片和視訊,除此之外,家居、校園或工廠也在使用智慧攝像頭。所以,影象識別、分類、目標檢測是這類裝置的基礎應用。

2)語音識別

隨著智慧手機和可穿戴裝置的普及,語音識別也成了人們和自己的裝置互動的一種自然而方便的方式。Price 等人【5】搭建了一個專用的低功耗深度學習晶片,用於自動語音識別。這種特製晶片的能量消耗要比目前手機上執行的語音識別工具的能量消耗低 100 倍。

相關推薦

深度學習聯網深度解讀深度學習IoT資料分析應用

作者|Natalie編輯|EmilyAI 前線導讀:在物聯網時代,大量的感知器每天都在收集併產生

傳統遇上現代科技,資料人工智慧的醫療應用楚才國科

近年來,人工智慧已經成為熱詞,從製造業、智慧家居、交通,教育到醫療,人工智慧的迅速發展已經不斷在提高人們的生活水平。在多檔科技節目的推動下,如《機智過人》、人工智慧交流群 862729908《我是未來》等等,包括青少年都在關注! 那麼將大資料和人工智慧與我們中醫相結合,這又會擦出怎樣的火花呢

聯網學習之路——聯網通信技術NBIoT

華為 IT 展示 mts 控制 獲得 信號 連接方式 圖1 NBIoT是什麽   NB-IoT,Narrow Band Internet of Things,窄帶物聯網,是一種專為萬物互聯打造的蜂窩網絡連接技術。顧名思義,NB-IoT所占用的帶寬很窄,只需約180KHz

聯網藍芽

藍芽 藍芽技術的特點 全球範圍通用:2.4GHz的ISM頻段。 同時傳輸語音和資料:採用電路交換和分組交換技術,支援非同步資料通道,三路語音通道或非同步和同步語音同時傳輸的通道。每個語音通道為64kbit/s。 語音訊號調製用脈衝編碼調製(PCM)或連續可變

AI+IOT人工智慧+聯網這7家公司如何讓機器更“聽話”

來源:李鑫  資本實驗室 當今世界,人工智慧快速爆發,物聯網技術穩步前進。我們可以看到,不論是人

聯網別讓阿里獨吞!一文讀懂聯網萬億蛋糕

3月28日,阿里雲總裁胡曉明在雲棲大會上宣佈:阿里巴巴將全面進軍物聯網領域,IoT是阿里巴巴集團

安卓與聯網Arduino開發板與Android之間通訊

關於Arduino開發板 Arduino是一款開源電子原型平臺,硬體部分是可以用來做電路連線的Arduino電路板。可以通過編寫程式,最後燒寫入開發板,配合上一些感測器,以及富有創造力的設計可以創造出很多神奇的東西。 在大三的時候,對物聯網的感興

區塊鏈IOT深度解讀物聯網區塊鏈“IOTA”不僅解決IoT痛點,還解決區塊鏈痛點

作者:物女王(彭昭) 物聯網智庫 原創 轉載請註明來源和出處 ------   【導讀】------ IOTA基金會與微軟、富士通、思科、三星以及另外20多家公司合作,為物聯網推出了首個可公開訪問的Marketplace資料市場,該市場完全由IOTA分散式賬本支援。IOTA同名加密貨幣,可用於在全球範圍內

聯網17位業內專家解析2018年聯網重要趨勢

此文由【i司馬渡(微訊號:smartdooo)】獨家原創,產業智慧官 已獲轉載授權。17位風頭正

工業聯網2018工業聯網產業發展及投資價值榜單

如何實施工業物聯網?控制工程網傳統的製造企業需要有效的途徑來啟動工業物聯網(IIoT)的應用。本

阿里雲IoT+YF33006.聯網裝置報警配置

       縱然5G時代已經在時代的浪潮中展現出了它的身影,但是就目前的物聯網環境中,網路問題仍舊是一個比較突出的硬傷。眾所周知,在當前的物聯網規劃中,與其說是實現萬物互聯,倒不如說是行業指標資料監控。對於一些特殊行業的指標資料,要求在較短時間內對其相應變化規則作出反

阿里雲IoT+YF33007.聯網裝置表示式運算

   很多時候從裝置採集的資料並不能直接使用,還需要進行處理一下。如果採用指令碼處理,有點太複雜了,而採用表示式運算,則很方便地解決了此類問題。 一.  裝置連線      執行環境搭建:Win7系統請下載相關的裝置驅動,下載地址為:請

阿里雲IoT+YF33008.聯網裝置使用者指令碼開發

    除了我們必須熟悉的網頁尾本,比如JavaScript。其實在工業自動化中,組態軟體是必備指令碼的,只是有的指令碼語言風格類似C或類似Basic而已。比如崑崙通泰的組態屏中的組態軟體。通過安裝組態軟體可以簡單實現一些裝置(目前支援串列埠裝置和網口裝置)的快速連線,還可以進行一些控制元

阿里雲IoT+YF330011.聯網多裝置快速通訊級聯

     我們見到的很多物聯網裝置,大都是“一跳”上網,所謂的“一跳”就是裝置直接上網,內嵌物聯網模組或者通過DTU直接上網。其實稍微複雜的物聯網現場,往往閘道器下面連線若干物聯網裝置(如下圖),並且這些物聯網裝置的距離有可能還有些

Python控制流程生成器 | 協程 | 期 | 任務對比與聯系

創建 都沒有 all 第一部分 需求 性能問題 大致 set 我們 Python 的 asyncio 類似於 C++ 的 Boost.Asio。 所謂「異步 IO」,就是你發起一個 IO 操作,卻不用等它結束,你可以繼續做其他事情,當它結束時,你會得到通知。 Asyncio

老紫竹的專欄享受Java的快樂每一天之我的資料生活

專欄達人 授予成功建立個人部落格專欄

有營養的廢話人工智慧、資料高效能運算融合成為趨勢丨AI推理伺服器,能讀懂福爾摩斯?軟體網每日新聞播報│第10-24期

每一個企業級的人 都置頂了 中國軟體網 中國軟體網 為你帶來最新鮮的行業乾貨   小編點評 這年頭 甭管什麼東西 都往人工智慧的坑上佔 明明就是個邏輯自動化 甚至複雜點的邏輯 稍微有那麼點意思 就打上人工智慧的標籤 爛大街了 趨勢洞察 工程院院士廖湘科:人工智慧、大資料和高

自然語言處理入門03利用線性迴歸對資料集進行分析預測(下)

上一篇中我們簡單的介紹了利用線性迴歸分析並預測波士頓房價資料集,那麼在這一篇中,將使用相同的模型來對紅酒資料集進行分析。 1 基本要求 利用線性迴歸,對紅酒資料集進行分析。資料集下載地址。 2 完整程式碼 #-*- codin

自然語言處理入門03利用線性迴歸對資料集進行分析預測(上)

本篇筆記是《從自然語言處理到機器學習入門》課程第三次作業的上篇,主要是復現了老大課上講的利用線性迴歸對波士頓房價進行預測的實驗。在下篇中,將利用該模型對紅酒資料集進行線性迴歸分析。 1 基本要求 利用提供的波士頓房價資料,對其進行分析。資

終於有人把雲端計算、資料 AI 講明白了轉載

今天我們要講這三個話題,一個是雲端計算,一個大資料,一個人工智慧。 為什麼要講這三個東西呢?因為這三個東西現在非常非常的火,它們之間好像互相有關係,一般談雲端計算的時候也會提到大資料,談人工智慧的時候也會提大資料,談人工智慧的時候也會提雲端計算。所以說感覺他們又相輔相成不可