物聯網增長太快了嗎?
很快,地球上生成資料的裝置將是人類的七倍,而且這個數字還在繼續增長。調查公司Juniper Research的最新統計資料顯示,到2022年,物聯網感測器和裝置的預計數量將從目前微不足道的210億臺增長到500多億臺,增幅為140%。
該研究的作者預測,邊緣計算服務將成為這一增長的主要原因。研究發現,由於頻寬需求的減少、應用程式響應速度加快以及資料安全性的提高,以及邊緣計算的興起對於擴大部署至關重要。Juniper Research預測,在2023年連線的460億臺工業和企業裝置中,很大一部分將依賴邊緣計算。
所有這些裝置和連線的挑戰是資料——並弄清楚如何將其整合到企業系統中,以及如何為企業帶來價值。許多企業已經從一開始就在與傳統基礎設施相關聯的關係資料庫管理系統上構建了他們的資訊科技,而這些基礎設施並沒有被設計或配備來吸收或管理物聯網正在提供的大量連續資料流。許多高管認為,他們可以很容易接入物聯網,並開始獲得回報。然而,要做到這一點,還需要做很多工作。
最近的一篇文章中,國際應用系統分析研究所(IIASA)首席分析官 Bill Franks證實了這一點。也就是說,物聯網資料看起來比實際情況更簡單。Bill Franks說 :“大多數感測器以簡單的格式輸出資料——有時間戳、測量識別符號(溫度、壓力等),然後是一個值。因此,你可以非常快速地從原始Feed轉到準備好進行探索的資料集或表格”。
但是,企業的重要價值在哪裡?它可能不在無休止的時間戳資料流中,而是在彈出的異常中。哪些異常是相關連的,哪些只是異常?正在傳輸的特定來源資料是否是機器使用和效能的精確指標?所有這些問題必須事先進行檢查。Bill Franks提醒道:“不要讓資料攝入的簡單性欺騙了你”。
將會發生的事情是,企業將被無用的資料淹沒和不堪重負——需要吞吐量、處理和某種儲存,以及處理這些流程的專業知識。對於物聯網資料,有必要確定實際對你的具體問題有意義的節奏,例如,溫度感測器可以每毫秒讀出一次讀數,然而,在大多數情況下,以這種節奏接收資料有點多餘了。由於儲存額外資料的成本以及分析大量無用資料的成本和複雜性,這種過度消耗是有代價的。
一些關鍵考慮
為了充分利用物聯網,Bill Franks建議考慮以下因素:
- 設定適當的節奏:確定什麼節奏對你正在解決的問題有價值。如果你正在監控汽車發動機,那麼每秒讀數可能就足夠了,或許可能每5、10或60秒讀取一次就足夠了。關鍵是你必須評估每一個指標,並通過一些實驗確定你需要什麼。然後,將資料過濾到適當的級別,否則,你將會被資料淹沒,而有意義的模式將難以識別。
- 隨著時間推移識別複雜的模式:在分析物聯網資料時,我們通常對偏離正常值感興趣,而不是預測預期值。在識別出什麼是正常的之後,我們必須努力尋找重要的異常模式,然而,異常模式可能有多種演變方式。氣溫突然升高自然會引起人們的興趣,但是,如果溫度上升很小,或者持續很長一段時間,或者隨著頻率的增加而上升,會產生什麼影響呢?識別這些基於時間的模式存在很多複雜性。
- 弄清楚如何處理互動:讓我們假設你已經為你關心的每個指標確定了適當的節奏,以及對於每一個指標來說哪些模式是重要的。那麼你又如何解釋任何互動?問題在於,影響可能會有滯後,例如,溫度可能會在壓力上升之前就開始上升。為了確定各種感測器讀數之間的相互作用,不僅需要進行復雜的分析,以確定哪些指標可能會相互作用,還要確定在什麼時間範圍內以及何時滯後。
- 解釋錯誤和遺漏的讀數:感測器並不總是可靠的,任何分析過程都必須建立制衡機制,以解決丟失的資料或出錯的資料。你的分析流程必須包含識別可疑錯誤或傳輸差距的邏輯,並處理這些情況。
最重要的是,隨著物聯網生成資料量的增加,決策者需要坐下來構建系統和流程,以獲得對其業務最重要的洞察力。這需要了解什麼對企業來說很重要,以及什麼是物聯網資料或沒有告訴我們。