人工智慧賦能網路空間安全報告:模式與實踐

ofollow,noindex" target="_blank">機器之心 原創
作者:騰訊安全管理部、賽博研究院
人工智慧賦能網路空間安全報告:模式與實踐
9 月 18 日,在「2018 世界人工智慧大會·人工智慧安全高階對話」分論壇中,騰訊安全管理部聯合賽博研究院釋出《人工智慧賦能網路空間安全:模式與實踐》報告。該報告聚焦網路安全,分析了網路空間安全的演進和風險趨勢,結合騰訊 AI 安全應用全佈局和國內外企業的 30 多個最佳實踐,詳細闡釋人工智慧賦能網路空間安全(AI+安全)的最新進展。本文對此報告的第三章「人工智慧在網路空間安全領域的應用模式」進行了介紹,完整報告請點選「閱讀原文」下載。
摘 要
人工智慧時代,網路空間安全威脅全面泛化,如何利用人工智慧思想和技術應對各類安全威脅,是國內外產業界共同努力的方向。本報告從風險演進和技術邏輯的角度,將網路空間安全分為網路系統安全、網路內容安全和物理網路系統安全三大領域;在此基礎上,本報告借鑑 Gartner 公司的 ASA 自適應安全架構模型,從預測、防禦、檢測、響應四個維度,提出人工智慧技術在網路空間安全領域的具體應用模式。與此同時,本報告結合國內外企業最佳實踐,詳細闡釋人工智慧賦能網路空間安全(AI+安全)的最新進展。最後,本報告提出,人工智慧安全將成為人工智慧產業發展最大藍海,人工智慧的本體安全決定安全應用的發展程序,「人工」+「智慧」將長期主導安全實踐,人工智慧技術路線豐富將改善安全困境,網路空間安全將驅動人工智慧國際合作。
目 錄
第一章人工智慧技術的發展沿革
(一)人工智慧技術的關鍵階段
(二)人工智慧技術的驅動因素
(三)人工智慧技術的典型代表
(四)人工智慧技術的廣泛應用
第二章 網路空間安全的內涵與態勢
(一) 網路空間安全的內涵
(二)人工智慧時代網路空間安全發展態勢
-
1、網路空間安全威脅趨向智慧
-
2、網路空間安全邊界開放擴張
-
3、網路空間安全人力面臨不足
-
4、網路空間安全防禦趨向主動
第三章人工智慧在網路空間安全領域的應用模式
(一) AI+安全的應用優勢
(二) AI+安全的產業格局
(三) AI+安全的實現模式
-
1、人工智慧應用於網路系統安全
-
2、人工智慧應用於網路內容安全
-
3、人工智慧應用於物理網路系統安全
第四章人工智慧在網路空間安全領域的應用案例
網路系統安全篇
(一)病毒及惡意程式碼檢測與防禦
(二)網路入侵檢測與防禦
第三章人工智慧在網路空間安全領域的應用模式
人工智慧技術日趨成熟,人工智慧在網路空間安全領域的應用(簡稱 AI+安全)不僅能夠全面提高網路空間各類威脅的響應和應對速度,而且能夠全面提高風險防範的預見性和準確性。因此,人工智慧技術已經被全面應用於網路空間安全領域,在應對智慧時代人類各類安全難題中發揮著巨大潛力。
(一)AI+安全的應用優勢
人們應對和解決安全威脅,從感知和意識到不安全的狀態開始,通過經驗知識加以分析,針對威脅形態做出決策,選擇最優的行動脫離不安全狀態。類人的人工智慧,正是令機器學會從認識物理世界到自主決策的過程,其內在邏輯是通過資料輸入理解世界,或通過感測器感知環境,然後運用模式識別實現資料的分類、聚類、迴歸等分析,並據此做出最優的決策推薦。
當人工智慧運用到安全領域,機器自動化和機器學習技術能有效且高效地幫助人類預測、感知和識別安全風險,快速檢測定位危險來源,分析安全問題產生的原因和危害方式,綜合智慧大腦的知識庫判斷並選擇最優策略,採取緩解措施或抵抗威脅,甚至提供進一步緩解和修復的建議。這個過程不僅將人們從繁重、耗時、複雜的任務中解放出來,且面對不斷變化的風險環境、異常的攻擊威脅形態比人更快、更準確,綜合分析的靈活性和效率也更高。
因此,人工智慧的「思考和行動」邏輯與安全防護的邏輯從本質上是自洽的,網路空間安全天然是人工智慧技術大顯身手的領域。
(1)基於大資料分析的高效威脅識別:大資料為機器學習和深度學習演算法提供源源動能,使人工智慧保持良好的自我學習能力,升級的安全分析引擎,具有動態適應各種不確定環境的能力,有助於更好地針對大量模糊、非線性、異構資料做出因地制宜的聚合、分類、序列化等分析處理,甚至實現了對行為及動因的分析,大幅提升檢測、識別已知和未知網路空間安全威脅的效率,升級精準度和自動化程度。
(2)基於深度學習的精準關聯分析:人工智慧的深度學習演算法在發掘海量資料中的複雜關聯方面表現突出,擅長綜合定量分析相關安全性,有助於全面感知內外部安全威脅。人工智慧技術對各種網路安全要素和百千級維度的安全風險資料進行歸併融合、關聯分析,再經過深度學習的綜合理解、評估後對安全威脅的發展趨勢做出預測,還能夠自主設立安全基線達到精細度量網路安全性的效果,從而構建立體、動態、精準和自適應的網路安全威脅態勢感知體系。
(3)基於自主優化的快速應急響應:人工智慧展現出強大的學習、思考和進化能力,能夠從容應對未知、變化、激增的攻擊行為,並結合當前威脅情報和現有安全策略形成適應性極高的安全智慧,主動快速選擇調整安全防護策略,並付諸實施,最終幫助構建全面感知、適應協同、智慧防護、優化演進的主動安全防禦體系。
(4)基於進化賦能的良善廣域治理:隨著網路空間內涵外延的不斷擴充套件,人類面臨的安全威脅無論從數量、來源、形態、程度和修復性上都在超出原本行之有效的分工和應對能力,有可能處於失控邊緣,人工智慧對人的最高智慧的極限探索,也將拓展網路治理的理念和方式,實現安全治理的突破性創新。人工智慧不僅能解決當下的安全難題,而通過在安全場景的深化應用和檢驗,發現人工智慧的缺陷和不足,為下一階段的人工智慧發展和應用奠定基礎,指明方向,推動人工智慧技術的持續變革及其更廣域的賦能。
(二)AI+安全的產業格局
人工智慧以其獨特的優勢正在各類安全場景中形成多種多樣的解決方案。從可觀察的市場指標來看,近幾年來人工智慧安全市場迅速成長,IDC 公司在 2017 年就估算,到 2020 年僅人工智慧及認知科學領域的市場規模將達到 470 億美元。而 MarketResearch 公司在 2018 年的研究表明,在網路安全中人工智慧應用場景增多,同時地域覆蓋範圍擴大,將進一步擴大技術在安全領域的應用,因此人工智慧技術在安全市場內將快速發展,預計到 2024 年,可用在安全中的人工智慧技術市場規模將超過 350 億美元,在 2017-2024 年之間年複合增長率(CAGR)可達 31%。
MarketsandMarkets 公司在 2018 年 1 月釋出的《安全市場中人工智慧》報告則認為,2016 年 AI 安全市場規模就已達 29.9 億美元、2017 年更是達到 39.2 億美元,預測在 2025 年將達到 348.1 億美元,年複合增長率為 31.38%。而愛爾蘭的 Research and Markets 公司在 2018 年 4 月份釋出了專門的市場研究報告,認為到 2023 年人工智慧在安全領域應用的市場規模將達 182 億美元,年複合增長率為 34.5%。由於機器學習對付網路犯罪較為有效,因此機器學習作為單一技術將佔領最大的一塊市場,到 2023 年其市場規模預計可達 60 億美元。
除了傳統安全公司致力於人工智慧安全,大型網際網路企業也在積極開展人工智慧安全實踐,如 Google、Facebook、Amazon、騰訊、阿里巴巴等均在圍繞自身業務積極佈局人工智慧安全應用。
(三)AI+安全的實現模式
人工智慧是以電腦科學為基礎的綜合交叉學科,涉及技術領域眾多、應用範疇廣泛,其知識、技術體系實際與整個科學體系的演化和發展密切相關。因此,如何根據各類場景安全需求的變化,進行 AI 技術的系統化配置尤為關鍵。
本報告採用 Gartner 公司 2014 年提出的自適應安全架構(ASA,Adaptive SecurityArchitecture)來分析安全場景中人工智慧技術的應用需求,此架構重在持續監控和行為分析,統合安全中預測、防禦、檢測、響應四層面,直觀的採用四象限圖來進行安全建模。其中「預測」指檢測安全威脅行動的能力;「防禦」表示現有預防攻擊的產品和流程;「檢測」用以發現、監測、確認及遏制攻擊行為的手段;「響應」用來描述調查、修復問題的能力。
本報告將 AI+安全的實現模式按照階段進行分類和總結,識別各領域的外在和潛在的安全需求,採用 ASA 分析應用場景的安全需求及技術要求,結合演算法和模型的多維度分析, 尋找 AI+安全實現模式與適應條件,揭示技術如何響應和滿足安全需求,促進業務系統實現持續的自我進化、自我調整,最終動態適應網路空間不斷變化的各類安全威脅。
1、人工智慧應用於網路系統安全
人工智慧技術較早應用於網路系統安全領域,從機器學習、專家系統以及過程自動化等到如今的深度學習,越來越多的人工智慧技術被證實能有效增強網路系統安全防禦:
-
機器學習(ML,Machine Learning):在安全中使用機器學習技術可增強系統的預測能力,動態防禦攻擊,提升安全事件響應能力。
-
專家系統(ES, Expert System):可用於安全事件發生時為人提供決策輔助或部分自主決策。
-
過程自動化 (AT, Automation ):在安全領域中應用較為普遍,代替或協助人類進行檢測或修復,尤其是安全事件的審計、取證,有不可替代的作用。
-
深度學習(DL, Deep Learning):在安全領域中應用非常廣泛,如探測與防禦、威脅情報感知,結合其他技術的發展取得極高的成就。
如圖 3 所示,通過分析人工智慧技術應用於網路系統安全,在四個層面均可有效提升安全效能:
預測:基於無監督學習、可持續訓練的機器學習技術,可以提前研判網路威脅,用專家系統、機器學習和過程自動化技術來進行風險評估並建立安全基線,可以讓系統固若金湯。
防禦:發現系統潛在風險或漏洞後,可採用過程自動化技術進行加固。安全事件發生時,機器學習還能通過模擬來誘導攻擊者,保護更有價值的數字資產,避免系統遭受攻擊。
檢測:組合機器學習、專家系統等工具連續監控流量,可以識別攻擊模式,實現實時、無人蔘與的網路分析,洞察系統的安全態勢,動態靈活調整系統安全策略,讓系統適應不斷變化的安全環境。
響應:系統可及時將威脅分析和分類,實現自動或有人介入響應,為後續恢復正常並審計事件提供幫助和指引。
因此人工智慧技術應用於網路系統安全,正在改變當前安全態勢,可讓系統彈性應對日益細化的網路攻擊。在安全領域使用人工智慧技術也會帶來一些新問題,不僅有人工智慧技術用於網路攻擊等伴生問題,還有如隱私保護等道德倫理問題,因此還需要多種措施保證其合理應用。總而言之,利用機器的智慧和力量來支援和保障網路系統安全行之有效。
2、人工智慧應用於網路內容安全
人工智慧技術可被應用於網路內容安全領域,參與網路文字內容檢測與分類、視訊和圖片內容識別、語音內容檢測等事務,切實高效地協助人類進行內容分類和管理。面對包括視訊、圖片、文字等實時海量的資訊內容,人工方式開展網路內容治理已經捉襟見肘,人工智慧技術在網路內容治理層面已然不可替代。
在網路內容安全領域所應用的人工智慧技術如下:
-
自然語言處理(NLP, Natural Language Processing):可用於理解文字、語音等人類創造的內容,在內容安全領域不可或缺。
-
影象處理(IP, Image Processing):對影象進行分析,進行內容的識別和分類,在內容安全中常用於不良資訊處理。
-
視訊分析技術 (VA, Video Analysis):對目標行為的視訊進行分析,識別出視訊中活動的目標及相應的內涵,用於不良資訊識別。
如圖 4 所示,通過分析人工智慧技術應用於網路內容安全,在四個層面均可有效提升安全效能:
預防階段:內容安全最重要的是合規性,由於各領域的監管法律/政策的側重點不同而有所區別且動態變化。在預防階段,可使用深度學習和自然語言處理進行相關法律法規條文的理解和解讀,並設定內容安全基線,再由深度學習工具進行場景預測和風險評估,並及時將結果向網路內容管理人員報告。
防禦階段:應用深度學習等工具可完善系統,防範潛在安全事件的發生。
檢測階段:自然語言、影象、視訊分析等智慧工具能快速識別內容,動態比對安全基線,及時將分析結果交付給人類夥伴進行後續處置,除此之外,基於內容分析的情感人工智慧也已逐步應用於輿情預警,取得不俗成果。
響應階段:在後續調查或留存審計資料階段,過程自動化同樣不可或缺。
3、人工智慧應用於物理網路系統安全
隨著物聯網、工業網際網路、5G 等技術的成熟,網路空間發生深刻變化,人、物、物理空間通過各類系統實現無縫連線,由於涉及的領域眾多同時接入的裝置數量巨大,感測器網路所產生的資料可能是高頻低密度資料,人工已經難以應對,採用人工智慧勢在必行。但由於應用場景極為複雜多樣,可供應用的人工智慧技術將更加廣泛,並會驅動人工智慧技術自身新發展。
-
情緒識別(ER, Emotion Recognition):不僅可用影象處理或音訊資料獲得人類的情緒狀態,還可以通過文字分析、心率、腦電波等方式感知人類的情緒狀態,在物理網路中將應用較為普遍,通過識別人類的情緒狀態從而可與周邊環境的互動更為安全。
-
AI 建模(DT, Digital Twin/AI Modeling):通過軟體來溝通物理系統與數字世界。
-
生物特徵識別 (BO, Biometrics):可通過獲取和分析人體的生理和行為特徵來實現人類唯一身份的智慧和自動鑑別,包括人臉識別、虹膜識別、指紋識別、掌紋識別等技術。
-
虛擬代理 (VA, Virtual Agents):這類具有人類行為和思考特徵的智慧程式,協助人類識別安全風險因素,讓人類在物理網路世界中更安全。
物理網路安全由於應用領域廣、層次多,可應用的技術型別也極為複雜,因此需要以人為中心,通過全程監測人和系統、人與機器、人與環境之間的互動,確保人與物的不受威脅。以物聯網為例,在業務運營系統與網路系統進行融合後,通常可分為負責業務資訊的資訊科技(IT)網路與負責生產執行維護的運營技術(OT)網路這兩部分,IT 部分的 AI 應用與網路系統安全需求基本一致,而 OT 部分則涉及業務運營安全,與應用場景融合的安全需求變得複雜,安全不僅關乎這些 IT 資產擁有者的安全,而且其中部分屬於關鍵基礎設施,一旦出現風險則將可能給國計民生帶來惡劣影響。
但人工智慧應用得當,不僅可以更高效的抵禦 OT 風險,還可以提升 OT 運營效能,從而直接創造價值,因此 AI 應用於 OT 安全領域不僅在安全管理上成為必需,而且也能促進綜合效益提升。例如,AI 應用於智慧城市的智慧交通安全中的流量管控中,一般通過歷史資料與深度學習進行交通流量預測,可通過交通設施的優化佈局進行流量管控預防,而在當前道路體系中應用專家系統進行預防,同時通過計算機影象分析技術首先進行道口流量實時監控、車輛通過監測,提前疏解交通堵點,洞悉交通現場態勢,即便發生事故,也可迅速調集應急資源快速進行現場處置,在事件回溯期間,可將相關係統中已處理的資訊進行自動關聯,從而為後續調整道路通行方案提供依據。
產業 網路安全 行業報告 世界人工智慧大會
相關資料
Artificial Intelligence
在學術研究領域,人工智慧通常指能夠感知周圍環境並採取行動以實現最優的可能結果的智慧體(intelligent agent)
來源: Russell, S., & Norvig, P. (2003). Artificial Intelligence: A Modern Approach.
Facial recognition
廣義的人臉識別實際包括構建人臉識別系統的一系列相關技術,包括人臉影象採集、人臉定位、人臉識別預處理、身份確認以及身份查詢等;而狹義的人臉識別特指通過人臉進行身份確認或者身份查詢的技術或系統。 人臉識別是一項熱門的計算機技術研究領域,它屬於生物特徵識別技術,是對生物體(一般特指人)本身的生物特徵來區分生物體個體。
來源: 維基百科
Expert system
專家系統(ES)是人工智慧最活躍和最廣泛的領域之一。專家系統定義為:使用人類專家推理的計算機模型來處理現實世界中需要專家作出解釋的複雜問題,並得出與專家相同的結論。簡言之,如圖1所示,專家系統可視作“知識庫(knowledge base)”和“推理機(inference machine)” 的結合。
Knowledge base
知識庫是用於知識管理的一種特殊的資料庫,以便於有關領域知識的採集、整理以及提取。知識庫中的知識源於領域專家,它是求解問題所需領域知識的集合,包括基本事實、規則和其它有關資訊。
來源: 維基百科
Image processing
影象處理是指對影象進行分析、加工、和處理,使其滿足視覺、心理或其他要求的技術。 影象處理是訊號處理在影象領域上的一個應用。 目前大多數的影象均是以數字形式儲存,因而影象處理很多情況下指數字影象處理。
來源: 維基百科
Logic
人工智慧領域用邏輯來理解智慧推理問題;它可以提供用於分析程式語言的技術,也可用作分析、表徵知識或程式設計的工具。目前人們常用的邏輯分支有命題邏輯(Propositional Logic )以及一階邏輯(FOL)等謂詞邏輯。
來源:機器之心
Machine Learning
機器學習是人工智慧的一個分支,是一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、計算複雜性理論等多門學科。機器學習理論主要是設計和分析一些讓計算機可以自動“學習”的演算法。因為學習演算法中涉及了大量的統計學理論,機器學習與推斷統計學聯絡尤為密切,也被稱為統計學習理論。演算法設計方面,機器學習理論關注可以實現的,行之有效的學習演算法。
來源:Mitchell, T. (1997). Machine Learning. McGraw Hill.
Natural language processing
自然語言處理(英語:natural language processing,縮寫作 NLP)是人工智慧和語言學領域的分支學科。此領域探討如何處理及運用自然語言;自然語言認知則是指讓電腦“懂”人類的語言。自然語言生成系統把計算機資料轉化為自然語言。自然語言理解系統把自然語言轉化為計算機程式更易於處理的形式。
來源: 維基百科
perception
知覺或感知是外界刺激作用於感官時,腦對外界的整體的看法和理解,為我們對外界的感官資訊進行組織和解釋。在認知科學中,也可看作一組程式,包括獲取資訊、理解資訊、篩選資訊、組織資訊。與感覺不同,知覺反映的是由物件的各樣屬性及關係構成的整體。
來源: 維基百科
Deep learning
深度學習(deep learning)是機器學習的分支,是一種試圖使用包含複雜結構或由多重非線性變換構成的多個處理層對資料進行高層抽象的演算法。 深度學習是機器學習中一種基於對資料進行表徵學習的演算法,至今已有數種深度學習框架,如卷積神經網路和深度置信網路和遞迴神經網路等已被應用在計算機視覺、語音識別、自然語言處理、音訊識別與生物資訊學等領域並獲取了極好的效果。
來源: LeCun, Y., Bengio, Y., & Hinton, G. (2015). Deep learning. nature, 521(7553), 436.
Internet of Things
物聯網(英語:Internet of Things,縮寫IoT)是網際網路、傳統電信網等資訊承載體,讓所有能行使獨立功能的普通物體實現互聯互通的網路。物聯網一般為無線網,而由於每個人周圍的裝置可以達到一千至五千個,所以物聯網可能要包含500兆至一千兆個物體。在物聯網上,每個人都可以應用電子標籤將真實的物體上網聯結,在物聯網上都可以查出它們的具體位置。通過物聯網可以用中心計算機對機器、裝置、人員進行集中管理、控制,也可以對家庭裝置、汽車進行遙控,以及搜尋位置、防止物品被盜等,類似自動化操控系統,同時通過收集這些小事的資料,最後可以聚整合大資料,包含重新設計道路以減少車禍、都市更新、災害預測與犯罪防治、流行病控制等等社會的重大改變,實現物和物相聯。
來源: 維基百科
Pattern Recognition
模式識別(英語:Pattern recognition),就是通過計算機用數學技術方法來研究模式的自動處理和判讀。 我們把環境與客體統稱為“模式”。 隨著計算機技術的發展,人類有可能研究複雜的資訊處理過程。 資訊處理過程的一個重要形式是生命體對環境及客體的識別。其概念與資料探勘、機器學習類似。
來源: 維基百科

機器之心是國內領先的前沿科技媒體和產業服務平臺,關注人工智慧、機器人和神經認知科學,堅持為從業者提供高質量內容和多項產業服務。