Intel CPU漏洞技術解讀：都是快取惹的禍！

阿新 • • 發佈：2018-12-27

背景

2017年6月1日，Google的安全團隊向Intel、AMD、ARM報了一個硬體級的漏洞，造成的危害是核心資料洩露，修復該漏洞的代價是至少30%的效能損失。2017年末Linux核心社群推出了KPTI「Kernel Page Table Isolation」補丁，Linus Torvalds在核心郵件列表上毫不留情地抨擊了Intel。2017年6月1日，Google的安全團隊向Intel、AMD、ARM報了一個硬體級的漏洞，造成的危害是核心資料洩露，修復該漏洞的代價是至少30%的效能損失。2017年末Linux核心社群推出了KPTI「Kernel Page Table Isolation」補丁，Linus Torvalds在核心郵件列表上毫不留情地抨擊了Intel。

安全人員將這兩個漏洞命名為Meltdown和Spectre；Meltdown目前只存在於Intel的處理器和部分ARM處理器，Spectre存在於一切有亂序執行的現代處理器架構裡面，包括AMD。從原理上來說漏洞無法徹底修復。

本次的漏洞會對所有雲廠商造成較大影響，已經有跡象表明有黑客在利用漏洞攻擊雲系統。Microsoft Azure中國區已釋出公告稱，將於北京時間2018 年 1 月 4 日上午 11:30 開始自動重啟受影響的虛擬機器，並全部關閉向部分客戶開放的自助維護視窗；AWS也傳送了通知郵件聲稱本週五將進行重大安全更新。

原因

一切還是要從CPU指令執行的框架——流水線說起。Intel當然不至於明知你要用一個使用者態的程序讀取Kernel記憶體還會給你許可。但現代CPU流水線的設計，尤其是和效能優化相關的流水線的特性，讓這一切充滿了變數。

給所有還沒有看過雲杉網路連載的系列文章《x86高效能程式設計箋註系列》的讀者一點背景知識的介紹：

x86 CPU為了優化效能，在處理器架構方面做了很多努力。諸如“多級快取”這一類的特性，是大家都比較熟悉的概念。還有一些特性，比如分支預測和亂序執行，也都是一些可以從並行性等方面有效提升程式效能的特性，並且它們也都是組成流水線的幾個關鍵環節。即便你暫時還不能準確理解其含義，但望文生義，也能看出來這肯定是兩個熵增的過程。熵增帶來無序，無序就會帶來更多漏洞。

快取的困境

講快取，必然先掛一張memory hierarchy鎮樓：

不過我要說的和這個沒太大關係。現在需要考慮的是，如果能讀取到核心地址的內容，那這部分內容最終肯定是跑到快取中去了，因為真正直接和CPU核心互動的儲存器，就是快取。這對一級快取（L1 Cache，業內也常用縮寫L1$，取cash之音）提出的要求就是，必須要非常快，唯有如此才能跟上CPU處理核心的速度。

Side Notes: 為什麼在不考慮成本的情況下快取不是越大越好，也是因為當快取規模越大，查詢某一特定資料就會越慢。而快取首先要滿足的要求就是快，其他的都是次要的。

根據核心的基本知識我們知道，程序執行時都有一個虛擬地址「Virtual address」和其所對應的實體地址「physical address」。

從虛擬地址到實體地址的翻譯轉換也由CPU通過page table完成。Page table並不儲存在CPU裡，但近期查詢到的Page table entry「PTE」都像資料一樣，快取在了CPU中的translation lookaside buffer「TLB」裡。為了不再過多堆砌術語和名詞，畫張圖說明一下：

CPU

當CPU根據程式要求需要讀取某個地址上的資料時，首先會在L1 Cache中查詢。為了適應CPU的速度，L1快取實現為Virtually indexed physically tagged「VIPT」的形式，即用虛擬地址即可直接讀取該虛擬地址對應的實體地址的內容，而不再需要多加一道轉換的工序。

如果L1 Cache miss，則會在下級快取中查詢。但越過L1 Cache之後，對L2$和L3$的速度要求就不再這麼嚴苛。此時CPU core給出的虛擬地址請求會先通過TLB轉換為實體地址，再送入下級快取中查詢。而檢查程序有沒有許可權讀取某一地址這一過程，僅在地址轉換的時候發生，而這種轉換和檢查是需要時間的，所以有意地安排在了L1 Cache之後。

L1快取這種必須求“快”的特性，成了整個事件的楔子。

分支預測

分支預測是一種提高流水線執行效率的手段。在遇到if..else..這種程式執行的分支時，可以通過以往的歷史記錄判斷哪一分支是最可能被執行的分支，並在分支判斷條件真正返回判斷結果之前提前執行分支的程式碼。詳情可以在上面提到的連載文章中閱讀。

需要強調的是，提前執行的分支程式碼，即便事後證明不是正確的分支，其執行過程中所讀取的資料也可以進入L1快取。在Intel的官網文件《Intel® 64 and IA-32 Architectures Optimization Reference Manual》第2.3.5.2節中指：

L1 DCache Loads:

– Be carried out speculatively, before preceding branches are resolved.

– Take cache misses out of order and in an overlapped manner.

Show you the [偽] code:

if (likely(A < B)) { value = *(kernel_address_pointer);}

當分支判斷條件A < B被預測為真時，CPU會去提前執行對核心地址的讀取。當實際條件為A > B時，雖然核心的值不會真正寫入暫存器（沒有retire），但會存入L1 Cache，再加之上一節介紹的，獲取L1 Cache的值毋須地址轉換，毋須許可權檢查，這就為核心資訊的洩漏創造了可能。

從理論上來講，如果可以控制程式的分支判斷，並且可以獲取L1快取中的資料（這個沒有直接方法，但可以通過其他間接手法）的話，就完全可以獲取核心資訊。而分支預測這種特性是不能隨隨便便就關閉的，這也就是這次問題會如此棘手的原因。

亂序執行

還有一個原因是亂序執行，但原理大致類似。亂序執行是Intel在1995年首次引入Pentium Pro處理器的機制。其過程首先是將我們在彙編程式碼中看到的指令“打散”，成為更細粒度的微指令「micro-operations」，更小的指令粒度將會帶來更多的亂序排列的組合，CPU真正執行的是這些微指令。

沒有資料依賴的微指令在有相應執行資源的情況下亂序並行執行，進而提升程式的並行程度，提高程式效能。但引入的問題是，讀取核心資料的微指令可能會在流水線發出exception之前將核心資料寫入L1 Cache。與分支選擇一樣，為通過使用者態程序獲取核心程式碼提供了可能。

限於篇幅，更詳細的內容讀者可以在國外安全團隊釋出的訊息中獲取。

後續

剛剛查閱之前連載中的一些細節的時候，看到在“流水線”那一章裡寫過這樣一段話：

在面對問題的時候，人總是會傾向於引入一個更復雜的機制來解決問題，多級流水線就是一個例子。複雜可以反映出技術的改良，但“複雜”本身就是一個新的問題。這也許就是矛盾永遠不會消失，技術也不會停止進步的原因。但“為學日益，為道日損”，愈發複雜的機制總會在某個時機之下發生大破大立，但可能現在時機還沒有到來:D

很難講現在是不是就是所謂的那個“時機”。雖然對整個行業都產生了負面影響，但我對此仍保持樂觀。因為這就是事物自然發展的一個正常過程。效能損失並不是一件壞事，尤其是對牙膏廠的使用者來說。

作者:

一個不耽誤碼字的網工

張攀，雲杉網路工程師，專注於x86網路軟體的開發與效能優化，深度參與ONF/OPNFV/ONOS等組織及社群，曾任ONF測試工作組副主席。

原文來自微信公眾號：雲杉網路

Intel CPU漏洞技術解讀：都是快取惹的禍！

背景 2017年6月1日，Google的安全團隊向Intel、AMD、ARM報了一個硬體級的漏洞，造成的危害是核心資料洩露，修復該漏洞的代價是至少30%的效能損失。2017年末Linux核心社群推出了KPTI「Kernel Page Table Isolation」補丁，Linus Torvald

親歷Intel CPU漏洞的正面襲擊

全部就是數據合並更新疑惑無法查看而是 lin 了解作為已經3年多沒有寫過代碼的程序員來說，本篇不應該算是一篇技術型的文章，而是作為服務上千家客戶的ToB大數據創業公司的一次經歷，可能很多人對於我們的產品了解並不多，所以我先簡單介紹下我們的技術和業務應用場景，我

Intel CPU 漏洞分析

from logs ranch val 兩種方法 prevent 排列 .com org Intel CPU漏洞分析報告預備知識存儲分級由於計算機存儲分級的特性（第一級：寄存器，第二級：高速緩存，第三級：內存，第四級：磁盤），每一級之間的訪問速度差距高達數量級。所以處

深度技術解讀：Fomo3D 遊戲第一輪是如何結束的

以太坊網路上備受矚目的遊戲Fomo3D（Fomo3D:Long）第一輪在前天（北京時間 8 月 22 日下午 3 點左右）結束了。最終，地址為 0xa169... 的玩家獲得了 10469.66 Eth 的獎金，其取款交易被記錄在了 6191962 區塊中，該玩家在遊戲中的總投入不到 0.8 Eth

網易技術分享：Nginx快取引發的跨域慘案

1. 前言貴金屬wap版直播間上線後，偶爾有使用者反饋，在進入wap直播間的時候，出現空白頁面，但是重新重新整理又可以正常顯示了。我們曾一度認為是網路請求異常或相容問題，直到開發PC版直播間，在進行除錯中，同樣遇到了“白屏”問題，才引起了足夠重視，並進行了問題跟蹤與分析。現在跟大家分享一下，這種偶然現象出

Intel CPU 曝大 BUG：迫使重新設計 Linux 和 Windows

其他作業系統將需要更新，效能會因此受到影響。TPU稱，亞馬遜、微軟和谷歌是三個受影響最深的雲端計算廠商，如果漏洞被利用，那麼在同一物理空間的虛擬使用者A可以任意訪問到另一個虛擬使用者B的資料，包括受保護的密碼、應用程式密匙等。英特爾處理器晶片爆出了一個根本性的設計缺陷，已迫使業界大刀闊斧地重新設

分散式快取技術redis學習系列（八）——JedisCluster原始碼解讀：叢集初始化、slot(槽)的分配、值的存取

redis叢集環境，客戶端使用JedisCluster獲取連線並操作redis服務，上一篇分散式快取技術redis學習系列（七）——spring整合jediscluster 簡單介紹了spring使用JedisCluster，這篇從JedisCluster原始

安全提示：勒索病毒漏洞與CPU漏洞務必小心

勒索漏洞 CPU幽靈漏洞近段時間來，國內一些信息安全團隊陸續發出安全警報，稱國內勒索病毒疫情非常嚴峻，政府、企業和個人用戶都在被攻擊之列，而系統漏洞是勒索軟件攻擊的主要入口。老友科技這裏提醒廣大計算機用戶，對於關鍵系統漏洞必須及時打上補丁，並做相關的檢查。本文說明2個高危系統漏洞的處理方法。 1.

Android內核漏洞利用技術實戰：環境搭建&棧溢出實戰

fin vmlinux ant eas turn git static gin qemu 前言 Android的內核采用的是 Linux 內核，所以在Android內核中進行漏洞利用其實和在一般的 x86平臺下的 linux 內核中進行利用差不多。主要區別在於 Andro

變啦健康減脂技術：都有什麼功能？

據中國疾病預防控制中心的資料顯示，目前中國肥胖症患者1.2億，超重人口3個億，我國已成為肥胖人數最多的國家之一。愛美之心人皆有之，在這個花花世界和刷臉的時代，誰不想擁有一個纖細的身材穿越在人海當中。變啦健康減脂技術就是來完成你的理想改變你的苦惱。“變啦健康減脂技術”努力讓減脂超越本身的意義，從單一的減脂服務，

迅雷鏈技術沙龍：什麼企業都適合用區塊鏈嗎？

很多面臨增長乏力的企業在區塊鏈浪潮興起時都會思考，是不是可以通過轉型區塊鏈調整自己的業務模式，實現新一輪的增長？區塊鏈的技術壁壘很高，什麼樣的業務都能使用區塊鏈技術嗎？如何讓自身的具體業務與區塊相結合？面對這些企業的轉型困惑，11月10日廣州迅雷鏈技術沙龍上，迅雷鏈開放平臺平臺運營負責人陳夢麟做了全

WeCode政策解讀：小學生都要學Python！程式設計被納入應試教育體系

程式設計是網際網路、人工智慧等高新技術的基礎和核心，而當下，正是計算機程式設計普及的風口浪尖，誰能搶先一步抓住這個風口，就會在未來的計算機時代佔有主動地位。現在程式設計教育正在逐漸普及，學習程式設計對孩子的成長有著重要意義。一、不會程式設計就是文盲 “程式設計促進你的思維

知乎技術分享：從單機到2000萬QPS併發的Redis高效能快取實踐之路

本文來自知乎官方技術團隊的“知乎技術專欄”，感謝原作者陳鵬的無私分享。 1、引言知乎儲存平臺團隊基於開源Redis 元件打造的知乎 Redis 平臺，經過不斷的研發迭代，目前已經形成了一整套完整自動化運維服務體系，提供很多強大的功能。本文作者陳鵬是該系統的負責人，本次文

深度解讀：區塊鏈技術+智慧醫療的核心優勢

2017年以來，數字貨幣熱潮席捲全球，走進了大眾的視野。作為比特幣底層技術的區塊鏈也展現出了其顛覆不同行業的潛力，醫療行業被認為是區塊鏈技術最有潛力的應用領域之一；隨著全球數字化程序的高速發展，如何保障包含大量患者隱私的醫療資料不被洩露變得越來越重要。區塊鏈技術

循序漸進：Oracle 12c新特性Sharding技術解讀

引言資料庫構架設計中主要有 Shared Everthting、Shared Nothing 和 Shared Disk： Shared Everthting：一般是針對單個主機，完全透明共享 CPU/MEMORY/IO，並行處理能力是最差的，例如 Oracle

【陌上軒客】技術領域：涉獵Java、Go、Python、Groovy 等語言，高效能、高併發、高可用、非同步與訊息中介軟體、快取與資料庫、分散式與微服務、容器和自動化等領域；興趣愛好：籃球，騎行，讀書，發呆；職業規劃：勵志成為一名出色的伺服器端系統架構師。

陌上軒客技術領域：涉獵Java、Go、Python、Groovy 等語言，高效能、高併發、高可用、非同步與訊息中介軟體、快取與資料庫、分散式與微服務、容器和自動化等領域；興趣愛好：籃球，騎行，讀書，發呆；職業...

Intel CPU漏洞技術解讀：都是快取惹的禍！

背景

原因

快取的困境

分支預測

亂序執行

後續

Intel CPU漏洞技術解讀：都是快取惹的禍！

親歷Intel CPU漏洞的正面襲擊

Intel CPU 漏洞分析

深度技術解讀：Fomo3D 遊戲第一輪是如何結束的

網易技術分享：Nginx快取引發的跨域慘案

Intel CPU 曝大 BUG：迫使重新設計 Linux 和 Windows

分散式快取技術redis學習系列（八）——JedisCluster原始碼解讀：叢集初始化、slot(槽)的分配、值的存取

安全提示：勒索病毒漏洞與CPU漏洞務必小心

Android內核漏洞利用技術實戰：環境搭建&棧溢出實戰

變啦健康減脂技術：都有什麼功能？

迅雷鏈技術沙龍：什麼企業都適合用區塊鏈嗎？

WeCode政策解讀：小學生都要學Python！程式設計被納入應試教育體系

知乎技術分享：從單機到2000萬QPS併發的Redis高效能快取實踐之路

深度解讀：區塊鏈技術+智慧醫療的核心優勢

循序漸進：Oracle 12c新特性Sharding技術解讀

美團上市的技術思考：一般企業都用的到這些技術！

探究隨機數漏洞背後的技術原理：EOS.WIN競猜遊戲是如何被攻破的？

最全阿里技術P系列解讀：P5-P8的技能要求和薪資結構

技術領導力：深度訪談《深入分散式快取》

Intel CPU漏洞技術解讀：都是快取惹的禍！

背景

原因

快取的困境

分支預測

亂序執行

後續

相關推薦