1. 程式人生 > >處理器之緩存(四)

處理器之緩存(四)

nag AD 51cto flag 就是 讀取 RoCE Oz TE

今天我們來看看緩存。在我們平時的生活中,知道處理器和內存是不同的。它們所使用的半導體器件工藝不同,工藝的差異導致了處理器與內存的速度差異。處理器的器件比內存是要好很多的,因此它的容量就勢必很小;而內存雖然速度慢,但是它很便宜,因此容量一般較大。在進行數據的處理時,處理器總是需要等待內存,處理器的速度是遠遠大於內存的。

在一般程序訪問的時候,它會出現局部性的概念。也就是說,在短時間內,處理器訪問的存儲空間是一個很小的範圍。局部性分為兩種:時間局部性和空間局部性。局部時間性是指某個存儲單元在短時間內很可能被再次訪問,而空間局部性是指某個存儲單元的鄰近單元在短時間內也被訪問。我們在處理器與內存之間就引進了一個中間介質,它叫高速緩沖存儲器,俗稱 cache。

下來介紹下它的特性:1、cache 是一種小容量的高速存儲器;2、cache 的存取速度與處理器的運算速度幾乎同量級;3、cache 在現代計算機系統中內置於處理器芯片中。在處理器與內存之間設置 cache 能大大地提高效率,將內存中被頻繁訪問的指令和數據復制到 cache 中。在大多數情況下,處理器能直接從 cache 中取得指令和數據。

下來我們來看看處理器的數據訪問 的具體流程,如下

技術分享圖片

那麽內存和 cache 之間是如何進行映射的呢?是利用直接映射法的。1、將 cache 和內存分成固定大小的塊(如 512 Byte/塊);2、內存中的每一塊在 cache 中有固定的映射位置;3、映射公式為:Pcache = 內存塊號 % cache總塊數。

下圖是一個直接映射的例子

技術分享圖片

它的特點是任意一個內存地址都能映射到 cache 中的一個固定位置。它的地址劃分如下

技術分享圖片

映射原理為根據訪問地址的中間 c 位找到 cache 中的對應塊,再來比較地址的高 t 位是否和 flag 相同,如果相同責直接讀取數據,不相同的話則從內存中復制塊內容。例如當前處理器需要訪問內存地址為 0x02140CH 處。

1、地址劃分:

0000 001
0010
0 0000 1100

2、根據 0010 直接訪問 cache 中的第 0010

3、匹配 0010 塊的 flag 是否等於 0000 001,如果相等則訪問 0010 塊中 1100 處的數據,不相等則從內存中讀取塊數據並更新 cache。

直接映射法的優點是映射過程簡單,所需耗時短;而缺點是當短時間內訪問的地址有同余沖突時會造成緩存失效。下面來看看基於 cache 原理的軟件應用。項目背景是開發一款日誌調試工具(Log Dog)。需要解決的問題是:1、日誌對系統效率影響巨大,且不容易分析查看;2、現有的日誌系統無法高效的打印二進制數據;3、自定義日誌內容的解析方式;4、對日誌進行分類,並控制日誌是否輸出。出現過的性能問題是當短時間內有大量日誌需要打印時,性能無法滿足調試需要。最終的解決方案是根據 cache 原理,設置二級緩存機制,盡量避開查找。

處理器之緩存(四)