1. 程式人生 > >[通俗易懂] ARM與X86不具備可比性 效能差距可大上千倍

[通俗易懂] ARM與X86不具備可比性 效能差距可大上千倍


這裡就不去管細節,簡單來談一下,ARM和X86之間為什麼不太具有可比性的問題。要搞清楚這個問題首先要明白什麼是架構,之前也有很多人提到了架構不同,但架構是什麼意思?它是一個比較抽象的概念,不太容易用幾句話就解釋清楚。 我們要明白CPU是一個執行部件,它之所以能執行,也是因為人們在裡面製作了執行各種功能的硬體電路,然後再用一定的邏輯讓它按照一定的順序工作,這樣就能完成人們給它的任務。也就是說,如果把CPU看作一個人,首先它要有正常的工作能力(既執行能力),然後又有足夠的邏輯能力(能明白做事的順序),最後還要聽的懂別人的話(既指令集),才能正常工作。而這些集中在一起就構成了所謂的“架構”,它可以理解為一套“工具”、“方法”和“規範”的集合。不同的架構之間,工具可能不同,方法可能不同,規範也可能不同,這也造成了它們之間的不相容——你給一個義大利泥瓦匠看一份中文寫成的烹飪指南,他當然不知道應該幹什麼了。

如果還看不懂,沒關係,我們繼續。從CPU發明到現在,有非常多種架構,從我們熟悉的X86,ARM,到不太熟悉的MIPS,IA64,它們之間的差距都非常大。但是如果從最基本的邏輯角度來分類的話,它們可以被分為兩大類,即所謂的“複雜指令集”與“精簡指令集”系統,也就是經常看到的“CISC”與“RISC”。屬於這兩種類中的各種架構之間最大的區別,在於它們的設計者考慮問題方式的不同。我們可以繼續舉個例子,比如說我們要命令一個人吃飯,那麼我們應該怎麼命令呢?我們可以直接對他下達“吃飯”的命令,也可以命令他“先拿勺子,然後舀起一勺飯,然後張嘴,然後送到嘴裡,最後嚥下去”。從這裡可以看到,對於命令別人做事這樣一件事情,不同的人有不同的理解,有人認為,如果我首先給接受命令的人以足夠的訓練,讓他掌握各種複雜技能(即在硬體中實現對應的複雜功能),那麼以後就可以用非常簡單的命令讓他去做很複雜的事情——比如只要說一句“吃飯”,他就會吃飯。但是也有人認為這樣會讓事情變的太複雜,畢竟接受命令的人要做的事情很複雜,如果你這時候想讓他吃菜怎麼辦?難道繼續訓練他吃菜的方法?我們為什麼不可以把事情分為許多非常基本的步驟,這樣只需要接受命令的人懂得很少的基本技能,就可以完成同樣的工作,無非是下達命令的人稍微累一點——比如現在我要他吃菜,只需要把剛剛吃飯命令裡的“舀起一勺飯”改成“舀起一勺菜”,問題就解決了,多麼簡單。

這就是“複雜指令集”和“精簡指令集”的邏輯區別。可能有人說,明顯是精簡指令集好啊,但是我們不好去判斷它們之間到底誰好誰壞,因為目前他們兩種指令集都在蓬勃發展,而且都很成功——X86是複雜指令集(CISC)的代表,而ARM則是精簡指令集(RISC)的代表,甚至ARM的名字就直接表明了它的技術:Advanced RISC Machine——高階RISC機。

到了這裡你就應該明白為什麼RISC和CISC之間不好直接比較效能了,因為它們之間的設計思路差異太大。這樣的思路導致了CISC和RISC分道揚鑣——前者更加專注於高效能但同時高功耗的實現,而後者則專注於小尺寸低功耗領域。實際上也有很多事情CISC更加合適,而另外一些事情則是RISC更加合適,比如在執行高密度的運算任務的時候CISC就更具備優勢,而在執行簡單重複勞動的時候RISC就能佔到上風,比如假設我們是在舉辦吃飯大賽,那麼CISC只需要不停的喊“吃飯吃飯吃飯”就行了,而RISC則要一遍一遍重複吃飯流程,負責喊話的人如果嘴巴不夠快(即記憶體頻寬不夠大),那麼RISC就很難吃的過CISC。但是如果我們只是要兩個人把飯舀出來,那麼CISC就麻煩得多,因為CISC裡沒有這麼簡單的舀飯動作,而RISC就只需要不停喊“舀飯舀飯舀飯”就OK。

這就是CISC和RISC之間的區別。但是在實際情況中問題要比這複雜許許多多,因為各個陣營的設計者都想要提升自家架構的效能。這裡面最普遍的就是所謂的“發射”概念。什麼叫發射?發射就是同時可以執行多少指令的意思,例如雙發射就意味著CPU可以同時拾取兩條指令,三發射則自然就是三條了。現代高階處理器已經很少有單發射的實現,例如Cortex A8和A9都是雙發射的RISC,而Cortex A15則是三發射。ATOM是雙發射CISC,Core系列甚至做到了四發射——這個方面大家倒是不相上下,但是不要忘了CISC的指令更加複雜,也就意味著指令更加強大,還是吃飯的例子,CISC只需要1個指令,而RISC需要5個,那麼在記憶體頻寬相同的情況下,CISC能達到的效能是要超過RISC的(就吃飯而言是5倍),而實際中CISC的Core i處理器記憶體頻寬已經超過了100GB/s,而ARM還在為10GB/s而苦苦奮鬥,一個更加吃頻寬的架構,頻寬卻只有別人的十分之一,效能自然會受到非常大的制約。為什麼說ARM和X86不好比,這也是很重要的一個原因,因為不同的應用對頻寬需求是不同的。一旦遇到頻寬瓶頸,哪怕ARM處理器已經達到了很高的運算效能,實際上根本發揮不出來,自然也就會落敗了。

說到這兒大家應該也已經明白CISC和RISC的區別和特色了。簡而言之,CISC實際上是以增加處理器本身複雜度作為代價,去換取更高的效能,而RISC則是將複雜度交給了編譯器,犧牲了程式大小和指令頻寬,換取了簡單和低功耗的硬體實現。但如果事情就這樣發展下去,為了提升效能,CISC的處理器將越來越大,而RISC需要的記憶體頻寬則會突破天際,這都是受到技術限制的。所以進十多年來,關於CISC和RISC的區分已經慢慢的在模糊,例如自P6體系(即Pentium Pro)以來,作為CISC代表的X86架構引入了微碼概念,與此對應的,處理器內部也增加了所謂的譯碼器,負責將傳統的CISC指令“拆包”為更加短小的微碼(uOPs)。一條CISC指令進來以後,會被譯碼器拆分為數量不等的微碼,然後送入處理器的執行管線——這實際上可以理解為RISC核心+CISC解碼器。而RISC也引入了指令集這個就邏輯角度而言非常不精簡的東西,來增加運算效能。正常而言,一條X86指令會被拆解為2~4個uOPs,平均來看就是3個,因此同樣的指令密度下,目前X86的實際指令執行能力應該大約是ARM的3倍左右。不過不要忘了這是基於“同樣指令密度”下的一個假設,實際上X86可以達到的指令密度是十倍甚至百倍於ARM的。

最後一個需要考慮的地方就是指令集。這個東西的引入,是為了加速處理器在某些特定應用上效能而設計的,已經有了幾十年的歷史了。而實際上在目前的應用環境內,起到決定作用的很多時候是指令集而不是CPU核心。X86架構的強大,很多時候也源於指令集的強大,比如我們知道的ATOM,雖然它的X86核心非常羸弱,但是由於它支援SSE3,在很多時候效能甚至可以超過核心效能遠遠強大於它的Pentium M,這就是指令集的威力。目前X86指令集已經從MMX,發展到了SSE,AVX,而ARM依然還只有簡單而基礎的NEON。它們之間不成比例的差距造成了實際應用中成百上千倍的效能落差,例如即便是現今最強大的ARM核心依然還在為軟解1080p H.264而奮鬥,但一顆普通的中端Core i處理器卻可以用接近十倍播放速度的速度去壓縮1080p H.264視訊。至少在這點上,說PC處理器的效能百倍於ARM是無可辯駁的,而實際中這樣的例子比比皆是。這也是為什麼我在之前說平均下來ARM只有X86幾十分之一的效能的原因。

打了這麼多字,其實就是為了說明一點,雖然現在ARM很強大,但它距離X86還是非常遙遠,並沒有因為這幾年的進步而縮短,實際上反而在被更快的拉大。畢竟它們設計的出發點不一樣,因此根本不具備多少可比性,X86無法做到ARM的功耗,而ARM也無法做到X86的效能。這也是為什麼ATOM一直以來都不成功的原因所在——Intel試圖用自己的短處去和別人的長處對抗,結果自然是不太好的,要不是Intel擁有這個星球上最先進的半導體工藝,ATOM根本都不可能出現。而ARM如果嘗試去和X86拼效能,那結果自然也好不到哪兒去,原因剛剛也解釋過了。不過這也不意味著ARM以後就只能佔據低端,畢竟任何架構都有其優點,一旦有應用針對其進行優化,那麼就可以揚長避短。X86的繁榮也正是因為整個世界的資源都針對它進行了優化所致。只要能為ARM找到合適的應用與適合的領域,未來ARM也未必不可以進入更高的層次。

相關推薦

[通俗易懂] ARMX86具備可比性 效能差距

這裡就不去管細節,簡單來談一下,ARM和X86之間為什麼不太具有可比性的問題。要搞清楚這個問題首先要明白什麼是架構,之前也有很多人提到了架構不同,但架構是什麼意思?它是一個比較抽象的概念,不太容易用幾句話就解釋清楚。 我們要明白CPU是一個執行部件,它之所以能執行,也是因

ARMX86 CPU架構區別

兼容性 即使 應該 能夠 調制 數據 bubuko linu 工作 CISC(復雜指令集計算機)和RISC(精簡指令集計算機)是當前CPU的兩種架構。它們的區別在於不同的CPU設計理念和方法。早期的CPU全部是CISC架構,它的設計目的是 CISC要用最少的機器語言指令來完

ARM X86 CPU架構對比

CISC(複雜指令集計算機)和RISC(精簡指令集計算機)是當前CPU的兩種架構。它們的區別在於不同的CPU設計理念和方法。早期的CPU全部是CISC架構,它的設計目的是  CISC要用最少的機器語言指令來完成所需的計算任務。RISC和CISC是設計製造微處理器的兩種

ARMX86架構對比區別

關鍵字:ARM架構 X86架構 工控主機板 開發設計 Android(安卓)系統 LINUX WINCEGOOGLE的Android系統和蘋果的IPAD、IPHONE推出後,ARM架構的電腦系統(特別是在終端方面應用)受到使用者的廣泛支援和追捧,ARM+Android成為IT

ARMx86--參考文獻

[1]    Intel [2007]. http://www.intel.com/technology/tick-tock/ [2]    Bajarin, Tim [2010-01-04]. "Can Wintel Survive? - Columns by PC Magazine". Pcmag

ARMx86優劣比較

[轉自:http://bbs.uc.cn/forum.php?mod=viewthread&tid=1531183] 一、背景知識       指令的強弱是CPU的重要指標,指令集是提高微處理器效率的最有效工具之一。從現階段的主流體系結構講,指令集可分為複雜指令集(

能更通俗易懂的機器學習名詞解釋

  train? valid? or test? 機器學習最明顯的一個特點是需要大量的資料。特別對監督學習來說,就是需要大量的帶標籤資料(labeled data)。 很多入門的朋友很快就會遇見模型訓練和測試這兩個階段,進而也就瞭解到帶標籤資料是要被劃分成兩個部分的:訓練集(t

通俗易懂的樂觀鎖悲觀鎖原理及實現

一、樂觀鎖   總是認為不會產生併發問題,每次去取資料的時候總認為不會有其他執行緒對資料進行修改,因此不會上鎖,但是在更新時會判斷其他執行緒在這之前有沒有對資料進行修改,一般會使用版本號機制或CAS操作實現。  version方式:一般是在資料表中加上一個資料版本號ver

ARM架構x86架構的區別

一、什麼是ARM架構   ARM架構過去稱作進階精簡指令集機器(AdvancedRISCMachine,更早稱作:AcornRISCMachine),是一個32位精簡指令集(RISC)處理器架構,其廣泛地使用在許多嵌入式系統設計。由於節能的特點,ARM處理器非常適用於移動通訊領域,符合其主要設計

[資料結構演算法]通俗易懂入門並查集

並查集,顧名思義,具有將兩個或以上的集合合併和查詢的作用。所以討論這個資料結構即討論兩個函式,一個是查詢函式find(),另一個是合併函式join()。 為了便於理解,我們從題目入手:  hdoj暢通工程 用leetcode的題目做例子,簡單的說就是,假設1和2是朋友,

通俗易懂:mmap硬體暫存器的關係

分析應用程式獲取按鍵操作的流程 分析應用程式控制LED燈的操作流程 按鍵:按鍵操作,觸發中斷,讀取硬體暫存器,獲取按鍵狀態,喚醒休眠的程序,read操作呼叫copy_to_user將核心的緩衝區資料拷貝到使用者緩衝區 總結:第一次拷貝:從硬體暫存器讀數讀到核心緩衝區

死神兔,面向物件思想,直觀通俗易懂

有一隻兔子,從出生後第3個月起每個月都生只兔子,小兔子長到第三個月後每個月又生一隻兔子,假如兔子都不死,問每個月的兔子總數為多少? public class CalculateRabbit{ public static void calculate(in

32位64位 CPU、編譯器、作業系統、應用程式、armX86關係

一:arm和X86的區別 arm:對應精簡指令集 X86:對應複雜指令集 arm上的和X86上編譯過的的東西是不能相互使用的,因為指令集不一樣嘛。指令集可以通俗的理解為,溝通語言。arm和X86之間東西不能直接用,類似於一個美國人和一箇中國人各自只說自己的語言,那麼這兩個人是沒法溝通的。

先驗概率、後驗概率似然估計--通俗易懂的解釋

本文假設大家都知道什麼叫條件概率了(P(A|B)表示在B事件發生的情況下,A事件發生的概率)。 先驗概率和後驗概率 教科書上的解釋總是太繞了。其實舉個例子大家就明白這兩個東西了。 假設我們出門堵車的可能因素有兩個(就是假設而已,別當真):車輛太多和交通事故。 堵車的概率

通俗易懂地理解執行緒池&&C++程式碼例項講解

本機環境:win10   64位   vs2017 C++新手,程式碼寫得比較一般,高手見諒(抱拳)。 歡迎留言交流! 簡介執行緒池: 在介紹執行緒池之前,我們要首先知道多執行緒是啥。 單執行緒:就是說你現在有四件毫不相干的事情要分

PythonC混合程式設計!是Python和C都具備的超能力!

    編寫 c => python 的介面檔案 // vectory_py.c extern "C" { vector<point_t>* new_vector(){ return new vector<point_t>

C++中類物件的講解(通俗易懂

#include<iostream>usingnamespace std;classBox{public:staticint objectCount;// 建構函式定義Box(double l=2.0,double b=2.0,double h=2.0){ cout <&l

通俗易懂客戶端伺服器端互動原理(HTTP資料請求HTTP響應,包括Servlet部分)

經常看到HTTP客戶端與伺服器端互動原理的各種版本的文章,但是專業術語太多,且流程過於複雜,不容易消化。於是就按照在 Servlet 裡面的內容大致做了一些穿插。本來 連 Tomcat 容器 和 Servlet 的生命週期也準備在這裡一起寫的,但怕過去龐大,於是就簡單的 引用

這是轉載的 java反射機制原理,原作者講解的相對很通俗易懂

轉自這裡 Java的反射機制是Java特性之一,反射機制是構建框架技術的基礎所在。靈活掌握Java反射機制,對大家以後學習框架技術有很大的幫助。 那麼什麼是Java的反射呢?        大

執行緒程序最通俗易懂的解釋(附面試題答案)

程序和執行緒都是一個時間段的描述,是CPU工作時間段的描述。一、CPU+RAM+各種資源(比如顯示卡,光碟機,鍵盤,GPS, 等等外設)構成我們的電腦,但是電腦的執行,實際就是CPU和相關暫存器以及RAM之間的事情。二、CPU太快,太快,太快了,暫存器僅僅能夠追的上他的腳步,RAM和別的掛在各總線上的裝置完全