ICC GCC傻傻分不清?聊一聊編譯器那些事兒
CPU這東西,大家除了關注工藝、主頻、核心數(shù)量等規(guī)格信息之外,更在意的應該就是性能表現(xiàn)了。反應CPU性能的測試可謂是相當多樣,但要說起最權威的,那就不得不提SPEC
CPU測試了。
SPEC的全稱是Standard Performance Evaluation Corporation,翻譯過來是標準性能評估組織,它是一個全球性的第三方非營利性組織,由計算機廠商、系統(tǒng)集成商、大學、研究機構、咨詢等多家公司組成,目標是建立、維護一套用于評估計算機系統(tǒng)的標準。
在CPU性能測試上,SPEC CPU 2006是SPEC組織推出的最新版的軟件(上一個版本SPEC CPU 2000已經基本沒有人用了),同時也是最受行業(yè)認可的測試軟件。SPEC CPU 2006包括了CINT2006和CFP2006兩個子項目,前者用于測量和對比整數(shù)性能,而后者則用于測量和對比浮點性能。在各種處理器的SPEC CPU 2006測試結果上,我們往往會看到ICC或是GCC的字樣,那么ICC和GCC又分別代表什么呢?
ICC:全稱Intel C++ Compiler,是Intel開發(fā)的C/C++/Fortran編譯器套裝,適用于Linux、Microsoft和Mac OS X操作系統(tǒng),沒有非IA指令集版本(就是說僅供x86架構CPU使用)。ICC廣泛應用于高性能計算、分布式計算等商業(yè)計算領域,其向量化和并行化性能是業(yè)界的標桿,能夠充分發(fā)揮現(xiàn)代處理器的特性。
ICC編譯器套裝提供兩個版本,針對高性能計算機測試采用前者,而后者面向嵌入式及移動設備
GCC:全稱GNU Compiler Collection,GNU編譯器套裝,是廣泛應用的Linux系統(tǒng)的默認編譯器(特別是用于編譯Linux內核)。GCC能夠支持多種架構的處理器,跨平臺特性相對出色。不過,GNU組織要求全部的代碼由自己完成(防止版權問題),所以GCC雖然有廣泛的硬件支持,但是在各硬件平臺上卻并不是性能最優(yōu)的編譯器。
GCC官方LOGO
到底啥是編譯器?
所謂編譯器,就是將“一種語言(通常為高級語言)”翻譯為“另一種語言(通常為低級語言→匯編語言)”的程序。它的主要工作流程:
高級語言源代碼→預處理器→編譯器→匯編語言,匯編語言再經過匯編器→目標文件→鏈接器生成可執(zhí)行程序。
在這個流程中,高級語言指的就是源代碼,如Pascal、C、C++、fortran、Java等,而目標文件指的是包含CPU可以執(zhí)行的二進制指令的集合。也就是說,編譯器起到的作用就是將程序源代碼“翻譯”成匯編語言,既然是“翻譯”工作,往往就有Good和Better的區(qū)別,而從上面的介紹我們能夠看出,不同的操作系統(tǒng),能夠使用的編譯器是不同的,那這個編譯效率自然也就存在差異。
同時,CPU也是區(qū)分不同架構的,比如x86、MIPS、ARM、Power等等,不同架構的CPU往往運行不同的操作系統(tǒng),如x86架構CPU可以運行Windows、Linux(Android)和Mac OS X,而MIPS等其他架構CPU往往只能運行基于Linux開發(fā)的操作系統(tǒng)。
所以,不同架構的CPU,根據適合的操作系統(tǒng),在SPEC CPU測試過程中編譯器的選擇上是不一定是唯一的,而選擇哪一種編譯器,站在CPU研發(fā)者的角度上,無疑會選擇能讓CPU性能發(fā)揮到最大的編譯器。
ICC | GCC | |
x86+Windows | √ | √ |
x86+Linux | √ | √ |
PPC/MIPS+Windows | 不存在 | 不存在 |
PPC/MIPS+Linux | × | √ |
通過前面對ICC和GCC的解讀,不難看出兩者的區(qū)別。ICC和GCC都可以運行在Windows和Linux下,Intel是x86架構CPU的老大,配合x86架構CPU開發(fā)了ICC,能夠最大程度的發(fā)揮出x86架構CPU的真實性能。GCC能夠配合更多種類架構的CPU加以使用,適用平臺更廣,但從CPU性能發(fā)揮的角度上看,大而廣很難和專而精比拼。
但是,綜合x86 CPU和Windows系統(tǒng)的市場占有率這兩個因素來看,在CPU測試過程中,ICC和GCC的采用率又是怎樣呢?
第三方商業(yè)機構更多采用ICC,GCC寥寥無幾
SPEC官網上公布著大量的專業(yè)機構測試結果供大家研究分析,筆者選定了全部的整數(shù)單任務測試結果進行分析,通過爬蟲抓取了約8600個測試結果,并對測試中使用的編譯器進行了數(shù)據統(tǒng)計:
結果是使用ICC編譯器的測試結果高達95%,而GCC不足0.1%。這些測試結果基本都是獨立的第三方商業(yè)機構的測試結果,具有很高的參考價值。數(shù)據顯示,ICC編譯器的使用在SPEC CPU 2006測試中具有壓倒性的優(yōu)勢,而GCC則幾乎沒有商業(yè)機構使用。
上述統(tǒng)計還反映了一個事實,就是Intel和AMD的x86架構處理器在桌面及服務器領域的壟斷性優(yōu)勢。而從其中非x86架構CPU的測試結果來看,僅剩的數(shù)個測試成績,Power、Sparc全部使用的是針對自家指令集優(yōu)化過的編譯器,而非GCC,這也側面反映了GCC“大而廣”的一些問題。
產生這個現(xiàn)象的原因要從SPEC CPU測試成績產生方法來說起:SPEC組織使用一臺1997年的Ultra Enterprise 2主機(處理器為296MHz UltraSPARC II Processor)作為參考對象,在其上運行了全部的SPEC CPU 2006子測試,并把每一項的測試結果的用時(中間數(shù))定位系數(shù)1。
實際測試中,假定被測試的CPU運行某項子測試的用時為A,而Ultra Enterprise 2主機同一項子測試用時為B,則用B/A,即可得到被測試CPU該項子測試的成績,而各子測試成績的幾何平均值記為總成績。
即SPEC各子項成績是相對于Ultra Enterprise 2計算出來的(Ultra Enterprise 2各項成績計為1,總分也是1)。
從中可以看出的是,作為參考成績的測試結果也并沒有使用GCC,而是Sparc自家的編譯器。
ICC GCC哪個更好?
實際上,SPEC CPU測試的是應用程序的運行時間,這個是被測機器處理器、緩存、內存、編譯器、操作系統(tǒng)等等部分性能的綜合體現(xiàn),并不是某個編譯器或者某個CPU的單獨測試結果,而且軟硬件平臺綜合體現(xiàn)的結果,即按照官方規(guī)則正確跑出來的分都是可比的。SPEC CPU測試結果追求的是程序運行用時越短越好,測試成績的優(yōu)劣固然重要,但是編譯器的真正的用途是“翻譯語言”,在同樣的硬件平臺(CPU)下,“翻譯”的越快就可以理解為應用啟動或進行某種運算的用時更少,這就是選擇編譯器的重要性,也是現(xiàn)代應用優(yōu)化的方向。
拿ICC和GCC相比,ICC是針對x86架構CPU使用的編譯器,ICC在現(xiàn)代高性能計算領域廣泛使用的向量化、并行化能力較強,而GCC作為跨平臺性的編譯器,在這方面性能較差,但是針對某些偏門的CPU指令集而言,GCC是唯一的選擇。
ICC、GCC兩者廣泛應用于商業(yè)環(huán)境中、都會被應用于處理器、OS及編譯器開發(fā)、測試之中。有些愛好者擔心ICC過度優(yōu)化,結果不準確,其實這大可不必。SPEC CPU是有嚴格的測試標準的,每一項測試都要求嚴格和參考結果一致,任何過度優(yōu)化導致的程序計算錯誤都不會被計算在結果之中。實際上,ICC在多年的高性能計算領域已經證明了自己的可靠性,而GCC在過往版本中,也會有編譯出錯、計算結果不正確等現(xiàn)象。
ICC GCC區(qū)別好比如此 懂得人自然懂
最后筆者想要強調的是,硬件平臺性能發(fā)揮需要合適的編譯器來加以配合,合適的才是最好的,如果編譯器不能合理使用,那又有何意義呢?
評論