中文字幕AV无码免费一区_精品人妻无码专区中文字幕_无码人妻丰满熟妇区毛片_无码精品国产一区二区三区免费

李國杰:欲窮千里目,更上一層樓

  計算機體系結構國家重點實驗室成立10年了,這是這是一個值得慶祝的日子,也是一個值得總結反思的日子,我寫幾點意見與大家共勉。

  2011年計算機體系結構國家重點實驗室成立,2017年國家重點實驗室評估中評為“優秀”實驗室,這是20年來信息領域唯一一家首次評估就獲得優秀的國家重點實驗室,我們起了一個好頭。現在體系結構國重有44位研究員,幾乎占到計算所研究員的半壁江山,計算所許多“名人”都是國重的成員,體系結構國重理應做出更大的貢獻。

  在過去的十年里,體系結構國重做出了一些有世界影響的成果。影響最大的可能是寒武紀芯片,被《科學》雜志評價為深度學習處理器芯片方向的“先驅”和“領導者”。“一生一芯”計劃已經進行到第三期,覆蓋了151所高校(海外20所),在推進基于RISC-V的敏捷芯片設計方面已受到了全世界的關注。成立之初設定的四個主攻方向(高端計算體系結構、微體系結構、編譯與編程、超大規模集成電路與容錯計算)都做出了出色的成績,在幾位年輕的領軍人才的帶領下,已經分蘗出新的科研實體,分別成立了智能處理器研究中心、高性能計算機研究中心、高通量計算機研究中心、先進計算機系統研究中心、智能計算機研究中心,并以此為基礎正在申請成立兩個新的國家重點實驗室(處理器芯片國重和先進計算基礎設施國重)。十年前比較薄弱的非傳統體系結構方向如今也開出了引人注目的花朵:蛋白質序列鑒定及結構預測已取得進入國際前列的成果,量子計算已集聚一定的實力,正在努力擴充隊伍,DNA存儲、光子計算、超導計算也做出了令人欣喜的初步成果。

  總的來講,計算機體系結構國重部署的研究方向已經足夠寬闊,國際上與這一領域有關的研究方向我們幾乎都已涉及。如何組織和協調各個研究方向的研究力量,根據問題導向和目標導向的原則,圍繞國家和產業的重大需求,做出更有影響的重大成果,值得每一位國重員工認真思考。

  通觀計算機發展的歷史,體系結構和芯片的進步各自為計算機性能的提升做出了一半左右的貢獻。登納德縮放定律的失效和摩爾定律的放緩,使得芯片很難繼續做出一半的貢獻。至少在變革性的新器件大規模進入市場以前,人們把提高計算機性能和能效的希望主要寄托在體系結構的創新上。尤其是對于中國而言,由于半導體工藝技術與國際先進水平有4代以上的差距,近期內解決重要問題的重任也主要落在系統結構科研人員的肩上。國內不少人一天到晚盯著半導體工藝上的差距,對解決問題一籌莫展。Patterson教授在他的圖靈獎報告中引用了Shimon Peres的一段話:“如果一個問題無解,那它可能不是一個問題,而是一個事實,我們不需要解決,而是隨著時間的推移來處理。”我國半導體工藝落后的問題只能隨著時間的推移來解決。但是,看似無法解決的工藝技術差距可以另辟蹊徑,通過體系結構的創新來緩解。今后十年甚至更長的時間內,正是體系結構科研人員大顯身手的好機會。

  體系結構講的是一個體系,而不是單項技術。每個國家的資源稟賦不同,人文歷史不同,發展階段不同,采取的技術體系也應該不同。多年以來我們跟隨美國的技術體系(稱為A體系)。相對而言,美國的工程師少而高價值的市場大,走的是一條高精尖的通用為主的道路。與美國相反,中國的工程師多、場景多、市場規模大(包括中低端市場)。我們需要重點發展各個領域的跨層垂直優化技術,用適應不同場景的加速芯片和系統戰勝曾經是主流的通用芯片(稱為C體系)。計算機技術的普及顯著擴大了市場空間,現在一個領域的市場規模可能就相當于過去覆蓋許多領域的通用市場。最近寒武紀研制的思元270 NPU芯片,執行AI任務的綜合性能功耗價格比是同期NVIDIA通用GPU Tesla V100芯片的10倍以上,這就是特定領域加速芯片的典型案例。場景多了,芯片種類多了,設計的人員就要多。打破生態壟斷、降低創新門檻、快速培養芯片和系統架構設計人才成了當務之急。開源是打破技術壟斷最有效的方式,敏捷設計是應對碎片化應用場景的出路。RISC-V可能是構建C體系的一條捷徑,值得努力探索。

  所謂體系結構研究,與每一個層面的單方向技術研究不同,需要透徹了解各個層面技術的聯系和制約,從上到下實現整體的改進和優化。從Patterson教授圖靈獎報告講的Python程序可通過系統優化得到6萬倍加速的著名案例可以看出,得到這種加速效果需要程序語言的轉換(47倍)、多核處理器并行(7倍)、存儲布局優化(20倍)、SIMD硬件擴展(9倍)。獲得6萬倍加速的前提是各層次的優化是協調的,而不是互相制約和抵消,沒有對體系結構的深入理解,就會此消彼長,得不到理想的效果。過去幾十年,體系結構的研究的重點是CPU芯片、存儲系統、操作系統、編譯系統等各個層次的獨立研究,今后十幾年,特定領域系統結構(DSA)將成為計算機發展的主流,DSA的優勢在于一個領域的縱向整合,這正是Patterson教授講的“計算機體系結構迎來下個黃金時代”的本意。我們在縱向整合方面能做出與“黃金時代”相稱的貢獻嗎?

  計算機體系結構研究呈現明顯的否定之否定和螺旋式發展的規律。不但集中為主還是分布為主有所謂“合久必分、分久必合”的“三國定律”,橫向分層次發展和縱向整合、顯式并行和和隱式并行也有周期性的規律。上世紀80年代以前計算機研究的主流是縱向整合,IBM公司就是垂直整合的典范。90年代以后,英特爾和微軟公司的興起促使各個層次的橫向發展成為主流。現在又到了縱向垂直整合為主流的時代。早期的并行處理大多是靠人工實現的顯示處理,過去二三十年發展了很多減輕程序員負擔的自動并行處理技術。由于降低能耗成為主要的技術追求,而程序員和編譯器靜態分配存儲比動態分配的高速緩存使用更少的能量,目前流行的DSA處理器又更多地考慮顯式并行。我們既要順勢而為,又要從更高的視角洞察體系結構主流發展的宏觀規律。

  從IBM 360創立了兼容的計算機系統概念以來,計算機體系結構研究一直是計算機領域的主要研究方向。根據我的印象,計算機系體系結構研究曾經有過火熱的時刻。上世紀80年代,并行計算機的互聯結構(Interconnection)的文章很多,蝶形互聯(butterfly)、超立方體互聯(Cube)等層出不窮。我在美國讀博士時, H.J. Siegel教授講了一個學期計算機體系結構課,講的內容全是互聯結構。但是,今天超級計算機用的互聯結構,不是胖樹結構,就是多維環(Torus),都是簡單的互聯網絡,我不知當年發表那么多互聯網絡的文章到底對并行計算機的發展起了多大作用。有一段時間 ISCA 會議上大多是關于Cache效率分析的性能模擬方面的文章,計算界的權威們也不得不站出來說,會議論文許多是垃圾文章。與此相反,陳云霽和陳天石開始用人工智能技術優化芯片設計的參數選擇時,既不是國際熱點,文章投稿多次被拒,在國內也申請不到經費,發自內心的創新驅動支持他們坐了幾年冷板凳,才有今天的輝煌。為國分憂的宏大敘事是做科研的情懷,選擇具體做什么方向的研究反映一個科研人員的眼光。林彪打仗有“四快一慢”原則,思考作戰方案、決定發動總攻要慢。我們做科研在選擇具體方向時也要多發些功夫思考,不要人云亦云隨大流。

  體系結構國重這幾年發展比較順利的一個重要標志是年輕人才成長較快。國重自成立之日,就把“寶”押在年輕人身上,重用了年輕的學科帶頭人,給他們搭建了足夠寬廣的舞臺。幾年來先后冒出了寒武紀芯片、RISC-V開源芯片、高通量芯片、工業互聯網芯片等有前景的新方向,量子計算、超導計算、DNA計算等交叉領域也涌現了一批新人。計算機科學是一門年輕的學科,計算機發展歷史上許多重要的發明都出自年輕人。目前國內的人才評價環境不理想,人才帽子和“四唯導向”還有一定的負面影響,希望體系結構國重的年青學者不慕虛名,以科研成果的實際影響力論英雄,不問成功秘訣,只管砥礪前行。計算所和國重的領導者在引進和培養年輕人才上還要多費心思。

  計算所和體系結構國重一向重視產業化,與華為、曙光等企業開展了卓有成效的合作,國重的成員創辦了一些有活力的新企業,對開源社區也做了積極貢獻,對工業界已經有較明顯的技術輻射和影響。國家重點實驗室的價值最終要體現在對產業界的影響上。我國高技術企業對關鍵技術和核心技術的需求越來越強烈,我們不能用老眼光看到今天的企業,一些短平快的簡單技術可能已經不能滿足先進企業的胃口。相比于國家大力扶植的國家實驗室,國家重點實驗室應該更重視下一代核心技術的研發,為國家實驗室提供強有力的技術支撐。國重不能關起門做研究,要多與企業溝通,把企業的換代技術需求轉化為我們的課題任務。

  欲窮千里目,更上一層樓。體系結構國重的同仁們,加油!

附件: