引言
“強化人工智慧晶元、演算法等關鍵領域的國產替代,探索可重構、存算一體、超规格高算力智能晶片等新型架构芯片”——人民日報《搶抓人工智慧發展的歷史性機遇》
近日,人民日報刊文《搶抓人工智慧發展的歷史性機遇》,其中特別提到一項關鍵技術——“可重構晶片”,這種被寄予厚望的晶片,有望成為AI時代的“加速引擎”。今天,讓我們沿著技術發展脈絡,全方位瞭解其技術原理,探究它如何革新計算模式。
全系列文章共分為五個篇章,今天為該系列文章的第一篇。
可重構晶片:數據驅動 動態重構
可重構晶片(Reconfigurable Processing Unit, RPU)是一種能夠動態配置計算資源的新型晶元。該類晶元的核心在於內含可程式設計的處理單元及互連網路,能夠基於具體應用的計算需求和數據流特性,在運行過程中利用動態重構技術實現計算單元、互連結構和數據通路的動態按需配置,從而以接近“專用電路”(ASIC)的方式進行數據驅動下的計算。硬體層面的動態重構不僅具有完備的可程式設計能力,支援各類演算法和應用;而且提供了更精確靈活的硬體調度能力,大幅提高了晶元的面積效率和能量效率。因此,高能效比、高擴展性和高度的靈活性是該類晶元的最大特點。
技術原理:高性能計算晶元中的“變形金剛”
正是因為這種高度的靈活性,曾有媒體將可重構晶元稱為晶元界的“變形金剛”,其革命性體現在兩大核心技術特徵:
(1)數據流驅動架構
通過數據流直接驅動晶元計算和數據傳遞。與傳統CPU的指令驅動模式不同,其硬體資源(處理單元和互連網路)由數據流特性即時動態映射,消除了指令解碼、分支預測等傳統開銷,能效比提升可達十倍量級。
(2)多層次重構能力
支援從微架構到電路層的多粒度重構:
可重構晶元的內部結構主要有以下幾部分組成:
圖1.可重構晶元基本架構[1]
動態重構是可重構晶片(RPU)的“核心殺器”。它以無指令驅動的數據流計算方式和動態重構能力,顯著區別於傳統CPU和GPU。與CPU的馮·諾依曼指令驅動架構不同,其硬體資源(處理單元和互連網路)可直接由數據流映射任務需求,消除了指令解碼和分支預測等指令開銷,能效比更高;相比GPU的固定並行化架構(依賴SIMD/Warp調度),可重構晶元通過動態重構支援多粒度、多類型的並行模式,尤其適合動態負載場景(如AI推理)。可重構晶元的動態重構能力使其在能效、靈活性和開發成本間取得最優效能,尤其適合在演算法快速反覆運算或需求多變的領域應用。因此,可重構晶元也被學術界和產業界視為CPU、FPGA和GPU之外的第四類通用計算晶片。
可重構計算進化史:從理論到實踐的跨越
可重構晶元的發展歷程呈現出全球技術演進與國家戰略驅動的雙重特徵。
自1991年“新機器範式”提出可重構計算架構以來,該領域逐步從理論研究走向產業實踐:
1997年加州大學伯克利分校啟動GARP專案,對可重構計算架構進行概念驗證;
2003年麻省理工學院啟動MORPHEUS專案,探索可重構計算在專用領域的應用。
2006年清華大學成立可重構計算實驗室,研究可重構計算理論和架構實現。
2015年清華大學在可重構晶元方面的研究成果榮獲國家技術發明二等獎。
同年,國際半導體技術路線圖(ITRS)將可重構晶元列為“未來最具前景晶元架構技術”。
2016年,美國電子復興計劃(ERI)明確將可重構計算(軟體定義硬體)列為未來計算晶元的核心架構技術。
2017年,國務院在《新一代人工智慧發展規劃》中將可重構計算列入“新一代人工智慧關鍵共性技術體系”,重點支援其發展。
2017年清華大學團隊突破動態重構、多粒度融合等關鍵技術,研製出“Thinker”系列可重構 AI 芯片,實測表明,該晶元運行典型人工智慧任務時,能效比顯著高於同類 GPU。Thinker晶片被《麻省理工科技評論》專題報導。
2019年初,清微智慧公司的首款可重構晶元,也是全球第一顆可重構商用晶元大規模量產。
同年,賽靈思推出包含粗粒度可重構陣列(CGRA)架構的Versal系列產品,面向數據中心和高端智能駕駛,算力達到128TOPS。
2020年美國SambaNova公司發佈基於可重構晶元的DataScale平臺,並在多個美國多個算力中心、國家實驗室和研究機構規模部署。
2021年Mobileye公司在L4自動駕駛晶片中嵌入粗粒度可重構陣列。
2022年谷歌TPU v4借助可重構互連技術實現算力躍升(同等晶元數量時,處理速度達A100的1.67倍)
2023年日本採用可重構晶元建造了“富岳(Fugaku)”超級電腦,名列全球超算排行榜(TOP500)第二名,處理AI任務的性能達到A100集群的6倍。
從這一發展脈絡不難洞察,可重構晶元的價值正逐步獲得廣泛認知,並開始在實踐中得以深度應用。
可重構晶元未來發展演進
可重構晶元作為下一代計算範式的核心載體,將沿著智慧化融合與彈性化演進兩大主軸深度發展,通過架構創新與跨層技術協同,構建適應多元場景的算力基座。其演進路徑主要體現在以下三個維度:
架構革新:動態異構與資源複用
軟硬協同:敏捷開發與智慧編譯
場景驅動:垂直優化與生態構建
結語
《人民日報》提及的可重構晶片,是實現高算力、高能效智能計算的有效途徑之一。從技術原理而言,它通過“軟硬體雙程式設計”達成了靈活性與高能效的統一;從發展歷程來看,其突破既依託國際學術屆長期積累的成果,更離不開國內產學研多年的持續探索。當下,伴隨后摩爾時代的來臨,可重構晶元將成為解決“性能牆”“存儲牆”“功耗牆”難題的關鍵所在。正如計算機圖靈獎獲得者Patterson教授所說:“我們正進入計算架構的另一個黃金時代”,而中國實踐的一系列成果正在證實,可重構晶元必將在未來的科技發展浪潮中扮演愈發重要的角色。
可重構晶片究竟藏有什麼“神秘魔法”?為何它是最有前景的AI計算架構?下一篇文章,我們將從多維度深度剖析其中奧秘。
[1]DE SUTTER B, RAGHAVAN P, LAMBRECHTS A. Coarse-Grained Reconfigurable Array Architectures[M/OL]//BHATTACHARYYA S S, DEPRETTERE E F, LEUPERS R, 等. Handbook of Signal Processing Systems. Boston, MA: Springer US, 2010: 449-484[2020-12-22].
[2]PODOBAS A, SANO K, MATSUOKA S. A Survey on Coarse-Grained Reconfigurable Architectures From a Performance Perspective[J/OL]. IEEE Access, 2020, 8: 146719-146743.