比GPU快幾百倍!曦智科技首發新一代光電混合計算卡:128×128光子矩陣
更新于:2025-03-27 09:37:08

快科技3月26日消息,曦智科技今天正式發佈全新光電混合計算卡“曦智天樞”,首次實現了光電混合計算在複雜商業化模型中的應用。

曦智科技是全球領先的光電混合算力提供者,在集成光子領域取得了開創性的突破,掌握了光子矩陣計算(oMAC)、片上光網路(oNOC)、片間光網路(oNET)三大核心技術,打造了光子計算、光子網路兩大產品線。

2021年12月,曦智科技首次對外發佈光電混合計算產品,成功驗證了光電混合計算在特定演算法下,相較於主流GPU的速度優勢多達數百倍。

曦智科技認為,光電混合將會為人工智慧、大語言模型、智慧製造等領域帶來算力革新。

本次發佈的曦智天樞,深度融合了光晶元、電晶元各自的優勢,並採用3D先進封裝技術,支援可程式設計。

它在光電集成度、光子矩陣規模、精度、可程式設計性等方面,都比前代產品實現了明顯的性能提升。

比如在支援科學計算(如伊辛演算法)基礎上,加強了對於ResNet50等商業演算法應用的支援,既保持了光計算優勢,還大幅提升了產品通用適配性。

天樞採用非相幹架構,不僅易於系統擴展,還具備出色的抗干擾能力、更高的計算精度。

它的核心處理器包括光學處理單元(OPU)、電學專用積體電路(ASIC),光晶片和電晶片通過3D TSV矽通孔、FlipChip倒裝晶元封裝技術進行整合、協同工作,可顯著降低延遲、提升信號傳輸完整性,其中光晶元面積達到600平方毫米,比上代增大3倍。

晶片主頻為1GHz,輸出精度8bit,比上代提升8倍。

光晶片上的器件數量超4萬個,但元件尺寸進一步縮小,集成度顯著提升。

最大可支援128x128矩陣規模,是上一代64×64的4倍,運算能力、靈活性都得到了極大的提升。

此外,用戶可以通過API自由配置計算矩陣係數,擁有更強的適應性和優化空間。

據悉,光子計算是一種被動運算,運算任務在光通過光子矩陣的過程中即可完成,顛覆了傳統CMOS電子晶元的運算邏輯。

光子晶元的性能提升與光子矩陣規模、主頻速率、波長數量等參數相關,而不依賴晶體管的密度及晶片製程的提升。

曦智科技還首次提出了等效光算力(EOPP)標準,是一種考慮了矩陣規模、輸出精度、權重刷新速度等的綜合算力評價方法,相比當前主流的電晶元指標計算方法,更符合光計算的原理和特點。

軟體方面,天樞搭載了曦智光電混合計算軟體棧,算子庫包含RVV(RiscV Vector)算子,電矩陣(dMAC)加速算子、光矩陣(oMAC)加速算子,支持CV類和LLM類模型,以及包括Ising、LineSolver在內的non-AI算子。

用戶藉助曦智編譯器,可以靈活地運用這些算子來構建高效的應用模型。

此外,平臺還支援使用者自定義算子,通過OpenCL C/C++語言進行編譯和優化,進一步擴展了演算法開發的靈活性。

曦智科技的軟體棧與Pytorch、ONNX等主流框架深度集成,可通過軟體棧直接使用天樞的光矩陣和電矩陣加速單元對模型和演算法進行加速和驗證,也可以將模型通過曦智編譯框架編譯部署在端側進行推理。

通過軟體棧,天樞成功運行了ResNet50深度卷積神經網路模型、Llama 2 AI大語言模型,首次實現了光電混合計算在商業化場景中的應用。

目前,曦智科技已啟動下一代光電混合計算產品的研發,將會進一步提升計算能力。