谷歌在美國舉行了“Google Cloud Next 25”大會,正式發佈了專為AI設計的第七代TPU(Tensor Processing Unit)加速器“Ironwood”,單晶元峰值算力可達4614 TFLOPs。
Ironwood計劃於今年晚些時候面向Google雲客戶推出,將提供兩種配置:256晶片集群和9216晶片集群。
據介紹,Ironwood是谷歌首款在其張量核和矩陣數學單元中支援FP8計算的TPU,而此前谷歌的TPU僅支援用於推理的INT8格式和處理以及用於訓練的BF16格式和處理。
Ironwood還大幅增加高頻寬記憶體(HBM)容量,每顆晶元的HBM容量提高到了192GB,達到了Trillium的6倍,可處理更大型的模型和數據集運算,減少頻繁的數據傳輸需求。
同時,HBM帶寬也大幅提升,Ironwood單顆晶元的記憶體頻寬可達7.2Tbps,是Trillium的4.5倍,以確保數據快速存取。