品玩4月10日訊,據 Venturebeat 報導,英偉達發佈了一款基於Meta公司舊型號Llama-3.1-405B-Instruct模型的全新完全开源大型语言模型Llama-3.1-Nemotron-Ultra-253B-v1。
Llama-3.1-Nemotron-Ultra-253B-v1是一個密集的2530億個參數,旨在支援高級推理、指令跟蹤和人工智慧助手工作流。在今年 3 月舉行的 Nvidia 年度 GPU 技術大會(GTC)上,它被首次提及。
該模型代碼已在 Hugging Face 上公佈,並公開了權重和後期訓練數據。該模型設計為在 “推理開啟 ”和 “推理關閉 ”兩種模式下高效運行,允許開發人員根據系統提示在高複雜度推理任務和更直接的輸出之間切換。