人工智慧領域再掀波瀾!OpenAI最新推出的ChatGPT圖像生成功能上線後迅速走紅,卻因用戶熱情遠超預期導致GPU資源嚴重過載。公司創始人Sam Altman日前公開表示:"我們的GPU正在'冒煙',不得不緊急啟動速率限制以緩解壓力。"這一事件不僅凸顯了生成式AI的爆發力,更折射出多模態技術發展中的核心矛盾——算力需求與資源供給的艱難平衡。
據瞭解,ChatGPT的圖像生成功能是在3月26日正式推出的,名為“Images in ChatGPT”。該功能允許使用者在ChatGPT及Sora平臺上,通過自然語言指令直接生成和編輯圖像,並支援多輪反覆運算優化。這一功能的推出,標誌著ChatGPT正式從單一的語言模型跨越到了全模態智慧體,實現了文本、圖像、代碼等多模態能力的深度整合。
新功能上線后,迅速在互聯網上引發了熱潮。大量用戶開始嘗試使用ChatGPT的圖像生成功能,將自己的照片或知名梗圖轉換成“吉卜力”卡通風格。這種動動嘴就能P圖的便利,讓ChatGPT的圖像生成功能在短時間內獲得了巨大的關注度。Altman本人也感歎於該功能帶來的巨大流量,他甚至表示自己過去十年在AI領域的努力,似乎都在這一刻得到了回報。
然而,隨著用戶數量的不斷增加,OpenAI原本計劃本周向所有使用者推送圖像生成功能的計劃被迫推遲。由於圖像生成功能的受歡迎程度遠超預期,OpenAI的GPU資源已經無法滿足當前的需求。為了應對這一挑戰,OpenAI不得不採取臨時限速措施,以確保系統的穩定運行和文本生成、對話等核心功能的穩定性。
值得一提的是,ChatGPT的圖像生成功能與DALL•E等擴散模型存在根本區別。GPT-4o圖像生成是原生嵌入在ChatGPT中的自回歸模型,它通過學習圖像與語言的關係,能夠生成有用、一致且具備上下文感知的圖像。然而,這種圖像生成方式需要依賴GPU的大規模並行計算,而生成更精確、更高清的圖像則需要更多的GPU算力。
為了應對算力需求的增長,OpenAI正在積極探索解決方案。一方面,公司可以考慮使用更強的GPU來提升計算能力;另一方面,也可以通過優化AI演算法來提高計算效率。作為AI領域的頭部玩家,OpenAI在GPU儲備方面自然不容小覷。據悉,微軟作為OpenAI的主要投資者,在2024年購買了約48.5萬塊英偉達的Hopper晶片,為OpenAI提供了強大的算力支援。
OpenAI在圖像生成領域取得的突破無疑為人工智慧技術的發展注入了新的活力。然而,如何平衡算力需求與技術反覆運算的關係,將是未來AI多模態技術發展中需要面對的重要課題。