OpenAI近期在ChatGPT中引入了一項革命性的新功能——圖像生成。這一變化得益於其先進的GPT-4o多模態模型,使得ChatGPT用戶現在可以直接在聊天介面中創建圖像。
據悉,這一新功能將率先向ChatGPT Plus、Pro、Team以及免費用戶開放,而企業和教育級別的使用者也將很快獲得使用許可權。OpenAI的首席執行官Sam Altman在週二的一場視頻直播中激動地表示,他們推出了迄今為止最有趣、最酷的產品之一——直接在ChatGPT中生成原生圖像。
Altman坦誠,這一功能備受使用者期待,特別是在競爭對手如Google Gemini自2024年年中便開始提供集成圖像生成功能的大背景下。現在,ChatGPT用戶可以根據提示、對話內容以及上傳的檔來生成圖像,無論是創造全新的圖像還是對現有圖像進行轉換,都變得輕而易舉。
OpenAI強調,GPT-4o模型中的世界知識訓練使得ChatGPT能夠更好地理解圖像的應用場景。該模型還能更準確地根據提示在圖像中呈現文本。用戶可以通過自然語言提示來優化圖像,例如在設計視頻遊戲角色時,模型可以在用戶進行多次調整后,依然保持視覺的一致性。
OpenAI希望用戶能夠利用這一工具來製作各種需要精確度的專業圖像,如圖表、信息圖表和品牌內容,同時也適用於文字較多的圖像,如說明海報和名片。它還能生成具有精確燈光和紋理的逼真圖像,以及受益於對話背景的視覺效果。
為了簡化流程,OpenAI使用了單一的多模式模型來處理所有的圖像生成任務,從而將ChatGPT定位為個人和專業圖像生成的首選工具。這一創新不僅提升了用戶體驗,也進一步鞏固了OpenAI在人工智慧領域的領先地位。