ChatGPT文生圖功能迎重大升級 大幅提升圖像可用性
更新于:2025-03-26 13:36:35

  【CNMO科技消息】3月25日,OpenAI對GPT-4o和Sora進行了重大更新,提供了全新文生圖模型。除了文生圖之外,該模型還支援自定義操作、連續發問、風格轉換、圖像PPT等超實用功能。

  OpenAI首席執行官奧爾特曼在週二直播活動中宣佈,正式推出基於GPT-4o模型的原生圖像生成功能,不再調用獨立的DALL-E文生圖模型。此前,ChatGPT於2022年底上線時僅支援文字聊天,約一年後集成DALL-E 3圖像生成模型,但二者系統獨立。而此前AI圖像產生器“理解提示詞能力差”“無法準確生成圖片中的文字”等問題,嚴重限制了其在教育、職場等領域的應用。

  此次升級后,ChatGPT圖像生成功能進步顯著。它能大致準確按照提示詞生成圖像中的文字,在生成黑板板書、印刷體、科學常識繪圖等涉及圖像文字的場景中,從幾乎不可用達到接近商用水準。圖像編輯功能也更加實用,如可將合照轉化為動畫畫風,根據簡單提示詞生成相對論漫畫彩圖,還能根據漫畫草稿一鍵上色、更換主要角色。在商業應用方面,模型可根據用戶上傳照片和卡片範本自定義生成新卡片,還能基於聊天上下文生成具有一致性的系列圖像,這對遊戲角色設計意義重大。

  不過,OpenAI承認新圖像產生器存在局限性,會受到模型幻覺影響,在密集文字和非拉丁語文字圖像生成方面易出問題。自週二起,該功能向所有免費和付費使用者推出,未來幾周內開發者可通過API調用。此次升級無疑為ChatGPT的發展注入新動力,也讓人期待其在更多領域的應用表現。

關於中國AI Agents潛力
關於中國AI Agents潛力
2025-04-06 11:26:19
現貨黃金跌破3000美元
現貨黃金跌破3000美元
2025-04-07 11:10:21