【本文由小黑盒作者@世界君777於03月30日發佈,轉載請標明出處!】
2025年3月26日,OpenAI宣佈其最新一代多模態模型GPT-4o正式集成“迄今為止最先進的圖像產生器”,並開放免費使用。這一動作引發了全球範圍內的關注,尤其是其生成吉卜力風格圖像的能力,迅速在互聯網上掀起了熱潮。
GPT-4o圖像生成器的核心亮點在於其多模態交互能力。用戶可以通過文字、圖片甚至語音指令來生成或修改圖像。
例如,用戶可以要求生成“描述貓咪的彩色漫畫頁面,並添加幽默元素”,GPT-4o不僅能夠精準呈現核心概念,還能融合多語言註釋和視覺幽默元素。這種即時交互和精準控制,使得圖像生成的複雜需求變得容易實現,幾秒鐘內便能得到高保真的成品。
GPT-4o的圖像生成功能上線僅兩天,社交媒體上便充斥著以吉卜力風格生成的圖像。幾乎所有類型的圖片都被“吉卜力”化了。
甚至連OpenAI的CEO薩姆·奧爾特曼也將他的新頭像設置為吉卜力風格的圖片。
這種解決方案在技術上並不容易實現,因為AI模型是基於大量數據訓練的,很難完全遮罩特定風格。
例如,可以要求AI平臺在生成圖像時提供透明的使用說明,並對侵權行為承擔法律責任。只有這樣,AI技術的進步才不會以犧牲藝術創作者的權益為代價,才能真正實現可持續發展。
————————