AI 圖像產生器 Midjourney 今天發佈了其時隔許久的首個新模型。這個被稱為 V7 的模型是一次從零開始的重構,目前已向用戶開放 alpha 測試版本。
V7 在兩個方面有所改進:首先是更好的圖像品質,其次是新的工具和工作流程。
在圖像改進方面,V7 承諾在手部、手指、身體部位和"各類物體"方面提供更高的連貫性和一致性。同時還能呈現更加細緻和逼真的紋理與材質效果,比如皮膚皺紋或陶瓷罐的細微特徵。
這些細節通常是辨識圖像是否由 AI 生成的最明顯特徵。需要明確的是,Midjourney 並不是聲稱已經取得了讓 AI 圖像完全無法被專業人士識別的突破;而是表示已經大幅改善了我們習以為常的一些瑕疵。
在功能方面,最大亮點是新增的"草稿模式"。Midjourney 在其各種使用者溝通管道 (博客、Discord、X 等) 上表示,"草稿模式的成本只有一半,渲染速度提高了 10 倍。"
不過,草稿模式生成的圖像品質低於其他模式,因此並不適合用於生成最終成品。相反,它旨在幫助使用者快速反覆運算和探索,找到理想效果后再切換到其他模式來生成適合公開使用的圖像。
V7 提供兩種模式:turbo 和 relax。Turbo 模式能快速生成最終圖像,但信用點數消耗是兩倍;而 relax 模式雖然處理時間較長,但只需要一半的成本。奇怪的是,V7 目前沒有標準模式;Midjourney 表示這需要更多時間完善,將在後續推出。
V7 支援之前版本的大多數參數 (--ar、--seed 等),包括用戶現有的 6.1 版本的 --sref 代碼,以及最近推出的個人化功能。事實上,V7 是第一個默認啟用個人化功能的 Midjourney 模型,這意味著使用者需要選擇至少 200 張圖片來構建其美學偏好檔案。
個人化功能會多次讓使用者在兩張圖片中進行選擇,以此學習用戶認為"美"的標準,從而根據這些品味定製生成內容。不過,和之前的模型一樣,使用者也可以選擇在 V7 中關閉個人化功能。
Midjourney 是最早獲得廣泛應用的 AI 圖像生成工具之一。最初它只能在 Discord 上使用,需要通過一些略顯晦澀的語法操作,但現在已經推出了更現代化的網頁介面。
社交媒體上分享的大量 AI 藝術作品都是通過 Discord 製作的。它也是許多 AI 視頻創作者工作流程中的重要組成部分,他們通常先在 Midjourney 中創建初始圖像,然後使用 Runway 等應用的圖像轉視頻功能。
儘管非常受歡迎,Midjourney 仍面臨多起訴訟,並捲入了一場持續的爭論:使用網路上受版權保護的作品訓練 AI 模型是否構成合理使用。(任何使用過 Midjourney 的人都知道它是用受版權保護的作品訓練的;它有時甚至會在輸出結果中生成浮浮浮水印和藝術家簽名。)
最近,該公司宣佈計劃在未來推出硬體產品,但具體形式仍不明確。