近日,一項關於圖像生成技術的創新專利由北京百度網訊科技有限公司正式公佈,引起了業界的廣泛關注。據天眼查財產線索資訊透露,該專利名為“圖像生成模型的構建方法、圖像生成方法及其裝置”,深入探索了圖像處理與人工智慧領域的融合。
此專利詳細闡述了一種全新的圖像生成方案。具體而言,它首先收集樣本圖像及其對應的樣本提示詞,作為訓練的基礎數據。接著,利用一個被稱為第一預處理網路的技術手段,對樣本圖像進行處理,提取出控制條件和目標潛在空間編碼。與此同時,另一個第二預處理網路則將樣本提示詞轉換為文本向量,為後續的圖像生成提供語義指導。
在核心環節,該專利將目標潛在空間編碼、文本向量和控制條件共同作為輸入,送入一個待訓練的UNet網路中。通過結合UNet網路輸出的雜訊分佈,對UNet網路進行精細訓練,最終得到一個訓練有素的目標UNet網路。這一步驟是圖像生成過程中的關鍵,它確保了生成的圖像既符合語義要求,又具備高度的真實感和細節豐富性。
進一步地,該專利還提出了一種基於第一預處理網路、第二預處理網路、目標UNet網路和解碼器構建的圖像生成模型。這一模型不僅簡化了圖像生成的流程,還顯著提高了圖像生成的效率和品質。通過這一模型,用戶可以輕鬆地將文本提示轉化為生動的圖像,為圖像創作和設計帶來了全新的可能性。
據天眼查信息顯示,北京百度網訊科技有限公司在人工智慧領域一直保持著領先地位,此次公佈的圖像生成技術專利更是其在圖像處理領域的一次重要突破。該專利的公佈不僅展示了百度在技術創新方面的實力,也為整個行業樹立了新的標杆。
隨著人工智慧技術的不斷發展,圖像生成技術將在更多領域得到應用和推廣。北京百度網訊科技有限公司的這一專利無疑為圖像生成技術的發展注入了新的活力,也為相關行業帶來了更多的想像空間和發展機遇。