想法很有意思,核心思想是遞歸地調用生成模型作為模組,構建具有自相似性的生成模型。
就是將一個圖形不斷地進行放大,會發現放大后的圖形與原始圖形在結構上非常相似。簡單地類比,就像雪花一樣,是一種典型的分形(Fractal)結構。
作者想法的核心來源是:
而進一步選用了自回歸模型(AR Model)作為分形生成器的具體實現。也就是說用AR模型作為「原子模組」,像俄羅斯套娃一樣層層嵌套——高層模型規劃圖像整體佈局,中層細化局部結構,底層最終確定每個像素的細節。
通過這種「分而治之」的策略,模型的計算複雜度大大下降,而且能生成媲美擴散模型的生成品質。
總體來說是個很新穎的點子,大佬的思路就是開闊。激發了我學習更多腦神經科學的興趣。期待後續的研究提供理論、實驗的支撐。