如何看待 Kaiming He 最新提出的 Fractal Generative Models ？_港資訊

如何看待 Kaiming He 最新提出的 Fractal Generative Models ？

科技互聯網知乎

更新于：2025-03-26 09:10:14

想法很有意思，核心思想是遞歸地調用生成模型作為模組，構建具有自相似性的生成模型。

就是將一個圖形不斷地進行放大，會發現放大后的圖形與原始圖形在結構上非常相似。簡單地類比，就像雪花一樣，是一種典型的分形（Fractal）結構。

作者想法的核心來源是：

生物的神經網路也具有分形或近分形的結構，對這一點我不太確定有多少理論支撐，主要是我比較缺少腦科學的相關知識。
圖像可以被看作是由子圖像組成的，可以看做具備某種分形特點。這一點我也有些疑惑，感覺支撐力度不是很強，至少不是特別直覺。分形結構的核心特徵是自相似性（self-similarity）和尺度不變性（scale invariance），感覺真實的圖片這些特性是否足夠強，需要某種指標去衡量、驗證。

而進一步選用了自回歸模型（AR Model）作為分形生成器的具體實現。也就是說用AR模型作為「原子模組」，像俄羅斯套娃一樣層層嵌套——高層模型規劃圖像整體佈局，中層細化局部結構，底層最終確定每個像素的細節。

通過這種「分而治之」的策略，模型的計算複雜度大大下降，而且能生成媲美擴散模型的生成品質。

總體來說是個很新穎的點子，大佬的思路就是開闊。激發了我學習更多腦神經科學的興趣。期待後續的研究提供理論、實驗的支撐。

我是個女孩，我有可能成為物理學家，成為一名科研工作者嗎？

我是個女孩，我有可能成為物理學家，成為一名科研工作者嗎？

2025-03-26 13:31:37

歷史上有哪些被認為失傳的書籍後來又被找到？

歷史上有哪些被認為失傳的書籍後來又被找到？

2025-03-26 13:31:59

為什麼什葉派和遜尼派總是鬥來鬥去的？他們這麼爭到底圖個什麼？

為什麼什葉派和遜尼派總是鬥來鬥去的？他們這麼爭到底圖個什麼？

2025-03-26 13:32:01

有哪些生物學上的事實，沒有一定生物學知識的人不會相信？

有哪些生物學上的事實，沒有一定生物學知識的人不會相信？

2025-03-26 13:33:39

王興興最新發聲「今年的需求點爆了，不光是宇樹科技」，機器人行業發展現狀如何？

王興興最新發聲「今年的需求點爆了，不光是宇樹科技」，機器人行業發展現狀如何？

2025-03-26 13:36:03

怎樣看待由於有毒性，美國禁止生產核聚變燃料？

怎樣看待由於有毒性，美國禁止生產核聚變燃料？

2025-03-26 13:38:37

如何評價比亞迪 3 月 23 日發佈 11.98-13.98 萬元的秦 L EV？

如何評價比亞迪 3 月 23 日發佈 11.98-13.98 萬元的秦 L EV？

2025-03-26 13:38:40

有哪些曾經在春天餐桌上很常見，現在慢慢消失在視野里的河鮮？

有哪些曾經在春天餐桌上很常見，現在慢慢消失在視野里的河鮮？

2025-03-26 13:39:01

什麼時候人們發現用油發電比直接用油更省油？

什麼時候人們發現用油發電比直接用油更省油？

2025-03-26 14:13:16

將蝴蝶放到瓶子里去稱重，那麼蝴蝶飛行和落在瓶子底部的重量一樣嗎？

將蝴蝶放到瓶子里去稱重，那麼蝴蝶飛行和落在瓶子底部的重量一樣嗎？

2025-03-27 11:23:09

如果兒歌《種太陽》裡的願望都實現了，地球會變成什麼樣?

如果兒歌《種太陽》裡的願望都實現了，地球會變成什麼樣?

2025-03-27 13:53:14

雷軍建議優化新能源汽車號牌設計，稱綠色號牌制約了汽車產品的設計效果，怎麼看這一建議？你會設計成什麼樣？

雷軍建議優化新能源汽車號牌設計，稱綠色號牌制約了汽車產品的設計效果，怎麼看這一建議？你會設計成什麼樣？

2025-03-27 20:22:52

問界 M9 2025 款有哪些黑科技升級？50 萬預算買它值不值？

問界 M9 2025 款有哪些黑科技升級？50 萬預算買它值不值？

2025-03-27 20:34:20

特斯拉因「膠水不牢」在美召回全部 Cybertruck，這種情況可能會導致哪些危險發生？

特斯拉因「膠水不牢」在美召回全部 Cybertruck，這種情況可能會導致哪些危險發生？

2025-03-27 20:45:34

消息稱螞蟻集團 AI 訓練取得突破，使用國產晶片成本降低 20%，若屬實，會對行業帶來哪些影響？

消息稱螞蟻集團 AI 訓練取得突破，使用國產晶片成本降低 20%，若屬實，會對行業帶來哪些影響？

2025-03-27 21:05:17

比亞迪海獅 05 EV 於 3 月 25 日上市，11.78-13.78 萬，該車有哪些亮點？

比亞迪海獅 05 EV 於 3 月 25 日上市，11.78-13.78 萬，該車有哪些亮點？

2025-03-27 23:39:11

F1賽車上最重要的安全零件，為啥是塊不起眼的小木板？

F1賽車上最重要的安全零件，為啥是塊不起眼的小木板？

2025-03-28 00:08:31

深扒大祥哥的千萬負債局：牽扯王思聰，老番茄啊嗎粽同被坑

深扒大祥哥的千萬負債局：牽扯王思聰，老番茄啊嗎粽同被坑

2025-03-28 02:06:35

答被凍結的糟糕科技新聞問題：固態DUV光源

答被凍結的糟糕科技新聞問題：固態DUV光源

2025-03-28 04:27:21

比亞迪海獅 05 EV 上市 11.78 萬起售，相比元 PLUS 競爭力如何？

比亞迪海獅 05 EV 上市 11.78 萬起售，相比元 PLUS 競爭力如何？

2025-03-28 07:19:52

如何評價鴻蒙智行推出問界 M9 支援軟硬體升級寵粉計劃？

如何評價鴻蒙智行推出問界 M9 支援軟硬體升級寵粉計劃？

2025-03-28 07:29:19

宋朝為什麼突然就不流行詩了，開始流行詞了？

宋朝為什麼突然就不流行詩了，開始流行詞了？

2025-03-28 08:27:08

Google 調整 Android 開源政策，核心開發全面轉向私有分支，這將對行業產生什麼影響？

Google 調整 Android 開源政策，核心開發全面轉向私有分支，這將對行業產生什麼影響？

2025-03-28 08:33:14

為什麼科學家認為人類都起源於非洲，難道就不能說是各大洲分別誕生人類嗎？

為什麼科學家認為人類都起源於非洲，難道就不能說是各大洲分別誕生人類嗎？

2025-03-28 08:44:37