“創業要做非共識但正確的事。”張一鳴的這句話,曾影響了無數位節系創業者,其中也包括前位元組 AI 大將王長虎。
在 2023 年視頻生成賽道尚處“非共識”階段時,王長虎卻繞開彼時如火如荼的文生文大模型賽道,押注視覺大模型,並先做海外市場。
“當時支撐我們的信念就是,我們堅信我們做的事情是非共識的、但正確的事情。”這也正是王長虎在位元節期間,經常聽張一鳴強調的觀點。
見證過抖音在移動互聯網時代的顛覆,王長虎堅信視頻生成賽道存在平臺級產品的機會。“ UGC 到 AIGC,變的是 U 和 AI,最主要的視覺難題不盡相同,但系統性地解決視覺問題所需要的核心技術能力卻一脈相承。”王長虎想做的是一款讓普通人也能輕鬆玩轉 AI 視頻創作的全民應用。
直到 2024 年初 Sora 橫空出世,大眾對視頻生成的熱情被點燃,也讓王長虎走到了聚光燈下。
Sora 發佈后,一張梗圖流傳於社交媒體:Sora 是坐在寶座上的巨大神像,下面跪著一眾渺小的膜拜者,包括 Runway、Pika、SVD、PixVerse 等十多個視頻生成模型或產品。
由王長虎開發的 PixVerse, 是 “膜拜者” 中唯一一個由中國公司開發的產品。
看到這張圖后,王長虎的心情很複雜,對於“跪”在了第一排,跟 Runway、Pika、SVD 等當時最好的視頻生成產品放到一起,王長虎是感到榮幸的,但更多的是遺憾,“如果我們過去一年有更多的投資和算力資源,有可能最先做出 Sora 的不是美國人,有可能是我們。”
近日,王長虎創辦的愛詩科技剛剛完成 A5 輪融資,累計融資金額超 4 億元,成為中國視頻大模型領域融資規模最大的創業公司。
但隨著老東家位元組也開始殺入視頻生成賽道,當愛詩科技押注的非共識成為大廠新共識之後,王長虎的新挑戰也隨之展開。
Sora 橫空出世的第二天,王長虎一大早就被微信吵醒了,投資人、朋友、家人、同事紛紛問他“如何看待 Sora?”還有人問他,超越、追趕 Sora 的最佳視窗期是多長時間?
王長虎的答案是一年前的 2023 年,“是在視頻生成行業很冷的那一年”。也正是在那一年,在幾乎所有人都不看好視頻生成賽道的情況下,王長虎創辦了愛詩科技。
甚至,在還沒拿到天使投資的時候,王長虎就收到了投資人朱嘯虎的勸退:“你還是回去上班吧,大模型在中國沒有機會”。
但作為一名技術理想主義者,親歷深度學習與計算機視覺兩次技術浪潮,王長虎認為生成式 AI 是“ 10 年一遇的機會”,不願錯過時代變革。
20 年前,王長虎做的第一個研究,就和 AIGC 有關。2004 年,王長虎還是中國科學技術大學電子工程與資訊科學系的一名大四學生,他做了人生首個研究,就是根據一張或多張人臉圖片,生成該人臉的 3D 模型。
同年,王長虎進入微軟亞洲研究院實習,並在中科大博士畢業後轉為正式員工。期間,王長虎的工作內容也有不少與 AIGC 相關,但 13 年後他還是離開微軟去了位元組跳動。
“在微軟可以做世界上最頂尖前沿的科學研究,但科研專案應用到公司產品需要的周期特別長。”在王長虎記憶中,自己二零零幾年做的工作,若干年後才真正應用在必應搜尋引擎,新技術很難在第一時間影響使用者。
不同於其他大廠在產品成熟後才建立 AI 部門,位元組跳動一邊開發短視頻類產品,一邊組建 AI Lab 部門。也正因如此,2017 年加入位元組跳動后,王長虎完整參與了抖音和 TikTok 等短視頻類產品從 0 到 1 的建設和發展,並為集團各產品提供 AI 技術支撐和業務解決方案。
然而當抖音、TikTok 等核心應用取得具有絕對優勢的市場地位、開始步入“流量如何商業化”的階段,AI Lab 在位元組的位置鬆動了。這一點從 AI Lab 負責人馬維英的彙報對象從張一鳴變為當時的抖音負責人張楠中就能窺見端倪,這意味著 AI Lab 不再是個集團級的前瞻性專案,變成了服務於抖音這一應用的技術團隊。
2021 年,王長虎離開了位元組跳動。離開的原因,用王長虎自己的話說是“發現自己進入了舒適區,想要挑戰新的事物。”
王長虎 圖源:愛詩科技官網
王長虎是一直有創業情結的,從位元組離開后他不是沒想過直接創業,但當時生成式 AI 技術的進步還不足以對整個產業產生巨大影響。
直到 Stable Diffusion、ChatGPT 出來之後,王長虎意識到新的 AI 時代到來了。
見證過抖音在移動互聯網時代的顛覆,王長虎堅信視頻生成賽道存在平臺級產品的機會。
2023 年 4 月,王長虎找到現在的合夥人、之前在光源資本 TMT/AI 方向負責人謝旭璋,並拿到超過五千萬的天使輪融資,隨即宣佈成立了新公司“愛詩科技”。
同年 6 月,數名核心人員就位,核心成員中大都是跟隨王長虎在位元組跳動打過硬仗的。團隊成立第一天的時候,王長虎就將目標客戶群定位為每天玩抖音、TikTok 的使用者,“我們的基因是伴隨抖音、TikTok 成長起來的,肯定主要還是 to C 。”
直到 2024 年初,一款名為 PixVerse 的 AI 視頻生成產品在海外突然爆火,首月訪問量便突破 120 萬,這一數字超過了矽谷同期明星初創產品 Pika 上線三個月後的 200 萬月訪問量。
這是王長虎創業半年交出的答卷,但與此同時,一場視頻生成領域的巨變正在醞釀之中。
一個月後,Sora 震撼發佈,雖然只是預覽版本,但還是憑藉 60 秒一鏡到底的高清生成能力和三維空間動態連貫性,迅速引爆科技圈,不少業內人士將 Sora 視為 AI 視頻界的 ChatGPT 時刻。
AI 視頻生成的戰場,因為 Sora 的到來,開始真正熱了起來。
提前搶跑的王長虎也因此受到關注。“ Sora 的出現恰恰驗證了我們一開始制訂的技術路線是正確的。”在王長虎看來,Sora 的技術發展相當於在 GPT-2 和 GPT-3 之間,還沒到 GPT-4 的水準,留給市場的空間很大。“我們有信心在 3-6 個月之內就可以追趕上 Sora 目前的水準。”
不只王長虎,面對彼時尚處於“期貨”的 Sora,國外 Runway、Luma AI 等一批初創企業均推出了最新的視頻生成模型,阿裡、騰訊等國內巨頭也紛紛發佈基於各自優勢的視頻生成模型,不少大模型企業都將研發“國產 Sora ”擺在了優先戰略級。
王長虎的老東家位元組跳動也殺了進來。 事實上,Sora 發佈前,抖音前 CEO 張楠剛剛轉崗剪映,正準備在 AI 視頻生成領域大幹一番。Sora 的出現,加快了位元組 AI 生成視頻產品的研發速度,當月,剪映推出名為 Dreamina 的 AI 繪畫工具。3 個月後,剪映 Dreamina 正式更名為“即夢”,上線 AI 作圖和 AI 視頻生成功能,生成時長為 3-12 秒。
立足海外的王長虎,和老東家的首次交鋒發生在國外市場。PixVerse 發佈半年後,位元組旗下的 AI 視頻生成產品 Dreamina(國內版名為“即夢”)登上了 CapCut (海外版“剪映”)的主頁面。
如今,老東家親自下場,不僅在資源上對王長虎形成碾壓,更在用戶觸達上構建起難以逾越的生態壁壘。
剪映海外版 CapCut 上線於 2020 年。隨著 TikTok 席捲全球,與之深度綁定的 CapCut 也搭上了順風車。根據行動數據監測公司 SensorTower 的數據,CapCut 的 MAU 已超 4 億,佔據全球移動視頻剪輯市場逾八成份額。
龐大的用戶基礎下,位元組跳動從 UGC 邁向 AIGC,似乎更加水到渠成。CapCut 可以輕鬆地將新的 AIGC 功能通過 TikTok 的各種推廣管道觸達使用者,再通過 TikTok 發起特效全球挑戰賽,這種“ AI 工具 - 內容裂變 - 流量反哺”的飛輪效應,正是初創公司難以複製的生態優勢。
“抖音也是在巨頭圍堵過程中成長起來的。”在王長虎看來,小公司有小公司的優勢,比如決策流程很快,可以聚焦做一件事情。“在視頻生成這個方向,我們一方面是有先發優勢,一方面我們有信心持續走在最前面。”
然而現實遠比理想殘酷。截至目前,國內 AI 視頻生成賽道擠入近 20 家創業公司,但巨頭的生態絞殺從未停止,位元組跳動通過 CapCut 免費開放部分基礎 AI 功能,阿裡雲視頻生成大模型萬相 2.1 已經開源……初創公司不僅要證明自己比巨頭更快,更要在用戶心智被佔領前,找到巨頭“不願彎腰撿硬幣”的垂直縫隙。
前有 Sora 需要追趕,後有巨頭來勢洶洶。王長虎也加快了產品反覆運算的速度。
從 2024 年初上線至今,PixVerse 模型的版本已經更新了 6 次,憑藉“毒液”“機器人變身”等特效在社交媒體頻頻出圈。截至目前,PixVerse 的全球使用者量已突破 4000 萬,單月月活躍使用者(MAU)達 1500 萬。
但百度董事長兼 CEO 李彥巨集率先給視頻生成賽道潑了盆冷水。“ Sora 這種視頻生成的投入週期太長了,10 年、20 年都可能拿不到業務收益,那麼無論多麼火爆,百度都不去做”,2024 年三季度總監會上,李彥巨集明確表態道。
Sora 成本究竟有多高?市場研究機構 Factorial Funds 給出過一份報告,Sora 模型至少需要用掉 4200~10500 塊英偉達 H100,想要大範圍應用,還需要再增添約 72 萬張英偉達 H100,單論 GPU 投入費用,就需要超 200 億美元。
面對巨頭碾壓和有限的資源,王長虎也在不斷降低訓練成本。在位元組期間主導構建的視頻 AI 中台的經驗,使其團隊掌握了從海量數據中篩選出一小部分高質量數據來訓練更優秀的模型的能力,“訓練成本僅為大廠的十分之一甚至更低”。
而經過一年的蓄力,去年 12 月,Sora 正式版終於姍姍來遲,但效果卻不盡如人意,被不少使用者吐槽“不如一個中國的開源模型”,價格同樣槽點滿滿,Pro 版要 200 美元一個月。
隨著 Sora 熱度降溫,資本對 AI 視頻生成領域的投資愈發謹慎。在 AI 這個快速反覆運算的領域,市場瞬息萬變,錢的流向也隨之發生變化。年初 DeepSeek 掀起一場算力革命,加速了推理大模型的研發,近日 Manus 的出圈則點燃了 Agent 生態。
與此同時,行業競爭加劇,AI 視頻生成工具之間差異化越來越小,用戶增長乏力已成為不爭的事實。
王長虎的 PixVerse 也未能逃脫訪問量下滑的趨勢。根據 aig crank 數據,2025 年 2 月,PixVerse 訪問量出現下滑,環比下降 14%。另據 SimilarWeb 統計,位居全球前列的 AI 視頻生成企業 Luma AI、Pika 的月總訪問量都出現了環比下跌。
當行業陷入同質化競爭,王長虎也準備將戰場轉向國內,以開闢更大的潛在使用者。據悉,PixVerse 國內版本已進入籌備階段,預計將於近期上線網頁端及 APP 產品。
“視頻生成技術離流量和商業化很近,國內市場的用戶基數與應用場景有更多發展和實踐的可能。” 在使用者付費意願高的國外市場,王長虎付費訂閱的商業化得到了驗證。
但在國內,免費與開源的視頻生成工具已在市場中佔據了一定的市場份額。老東家位元組跳動旗下剪映已集成 AI 視頻生成功能;騰訊智影、百度 AI 創作平臺通過雲服務生態持續蠶食企業級市場;而開源社區中,阿裡 ModelScope、清華 VideoGPT 等國產模型不斷反覆運算,正在消解技術壁壘。
更嚴峻的是,國內使用者對 AI 工具付費意願僅為北美市場的三分之一,超 60% 的創作者首選免費基礎功能——這與 PixVerse 在海外賴以生存的訂閱制商業模式形成衝突。
當技術護城河遭遇生態碾壓,轉戰國內的王長虎需要證明的是:在算力與流量的雙重絞殺下,小而美的故事如何繼續講下去。