IT之家 4 月 10 日消息,谷歌今天(4 月 10 日)推出 Vertex AI Media Studio 平臺,該套件支援文本指令生成完整視頻內容。
該平臺整合 Imagen 3 圖像生成、Veo 2 視頻製作、Chirp 語音合成及 Lyria 背景音樂四大核心模型,使用者無需編碼或剪輯經驗,即可在統一介面完成全流程創作。
谷歌近日宣佈推出 Vertex AI Media Studio,這是一組基於 Google Cloud Vertex AI 的生成式工具,旨在讓使用者僅通過文本提示就能製作出精良視頻。
作為谷歌 AI 產品線的重要擴展,該套件全部自動化圖像生成、動態渲染、語音旁白和音樂配樂等環節,徹底改變了傳統視頻製作流程。IT之家附上演示視頻如下:
技術架構方面,系統採用模組化設計:Imagen 3 負責生成靜態畫面,Veo 2 實現圖像動態化轉換,用戶可自由調整鏡頭運動方式與視頻時長,其中 Veo 2 內置的智慧修正工具能自動消除不理想的生成元素。
完成視覺部分后,Chirp 模型為視頻添加擬真語音解說,而 DeepMind 與 YouTube 聯合研發的 Lyria 模型則提供定製化背景音樂。
Vertex AI Media Studio 依託 Vertex AI 平臺,支援谷歌 Gemini 模型,能處理文字、圖像、代碼等多種數據類型。無論是開發者還是普通使用者,都可在 Vertex AI Studio 中測試提示詞並優化 AI 模型。儘管這些工具簡化了內容創作,但也引發了關於真實性、人類創意及 AI 使用責任的討論。