近日,谷歌在AI技術領域邁出了重要一步,為Gemini Advanced訂閱用戶帶來了其最新的視頻生成AI模型——Veo 2。從本周二起,Gemini Advanced用戶將能夠在Gemini應用程序的模型選項中找到Veo 2,這一創新技術源自DeepMind,為用戶提供了前所未有的視頻創作體驗。
Veo 2允許用戶通過簡單的文本或圖像提示,生成8秒鐘的視頻片段,分辨率為720p,寬高比為16:9。這一功能不僅為用戶提供了便捷的視頻創作工具,還拓寬了視頻內容的創作邊界。用戶可以通過Gemini的分享功能,輕松將這些視頻上傳至TikTok、YouTube等社交平臺,或下載帶有谷歌SynthID水印的MP4文件。然而,谷歌也明確表示,目前該功能對每月可創建的視頻數量有所限制,并且暫不支持谷歌Workspace的商業和教育計劃。
不僅如此,谷歌還在其Google Labs的實驗性功能Whisk中整合了Veo 2。Whisk原本就允許用戶使用圖片作為提示詞來生成新圖片,而此次新增的Whisk Animate功能,更是將用戶生成的圖片轉化為由Veo 2生成的8秒視頻。Google Labs作為谷歌展示早期AI產品的平臺,目前僅對Google One AI Premium訂閱用戶開放,訂閱費用為每月20美元。
谷歌推出Veo 2的舉動,被外界視為對OpenAI Sora平臺的有力回應。Sora平臺以其強大的文本到視頻生成能力而備受矚目,在教育、娛樂等多個領域展現出廣泛應用前景。例如,Sora可以生成與課程內容緊密相關的視頻,為在線教育提供有力支持。相比之下,Veo 2在功能上雖然相對基礎,但谷歌DeepMind首席執行官德米斯·哈薩比斯表示,公司計劃將Gemini AI模型與Veo相結合,以提升Gemini對物理世界的理解能力,這將為Veo 2的未來發展帶來無限可能。
然而,隨著Veo 2、Sora等視頻生成工具的出現,藝術家和創作者們也開始表達他們的擔憂。這類工具的出現可能會對整個創意產業造成顛覆性影響。據好萊塢動畫師和漫畫家工會委托進行的一項研究顯示,到2026年,AI技術將擾亂美國超過10萬個電影、電視和動畫領域的就業崗位。這一預測引發了廣泛關注和討論,關于AI技術與人類創意產業的未來關系,也成為了業界和學術界關注的熱點話題。