智譜技術團隊近日宣布,已推出并開放源代碼的最新版視頻模型——CogVideoX v1.5,迎來了重大升級。這款新型模型在視頻生成性能上有了顯著提升,能夠輕松產出高質量短片。
據(jù)悉,CogVideoX v1.5不僅能生成5至10秒長、768P分辨率、每秒16幀的流暢視頻,更在I2V模型上支持了多種尺寸比例。這一改進顯著提升了圖像轉視頻的質量,同時增強了模型對復雜語義的理解能力。
新版模型還將登陸“清影”平臺,并與新發(fā)布的CogSound音效模型攜手合作。這一組合將為用戶帶來更加豐富的視聽體驗,標志著AI視頻生成技術邁入了新的階段。
升級后的“清影”平臺展現(xiàn)了多項引人注目的新特性。在質量方面,無論是圖像轉視頻的美學表現(xiàn),還是運動合理性,乃至對復雜提示詞語義的理解,都得到了大幅度的增強。
平臺現(xiàn)在還支持生成長達10秒、4K分辨率、60幀的超高清視頻,為用戶帶來了前所未有的視覺盛宴。同時,為了滿足不同播放場景的需求,“清影”還提供了可變比例的視頻生成功能。
在創(chuàng)作效率方面,“清影”同樣表現(xiàn)出色。同一指令或圖片現(xiàn)在可以一次性生成4個視頻,極大地提升了創(chuàng)作者的工作效率。更為驚艷的是,新平臺還能為視頻匹配生動的音效,讓每一部作品都更加栩栩如生。