<ul id="mwmk6"><sup id="mwmk6"></sup></ul>
<ul id="mwmk6"></ul>
    <abbr id="mwmk6"></abbr>
  • <ul id="mwmk6"></ul>
  • <ul id="mwmk6"><sup id="mwmk6"></sup></ul>
    資訊在沃

    字節Seed團隊開源BAGEL:多模態理解與生成,圖像視頻文本一鍵搞定!

       發布時間:2025-06-03 19:22 作者:柳晴雪

    字節跳動旗下的Seed團隊近期公布了一項重大技術進展,他們宣布開源了一個名為BAGEL的統一多模態理解與生成模型。這一模型能夠同時處理文本、圖像和視頻數據,實現跨模態的信息交互與生成。

    據悉,BAGEL模型擁有70億個激活參數(總參數量達到140億),并在海量交錯多模態數據上進行了深度訓練。在多項標準測試中,BAGEL的表現超越了當前頂尖的開源多模態模型,如Qwen2.5-VL和InternVL-2.5,甚至在文本到圖像的生成質量上,也能與專業級生成器SD3相媲美。

    除了在多模態理解方面取得突破,BAGEL在圖像編輯領域同樣展現出了非凡的能力。它不僅在經典編輯場景中優于其他開源模型,還進一步擴展到自由形式的視覺操作、多視圖合成以及世界導航等高級任務。這些能力標志著BAGEL在“世界建模”這一前沿領域邁出了重要一步。

    BAGEL基于先進的大語言模型進行訓練,因此具備基礎的推理和對話能力。它能夠接收混合了圖像和文本的輸入,并以同樣混合的格式輸出結果。這種靈活性使得BAGEL在處理復雜多模態信息時更加得心應手。

    在生成高質量、逼真的圖像和視頻方面,BAGEL同樣表現出色。它還引入了長思維鏈(COT)模式,使得模型在生成內容之前能夠進行更為深入的“思考”。這種能力不僅提升了生成內容的質量,還增加了生成過程的可控性和可預測性。

    由于在大規模交錯多模態數據上的預訓練,BAGEL自然而然地學會了保留視覺特征和細微細節。它能夠從視頻中捕捉到復雜的視覺運動,這一能力使得它在圖像編輯方面更加高效且準確。BAGEL還能基于少量對齊數據實現圖片風格的切換和場景轉換。

    更令人矚目的是,BAGEL還具備世界模型的基礎能力。它能夠進行世界導航、未來幀預測以及3D世界生成等挑戰性任務。通過不同角度的旋轉或視角切換,BAGEL能夠展現出強大的泛化能力。不僅在真實場景中表現出色,它還能在游戲、藝術作品以及卡通動畫等虛擬環境中實現導航。

    基于以上強大的能力,BAGEL通過一個統一的多模態接口,實現了各項能力的復雜組合和多輪對話。用戶可以通過簡單的指令,讓BAGEL完成從圖片剪切到智能編輯,再到場景轉換和風格轉換等一系列操作,極大地提升了工作效率和創作自由度。

     
     
    更多>同類內容
    全站最新
    熱門內容
    本欄最新
     
    久久免费视频精品| 久9久9精品视频在线观看| 国产精品自拍亚洲| 国产精品三级在线观看无码| 国产在线精品一区二区| 久久久久四虎国产精品| 国产精品尹人在线观看| 久久国产综合精品SWAG蓝导航| 亚洲线精品一区二区三区 | 中文字幕日韩专区| 亚洲精品视频免费在线观看| 一本之道av不卡精品| 久久蜜桃精品一区二区三区| 亚洲国产精品成人综合久久久| 久久精品亚洲福利| 国语自产精品视频在线第| 久久久国产精品网站| 精品久久人人爽天天玩人人妻| 杨幂精品国产福利在线| 久久99热精品免费观看动漫| 亚洲精品无码久久久久去q | 亚洲国产精品成人久久| 78成人精品电影在线播放日韩精品电影一区亚洲 | 欧美日本精品一区二区三区| 精品久久久久久无码专区| 九九久久精品国产| 亚洲国产精品13p| 7777精品伊人久久久大香线蕉| 精品国产成人亚洲午夜福利| 国产精品免费观看调教网| 中文字幕精品一区二区三区视频| 四虎成人精品在永久免费| 亚洲精品中文字幕乱码影院| 亚洲欧洲国产精品你懂的| 国产精品自产拍高潮在线观看| 一级做a爰黑人又硬又粗免费看51社区国产精品视 | 午夜精品视频在线| 久久久亚洲精品无码| 婷婷国产成人精品视频| 99久热re在线精品996热视频| 久久久久成人精品无码|