<ul id="mwmk6"><sup id="mwmk6"></sup></ul>
<ul id="mwmk6"></ul>
    <abbr id="mwmk6"></abbr>
  • <ul id="mwmk6"></ul>
  • <ul id="mwmk6"><sup id="mwmk6"></sup></ul>
    資訊在沃

    北大清華等聯(lián)手發(fā)布LLaVA-o1,開啟自發(fā)性視覺AI新紀元

       發(fā)布時間:2024-11-19 12:10 作者:唐云澤

    近日,一項突破性的研究成果在人工智能領域引起了廣泛關注。由北京大學、清華大學、鵬城實驗室、阿里巴巴達摩院以及美國理海大學聯(lián)手打造的LLaVA-o1模型,正式面世。這款模型被譽為首個能夠自發(fā)進行系統(tǒng)性推理的視覺語言模型,其功能與GPT-o1模型相類似,但在視覺處理方面實現(xiàn)了新的飛躍。

    LLaVA-o1是一款新型視覺語言模型(VLM),其核心設計理念是實現(xiàn)自主多階段推理。該模型擁有驚人的110億個參數(shù),是基于Llama-3.2-Vision-Instruct模型進一步開發(fā)而來。為了提升其推理能力,研究者們精心設計了四個推理階段:總結(jié)(summary)、描述(caption)、推理(reasoning)和結(jié)論(conclusion)。

    在訓練過程中,LLaVA-o1使用了名為LLaVA-o1-100k的數(shù)據(jù)集進行微調(diào)。這一數(shù)據(jù)集結(jié)合了視覺問答(VQA)資源和GPT-4o生成的結(jié)構(gòu)化推理注釋,為模型的推理能力提供了強有力的支持。

    LLaVA-o1的創(chuàng)新之處在于其采用的階段級束搜索(stage-level beam search)技術。這一技術使得模型能夠在每個推理階段生成多個候選答案,并從中選擇出最優(yōu)解。這一特性使得LLaVA-o1在處理復雜任務時表現(xiàn)出色,突破了傳統(tǒng)視覺語言模型的局限性。

    在實際測試中,LLaVA-o1展現(xiàn)了其強大的多模態(tài)推理能力。與基礎模型相比,該模型在多模態(tài)推理基準測試中性能提升了8.9%,超越了眾多大型且閉源的競爭對手。特別是在復雜視覺問答任務中,LLaVA-o1的表現(xiàn)尤為突出。

    LLaVA-o1的推出還填補了文本和視覺問答模型之間的空白。在多個基準測試中,該模型均表現(xiàn)出色,特別是在數(shù)學和科學視覺問題的推理領域。這一成果充分展示了結(jié)構(gòu)化推理在視覺語言模型中的重要性。

    LLaVA-o1還涉及到一個新的概念——自發(fā)性人工智能(Spontaneous AI)。這一概念旨在模擬動物的自發(fā)行為,通過機器學習和復雜的時間模式來設計具有自發(fā)行為的智能系統(tǒng)。LLaVA-o1在這一領域邁出了重要的一步,為實現(xiàn)更加智能、自主的人工智能系統(tǒng)奠定了堅實的基礎。

     
     
    更多>同類內(nèi)容
    全站最新
    熱門內(nèi)容
    本欄最新
     
    精品久久久久久无码不卡| 国产AV国片精品有毛| 日韩无码系列综合区| 国内精品在线播放| 3D动漫精品啪啪一区二区下载| 日韩精品无码免费一区二区三区| 亚洲日韩精品一区二区三区| 国产成人高清精品免费观看| 久久久久久久久无码精品亚洲日韩 | 日韩免费高清视频网站| 国产伦精品一区二区三区无广告 | 婷婷99视频精品全部在线观看 | 欧洲精品码一区二区三区免费看| 日韩在线视频播放免费视频完整版| 国产精品成人va在线观看入口| 日韩久久精品一区二区三区| 欧洲国产成人精品91铁牛tv| 精品国产自在现线看| 国产精品亚洲AV三区| 十八禁无遮挡99精品国产| 亚洲色精品VR一区区三区| 国产精品自在在线午夜蜜芽tv在线| 久久只有这精品99| 一本色道久久综合亚洲精品蜜桃冫 | 国产成人无码综合亚洲日韩| 国产模特众筹精品视频| 国产精品久久久久久久网站 | 国精无码欧精品亚洲一区| 亚洲欧洲美洲无码精品VA| 国产成人精品日本亚洲专区61| 国产在vr视频精品观看| 精品久久久久久久| 久久精品人人爽人人爽| 亚洲国产精品国自产拍电影| 99久久精品国产免费| 91麻豆精品国产片在线观看| 91精品国产91久久久久久青草| 久久AV无码精品人妻糸列| 97久久超碰成人精品网站| 亚洲a∨无码精品色午夜| 揄拍成人国产精品视频|